Skip to main content

4 posts tagged with "Sora"

View All Tags

· 2 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🔍 Google 推出Gemma模型: 轻量级、开源,适用于多种设备。 Gemma家族包括2B和7B两种尺寸,性能卓越。 技术上与Gemini共享,安全且负责任。

🔗 详细:https://dpmd.ai/3UJu1Y1

🔗 访问:http://ai.google.dev/gemma

🔗 https://x.com/xiaohuggg/status/1760312395078205746...

2⃣️ 👨🏫 蒋路加入字节TikTok: Google VideoPoet项目Research Lead,CMU兼职教授。 VideoPoet是Google的竞争项目。

🔗 https://scholar.google.com/citations?user=jIKjjSYA...

🔗 https://x.com/xiaohuggg/status/1760204483785814355...

3⃣️ 🧠 Neuralink人体试验更新: 首位脑机接口人体试验患者进展良好。 无神经不良影响,能通过思考控制鼠标。

🔗 https://x.com/xiaohuggg/status/1760198564658180525...

4⃣️ 🖼️ SDXL-Lightning项目: 字节跳动开发,优化扩散模型。 一步/少步生成1024px分辨率图像。 结合渐进式蒸馏和对抗式蒸馏。

🔗 模型:https://huggingface.co/ByteDance/SDXL-Lightning

🔗 https://x.com/xiaohuggg/status/1760191358298710370...

5⃣️ 🎯 YOLOv8目标检测跟踪模型: 快速准确的多对象识别和定位。 支持实例分割、人体姿态估计等。 多平台兼容,一站式视觉识别解决方案。

🔗 详细介绍:https://docs.ultralytics.com/models/

🔗 GitHub:GitHub - ultralytics/ultralytics: NEW - YOLOv8 🚀 i...

🔗 https://x.com/xiaohuggg/status/1760149057249636570...

6⃣️ 🎥 Sora工作原理解析: 结合扩散模型和Transformer架构。 采用空间时间补丁和时空立方体。 利用知识图谱组合视频,显示巨大潜力。

🔗 https://x.com/xiaohuggg/status/1760139842783248609...

7⃣️ 🚀 OpenAI技术人员的一天...

🔗 https://x.com/xiaohuggg/status/1760130189932265553...

· 2 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🔍MetaSo体验: 针对中国用户的AI 搜索产品。 提供问题答案、大纲、思维导图、时间线和信息来源。 目前仅支持中文,准确性良好。

🔗 秘塔AI搜索

🔗 https://x.com/xiaohuggg/status/1759223733871640753...

2⃣️ 🎮Sora制作的超高分辨率的Minecraft视频 创造8K分辨率的Minecraft视频,细腻逼真。 实现视频融合技术,如Minecraft与摩托车视频合成。

🔗 https://x.com/xiaohuggg/status/1759171722862002209...

3⃣️ 💾Google开源Magika: AI驱动的文件类型识别系统,识别100+文件类型。 用于增强Gmail、Drive等的安全性。

🔗 magika - npm

🔗 https://x.com/xiaohuggg/status/1759165024642474133...

4⃣️ 🖥️UFO:微软的Windows UI代理: 通过自然语言和视觉内容执行复杂任务。 结合GPT 4-V,理解和操作Windows GUI。

🔗 GitHub - microsoft/UFO: A UI-Focused Agent for Win...

🔗 [2402.07939] UFO: A UI-Focused Agent for Windows O...

🔗 https://x.com/xiaohuggg/status/1759088453135061072...

5⃣️ 🧬DoRA—模型微调创新: 在LoRA基础上发展,通过权重的“幅度”和“方向”分解微调。 提供精细控制学习过程,优化微调策略。

🔗 [2402.09353] DoRA: Weight-Decomposed Low-Rank Adap...

🔗 GitHub - catid/dora: Implementation of DoRA

🔗 https://x.com/xiaohuggg/status/1759063587363115083...

6⃣️ 📹Sora技术展示—多视角视频生成: 一个单独的视频里就包含了五个不同的视角 不需要人工编辑的情况下,自主决定展示多个视角

🔗 https://x.com/xiaohuggg/status/1759025340738159019...

· 2 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🔬Sora的核心技术和发展:

  • 2022年12月提出
  • 作者一个在Meta AI,一个在OpenAI
  • 核心技术源自Diffusion Transformers(DiT)。
  • 结合了VAE、ViT、DDPM技术,优化视频生成。
  • 强调了模型的简单性、可扩展性和视频压缩能力。

🔗 https://wpeebles.com/DiT

🔗 https://arxiv.org/abs/2212.09748

🔗 https://github.com/facebookresearch/DiT

🔗 https://x.com/xiaohuggg/status/1758849579855040920?s=20

2⃣️ ✍️GhostWriter:个性化的AI写作工具:

  • 由哈佛大学和微软研究院共同开发,基于ChatGPT。
  • 学习和应用用户的写作风格,提供个性化文本生成。
  • 经研究证实,提升了用户的满意度和参与度。

🔗 https://arxiv.org/abs/2402.08855

🔗 https://x.com/xiaohuggg/status/1758704157014569178?s=20

3⃣️ 📖ReadAgent:Google开发的阅读代理:

  • 模仿人类阅读方式,处理长文本。
  • 采用忘记具体信息但保留要点的策略,提高理解效率。

🔗 https://read-agent.github.io

🔗 https://x.com/xiaohuggg/status/1758700080394285453?s=20

· 3 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🖼️ Sora图像生成能力: Sora能生成图像,虽不及Midjourney,但优于Dalle 3。

🔗 https://x.com/xiaohuggg/status/1758491331272622202...

2⃣️ 💻 Reor:AI开源桌面笔记应用: 作为个人知识管理工具,构建“第二大脑”。 自动组织连接想法,支持检索式问答。 链接笔记与思想,提高问答和编辑效率。

下载地址:Reor

GitHub链接:GitHub - reorproject/reor: AI note-taking app that...

🔗 https://x.com/xiaohuggg/status/1758468281319792659...

3⃣️ 🚀 Google Gemini Pro 1.5 更新: 高度复杂的跨模态理解与推理。 分析无声电影,识别特定场景。 超越GPT 4的能力。

🔗 https://x.com/xiaohuggg/status/1758394427238912138...

Sherlock Jr. (1924) 视频:https://youtube.com/watch?v=rOVtjJkqtiA

4⃣️ 🎥 OpenAI发布文本转视频模型Sora: 生成长达60秒的高清视频。 视频展示详细场景、复杂动作和丰富情感。 旨在理解模拟动态物理世界。

🔗 https://x.com/xiaohuggg/status/1758286500964577514...

5⃣️ 🎮 Sora在视频游戏模拟中的能力: 零次学习控制“Minecraft”中的角色。 展示高级视频内容理解与生成。 模拟复杂交互和动态环境的潜力。

🔗 https://x.com/xiaohuggg/status/1758332220706828544...

6⃣️ 📺 OpenAI视频模型Sora技术报告: 视频生成模型作为世界模拟器。 支持不同宽高比的视频生成。 展示3D一致性、长期一致性等能力。

完整报告:Video generation models as world simulators

🔗 https://x.com/xiaohuggg/status/1758316094828511718...

7⃣️ 🔍 Meta推出V-JEPA: 自学习模拟物理世界。 不需人类监督或视频数据集标记。 预测视频内容,提高训练效率。

详细信息:https://ai.meta.com/blog/v-jepa-yann-lecun-ai-mode...

GitHub链接:GitHub - facebookresearch/jepa: PyTorch code and m...

🔗 https://x.com/xiaohuggg/status/1758310386728927724...