4 posts tagged with "Sora"

View All Tags

AIBrain日报-2024.02.21

February 21, 2024 · 2 min read

AIBrain

aibrain.wiki日报

🤯神秘人工智能链接🤯

（神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……）

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🔍 Google 推出Gemma模型：轻量级、开源，适用于多种设备。 Gemma家族包括2B和7B两种尺寸，性能卓越。技术上与Gemini共享，安全且负责任。

🔗 详细：https://dpmd.ai/3UJu1Y1

🔗 访问：http://ai.google.dev/gemma

🔗 https://x.com/xiaohuggg/status/1760312395078205746...

2⃣️ 👨🏫 蒋路加入字节TikTok： Google VideoPoet项目Research Lead，CMU兼职教授。 VideoPoet是Google的竞争项目。

🔗 https://scholar.google.com/citations?user=jIKjjSYA...

🔗 https://x.com/xiaohuggg/status/1760204483785814355...

3⃣️ 🧠 Neuralink人体试验更新：首位脑机接口人体试验患者进展良好。无神经不良影响，能通过思考控制鼠标。

🔗 https://x.com/xiaohuggg/status/1760198564658180525...

4⃣️ 🖼️ SDXL-Lightning项目：字节跳动开发，优化扩散模型。一步/少步生成1024px分辨率图像。结合渐进式蒸馏和对抗式蒸馏。

🔗 模型：https://huggingface.co/ByteDance/SDXL-Lightning

🔗 https://x.com/xiaohuggg/status/1760191358298710370...

5⃣️ 🎯 YOLOv8目标检测跟踪模型：快速准确的多对象识别和定位。支持实例分割、人体姿态估计等。多平台兼容，一站式视觉识别解决方案。

🔗 详细介绍：https://docs.ultralytics.com/models/

🔗 GitHub：GitHub - ultralytics/ultralytics: NEW - YOLOv8 🚀 i...

🔗 https://x.com/xiaohuggg/status/1760149057249636570...

6⃣️ 🎥 Sora工作原理解析：结合扩散模型和Transformer架构。采用空间时间补丁和时空立方体。利用知识图谱组合视频，显示巨大潜力。

🔗 https://x.com/xiaohuggg/status/1760139842783248609...

7⃣️ 🚀 OpenAI技术人员的一天...

🔗 https://x.com/xiaohuggg/status/1760130189932265553...

AIBrain日报-2024.02.18

February 18, 2024 · 2 min read

AIBrain

aibrain.wiki日报

🤯神秘人工智能链接🤯

（神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……）

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🔍MetaSo体验：针对中国用户的AI 搜索产品。提供问题答案、大纲、思维导图、时间线和信息来源。目前仅支持中文，准确性良好。

🔗 秘塔AI搜索

🔗 https://x.com/xiaohuggg/status/1759223733871640753...

2⃣️ 🎮Sora制作的超高分辨率的Minecraft视频创造8K分辨率的Minecraft视频，细腻逼真。实现视频融合技术，如Minecraft与摩托车视频合成。

🔗 https://x.com/xiaohuggg/status/1759171722862002209...

3⃣️ 💾Google开源Magika： AI驱动的文件类型识别系统，识别100+文件类型。用于增强Gmail、Drive等的安全性。

🔗 magika - npm

🔗 https://x.com/xiaohuggg/status/1759165024642474133...

4⃣️ 🖥️UFO：微软的Windows UI代理：通过自然语言和视觉内容执行复杂任务。结合GPT 4-V，理解和操作Windows GUI。

🔗 GitHub - microsoft/UFO: A UI-Focused Agent for Win...

🔗 [2402.07939] UFO: A UI-Focused Agent for Windows O...

🔗 https://x.com/xiaohuggg/status/1759088453135061072...

5⃣️ 🧬DoRA—模型微调创新：在LoRA基础上发展，通过权重的“幅度”和“方向”分解微调。提供精细控制学习过程，优化微调策略。

🔗 [2402.09353] DoRA: Weight-Decomposed Low-Rank Adap...

🔗 GitHub - catid/dora: Implementation of DoRA

🔗 https://x.com/xiaohuggg/status/1759063587363115083...

6⃣️ 📹Sora技术展示—多视角视频生成：一个单独的视频里就包含了五个不同的视角不需要人工编辑的情况下，自主决定展示多个视角

🔗 https://x.com/xiaohuggg/status/1759025340738159019...

AIBrain日报-2024.02.17

February 17, 2024 · 2 min read

AIBrain

aibrain.wiki日报

🤯神秘人工智能链接🤯

（神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……）

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🔬Sora的核心技术和发展：

2022年12月提出
作者一个在Meta AI，一个在OpenAI
核心技术源自Diffusion Transformers（DiT）。
结合了VAE、ViT、DDPM技术，优化视频生成。
强调了模型的简单性、可扩展性和视频压缩能力。

🔗 https://wpeebles.com/DiT

🔗 https://arxiv.org/abs/2212.09748

🔗 https://github.com/facebookresearch/DiT

🔗 https://x.com/xiaohuggg/status/1758849579855040920?s=20

2⃣️ ✍️GhostWriter：个性化的AI写作工具：

由哈佛大学和微软研究院共同开发，基于ChatGPT。
学习和应用用户的写作风格，提供个性化文本生成。
经研究证实，提升了用户的满意度和参与度。

🔗 https://arxiv.org/abs/2402.08855

🔗 https://x.com/xiaohuggg/status/1758704157014569178?s=20

3⃣️ 📖ReadAgent：Google开发的阅读代理：

模仿人类阅读方式，处理长文本。
采用忘记具体信息但保留要点的策略，提高理解效率。

🔗 https://read-agent.github.io

🔗 https://x.com/xiaohuggg/status/1758700080394285453?s=20

AIBrain日报-2024.02.16

February 16, 2024 · 3 min read

AIBrain

aibrain.wiki日报

🤯神秘人工智能链接🤯

（神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……）

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🖼️ Sora图像生成能力： Sora能生成图像，虽不及Midjourney，但优于Dalle 3。

🔗 https://x.com/xiaohuggg/status/1758491331272622202...

2⃣️ 💻 Reor：AI开源桌面笔记应用：作为个人知识管理工具，构建“第二大脑”。自动组织连接想法，支持检索式问答。链接笔记与思想，提高问答和编辑效率。

下载地址：Reor

GitHub链接：GitHub - reorproject/reor: AI note-taking app that...

🔗 https://x.com/xiaohuggg/status/1758468281319792659...

3⃣️ 🚀 Google Gemini Pro 1.5 更新：高度复杂的跨模态理解与推理。分析无声电影，识别特定场景。超越GPT 4的能力。

🔗 https://x.com/xiaohuggg/status/1758394427238912138...

Sherlock Jr. (1924) 视频：https://youtube.com/watch?v=rOVtjJkqtiA

4⃣️ 🎥 OpenAI发布文本转视频模型Sora：生成长达60秒的高清视频。视频展示详细场景、复杂动作和丰富情感。旨在理解模拟动态物理世界。

🔗 https://x.com/xiaohuggg/status/1758286500964577514...

5⃣️ 🎮 Sora在视频游戏模拟中的能力：零次学习控制“Minecraft”中的角色。展示高级视频内容理解与生成。模拟复杂交互和动态环境的潜力。

🔗 https://x.com/xiaohuggg/status/1758332220706828544...

6⃣️ 📺 OpenAI视频模型Sora技术报告：视频生成模型作为世界模拟器。支持不同宽高比的视频生成。展示3D一致性、长期一致性等能力。

完整报告：Video generation models as world simulators

🔗 https://x.com/xiaohuggg/status/1758316094828511718...

7⃣️ 🔍 Meta推出V-JEPA：自学习模拟物理世界。不需人类监督或视频数据集标记。预测视频内容，提高训练效率。

详细信息：https://ai.meta.com/blog/v-jepa-yann-lecun-ai-mode...

GitHub链接：GitHub - facebookresearch/jepa: PyTorch code and m...

🔗 https://x.com/xiaohuggg/status/1758310386728927724...