3 posts tagged with "Stability AI"

View All Tags

AIBrain日报-2024.02.22

February 22, 2024 · 3 min read

AIBrain

aibrain.wiki日报

🤯神秘人工智能链接🤯

（神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……）

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🔍Stability AI 发布 Stable Diffusion 3：采用新型扩散变换架构，提高性能。引入新型扩散变换技术，增强图像生成能力。集成流匹配技术，提升图像质量和多样性。

🔗 https://bit.ly/3OR2qQF

🔗 https://x.com/xiaohuggg/status/1760673218665537846...

2⃣️ 👓AEA 数据集发布：基于 Project Aria AR眼镜，记录日常活动。包含多模态传感器数据，支持AI和AR研究。提供3D轨迹、场景点云等机器感知数据。

🔗 http://projectaria.com/datasets/aea/

🔗 2402.13349.pdf

🔗 https://x.com/xiaohuggg/status/1760668941377265889...

3⃣️ 🎬剪影海外版 CapCut 新功能：文本生成视频，支持多种比例。体验尚可，清晰度有待提高。

🔗 https://x.com/xiaohuggg/status/1760630118656205305...

4⃣️ 📹Stable Video 官网上线：图片和文字提示生成高质量视频。日赠150积分，支持多种充值选项。

🔗 Stable Video | Generate Videos with AI

🔗 https://x.com/xiaohuggg/status/1760608404236881934...

5⃣️ 🤖UMI 数据收集与学习框架：斯坦福开发，支持跨平台部署。直接转移人类操作技能至机器人。

🔗 https://umi-gripper.github.io

🔗 https://x.com/xiaohuggg/status/1760583349150822804...

6⃣️ 🌪️SDXL-Lightning 项目：一步生成高分辨率图像。由字节跳动开发，提高生成速度。

🔗 https://x.com/xiaohuggg/status/1760191358298710370...

7⃣️ 🚫李一舟 AI 课程下架：小程序被封。

🔗 https://x.com/xiaohuggg/status/1760556527537307721...

8⃣️ 💥微软 LongRoPE 挑战 Gemini 1.5：扩展 LLM 上下文窗口至200万令牌。仅需最多1000步微调。

🔗 https://x.com/xiaohuggg/status/1760547784879722538...

9⃣️ 🌐动漫化 Chrome 插件测试：网页图片一键「动漫化」。即将发布。

🔗 https://x.com/xiaohuggg/status/1760543789272494269...

🔟 🤝Reddit 与谷歌达成协议：授权内容用于训练 AI 模型。交易金额约每年6000万美元。

🔗 https://x.com/xiaohuggg/status/1760536254247313458...

1⃣1⃣️ 📊HeyGen 商业化案例： WiseTech Global 使用制作多语言视频。 AI 生成，口型匹配准确。

🔗 https://x.com/xiaohuggg/status/1760531538188665320...

1⃣2⃣️ 🔍Gemini 1.5 Pro 分析示例：精确回答视频中的复杂问题。展现高度理解和分析能力。

🔗 https://x.com/xiaohuggg/status/1760518860967657567...

1⃣3⃣️ 🔐iMessage 后量子加密协议 PQ3：苹果宣布增加最强安全性。防御量子攻击，实现3级安全标准。

🔗 https://x.com/xiaohuggg/status/1760501771108245820...

1⃣4⃣️ 🖥️Ollama 支持 Gemma 模型：可下载安装运行。文件大小1.4G。

🔗 gemma

🔗 https://x.com/xiaohuggg/status/1760499217100136924...

1⃣5⃣️ 💹英伟达财报公布：第四季度营收和利润创纪录。强调加速计算和AI的引爆点。

🔗 https://x.com/xiaohuggg/status/1760495335972163865...

AIBrain日报-2024.02.07

February 7, 2024 · 3 min read

AIBrain

aibrain.wiki日报

🤯神秘人工智能链接🤯

（神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……）

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🚀 Gemini Ultra 上线，Bard更名为Gemini： Gemini Ultra带来界面优化、Gemini Advanced付费计划。提供复杂任务执行能力，如编程、逻辑推理。即将推出Gemini APP，与Google应用集成。

🔗 https://gemini.google.com/updates

🔗 https://x.com/xiaohuggg/status/1755600097239536034...

2⃣️ 🤖 OpenAI开发新型代理软件：代理软件通过控制设备自动完成任务。支持文档数据转移到电子表格、自动填写费用报告。

🔗 https://x.com/xiaohuggg/status/1755587992067125449...

3⃣️ 🎶 Stability AI发布AudioSparx 1.0音乐模型：高效生成长达95秒的立体声音乐。支持可变长度音频输出和立体声渲染。性能优于AudioLDM2和MusicGen。

🔗 https://arxiv.org/abs/2402.04825

🔗 GitHub - Stability-AI/stable-audio-tools: Generati...

🔗 GitHub - Stability-AI/stable-audio-metrics

🔗 stable-audio-demo

🔗 https://x.com/xiaohuggg/status/1755565282285015484...

4⃣️ 🔍 Vision Pro拆解揭示显示技术：双显示屏分辨率和像素密度超高。电池包复杂设计，提供高容量。显示体验高密度，展示Apple技术领先。

🔗 Vision Pro Teardown Part 2: What’s the Display Res...

🔗 https://x.com/xiaohuggg/status/1755558069143306328...

5⃣️ 📢 最新版ChatGPT 4 System Prompt：

🔗 https://x.com/xiaohuggg/status/1755493510395109631...

6⃣️ 🤖 Archax操作型机器人详解：总高度4.5米，重量3.5吨，26个关节自由度。机器人/车辆模式，最高速度10km/h。驾驶舱内部设有四面显示屏和九个摄像头。

🔗 https://x.com/xiaohuggg/status/1755445005739753592...

7⃣️ 🏥 CheXagent自动解读胸部X光图像：自动分析胸部X光，生成放射学报告。解读性能高效，超越通用和医疗领域模型。支持多样化任务处理，如图像理解、问题回答。

🔗 CheXagent

🔗 [2401.12208] CheXagent: Towards a Foundation Model...

🔗 GitHub - Stanford-AIMI/CheXagent: [Arxiv-2024] Che...

🔗 https://x.com/xiaohuggg/status/1755434771994525928...

8⃣️ 🔊 MetaVoice-1B文本到语音转换模型： 1.2亿参数，10万小时语音数据训练。支持情感语音节奏、跨语言语音克隆。零样本克隆支持，适合长篇内容语音合成。

🔗 https://huggingface.co/metavoiceio/metavoice-1B-v0...

🔗 GitHub - metavoiceio/metavoice-src: AI for human-l...

🔗 TTS by MetaVoice

🔗 https://x.com/xiaohuggg/status/1755423130464772568...

AIBrain日报-2024.02.06

February 6, 2024 · 3 min read

AIBrain

aibrain.wiki日报

🤯神秘人工智能链接🤯

（神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……）

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 📸 RMBG-1.4去除照片背景模型：高精度背景去除，适用于电商、广告等场景。支持视频背景批量去除，提供蒙版输出功能。云端处理速度快，性能卓越。

🔗 GitHub - ZHO-ZHO-ZHO/ComfyUI-BRIA_AI-RMBG: Unoffic...

🔗 https://x.com/xiaohuggg/status/1755075272410538450...

2⃣️ 👨⚕️ Medivis的SurgicalAR手术应用：将2D医疗图像转化为3D互动视觉，提高手术精度。支持3D模型的放大、缩小、旋转，精确手术计划。

🔗 https://t.co/3tUvxB0L4I

🔗 https://x.com/xiaohuggg/status/1755183564021473404...

3⃣️ 🎨 DALL·E 3图像编辑器功能预告：即将推出的功能，增强图像生成一致性。

🔗 https://x.com/xiaohuggg/status/1755173835396239826...

4⃣️ 📱 MiniCPM端侧大模型：面壁智能与清华大学共同开发，支持手机端运行。优于现有模型，提供流式输出速度。

🔗 https://x.com/xiaohuggg/status/1755140675270795646...

5⃣️ 🔥 Anything in Any Scene技术：无缝插入任何物体至视频，保持自然融合。特点包括物体准确放置、真实光照阴影模拟、风格一致性。

🔗 Anything in Any Scene

🔗 https://x.com/xiaohuggg/status/1755084128721277336...

6⃣️ 🗣️ Stability AI的新型文本到语音模型：不需人声样本，通过文字描述生成声音。特点包括高保真语音生成、自然语言控制、创造新声音。

🔗 text description to speech

🔗 https://arxiv.org/abs/2402.01912

🔗 https://x.com/xiaohuggg/status/1755062275000733905...

7⃣️ 👁️ OpenAI的DALL-E 3添加C2PA水印：为AI生成图像添加水印，增加内容来源识别。 C2PA技术标准应用，提升媒体内容可信度。

🔗 https://c2pa.org

🔗 https://x.com/xiaohuggg/status/1755054688591073325...