Skip to main content

3 posts tagged with "Stability AI"

View All Tags

· 3 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🔍Stability AI 发布 Stable Diffusion 3: 采用新型扩散变换架构,提高性能。 引入新型扩散变换技术,增强图像生成能力。 集成流匹配技术,提升图像质量和多样性。

🔗 https://bit.ly/3OR2qQF

🔗 https://x.com/xiaohuggg/status/1760673218665537846...

2⃣️ 👓AEA 数据集发布: 基于 Project Aria AR眼镜,记录日常活动。 包含多模态传感器数据,支持AI和AR研究。 提供3D轨迹、场景点云等机器感知数据。

🔗 http://projectaria.com/datasets/aea/

🔗 2402.13349.pdf

🔗 https://x.com/xiaohuggg/status/1760668941377265889...

3⃣️ 🎬剪影海外版 CapCut 新功能: 文本生成视频,支持多种比例。 体验尚可,清晰度有待提高。

🔗 https://x.com/xiaohuggg/status/1760630118656205305...

4⃣️ 📹Stable Video 官网上线: 图片和文字提示生成高质量视频。 日赠150积分,支持多种充值选项。

🔗 Stable Video | Generate Videos with AI

🔗 https://x.com/xiaohuggg/status/1760608404236881934...

5⃣️ 🤖UMI 数据收集与学习框架: 斯坦福开发,支持跨平台部署。 直接转移人类操作技能至机器人。

🔗 https://umi-gripper.github.io

🔗 https://x.com/xiaohuggg/status/1760583349150822804...

6⃣️ 🌪️SDXL-Lightning 项目: 一步生成高分辨率图像。 由字节跳动开发,提高生成速度。

🔗 https://x.com/xiaohuggg/status/1760191358298710370...

7⃣️ 🚫李一舟 AI 课程下架: 小程序被封。

🔗 https://x.com/xiaohuggg/status/1760556527537307721...

8⃣️ 💥微软 LongRoPE 挑战 Gemini 1.5: 扩展 LLM 上下文窗口至200万令牌。 仅需最多1000步微调。

🔗 https://x.com/xiaohuggg/status/1760547784879722538...

9⃣️ 🌐动漫化 Chrome 插件测试: 网页图片一键「动漫化」。 即将发布。

🔗 https://x.com/xiaohuggg/status/1760543789272494269...

🔟 🤝Reddit 与谷歌达成协议: 授权内容用于训练 AI 模型。 交易金额约每年6000万美元。

🔗 https://x.com/xiaohuggg/status/1760536254247313458...

1⃣1⃣️ 📊HeyGen 商业化案例: WiseTech Global 使用制作多语言视频。 AI 生成,口型匹配准确。

🔗 https://x.com/xiaohuggg/status/1760531538188665320...

1⃣2⃣️ 🔍Gemini 1.5 Pro 分析示例: 精确回答视频中的复杂问题。 展现高度理解和分析能力。

🔗 https://x.com/xiaohuggg/status/1760518860967657567...

1⃣3⃣️ 🔐iMessage 后量子加密协议 PQ3: 苹果宣布增加最强安全性。 防御量子攻击,实现3级安全标准。

🔗 https://x.com/xiaohuggg/status/1760501771108245820...

1⃣4⃣️ 🖥️Ollama 支持 Gemma 模型: 可下载安装运行。 文件大小1.4G。

🔗 gemma

🔗 https://x.com/xiaohuggg/status/1760499217100136924...

1⃣5⃣️ 💹英伟达财报公布: 第四季度营收和利润创纪录。 强调加速计算和AI的引爆点。

🔗 https://x.com/xiaohuggg/status/1760495335972163865...

· 3 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🚀 Gemini Ultra 上线,Bard更名为Gemini: Gemini Ultra带来界面优化、Gemini Advanced付费计划。 提供复杂任务执行能力,如编程、逻辑推理。 即将推出Gemini APP,与Google应用集成。

🔗 https://gemini.google.com/updates

🔗 https://x.com/xiaohuggg/status/1755600097239536034...

2⃣️ 🤖 OpenAI开发新型代理软件: 代理软件通过控制设备自动完成任务。 支持文档数据转移到电子表格、自动填写费用报告。

🔗 https://x.com/xiaohuggg/status/1755587992067125449...

3⃣️ 🎶 Stability AI发布AudioSparx 1.0音乐模型: 高效生成长达95秒的立体声音乐。 支持可变长度音频输出和立体声渲染。 性能优于AudioLDM2和MusicGen。

🔗 https://arxiv.org/abs/2402.04825

🔗 GitHub - Stability-AI/stable-audio-tools: Generati...

🔗 GitHub - Stability-AI/stable-audio-metrics

🔗 stable-audio-demo

🔗 https://x.com/xiaohuggg/status/1755565282285015484...

4⃣️ 🔍 Vision Pro拆解揭示显示技术: 双显示屏分辨率和像素密度超高。 电池包复杂设计,提供高容量。 显示体验高密度,展示Apple技术领先。

🔗 Vision Pro Teardown Part 2: What’s the Display Res...

🔗 https://x.com/xiaohuggg/status/1755558069143306328...

5⃣️ 📢 最新版ChatGPT 4 System Prompt:

🔗 https://x.com/xiaohuggg/status/1755493510395109631...

6⃣️ 🤖 Archax操作型机器人详解: 总高度4.5米,重量3.5吨,26个关节自由度。 机器人/车辆模式,最高速度10km/h。 驾驶舱内部设有四面显示屏和九个摄像头。

🔗 https://x.com/xiaohuggg/status/1755445005739753592...

7⃣️ 🏥 CheXagent自动解读胸部X光图像: 自动分析胸部X光,生成放射学报告。 解读性能高效,超越通用和医疗领域模型。 支持多样化任务处理,如图像理解、问题回答。

🔗 CheXagent

🔗 [2401.12208] CheXagent: Towards a Foundation Model...

🔗 GitHub - Stanford-AIMI/CheXagent: [Arxiv-2024] Che...

🔗 https://x.com/xiaohuggg/status/1755434771994525928...

8⃣️ 🔊 MetaVoice-1B文本到语音转换模型: 1.2亿参数,10万小时语音数据训练。 支持情感语音节奏、跨语言语音克隆。 零样本克隆支持,适合长篇内容语音合成。

🔗 https://huggingface.co/metavoiceio/metavoice-1B-v0...

🔗 GitHub - metavoiceio/metavoice-src: AI for human-l...

🔗 TTS by MetaVoice

🔗 https://x.com/xiaohuggg/status/1755423130464772568...

· 3 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 📸 RMBG-1.4去除照片背景模型: 高精度背景去除,适用于电商、广告等场景。 支持视频背景批量去除,提供蒙版输出功能。 云端处理速度快,性能卓越。

🔗 GitHub - ZHO-ZHO-ZHO/ComfyUI-BRIA_AI-RMBG: Unoffic...

🔗 https://x.com/xiaohuggg/status/1755075272410538450...

2⃣️ 👨⚕️ Medivis的SurgicalAR手术应用: 将2D医疗图像转化为3D互动视觉,提高手术精度。 支持3D模型的放大、缩小、旋转,精确手术计划。

🔗 https://t.co/3tUvxB0L4I

🔗 https://x.com/xiaohuggg/status/1755183564021473404...

3⃣️ 🎨 DALL·E 3图像编辑器功能预告: 即将推出的功能,增强图像生成一致性。

🔗 https://x.com/xiaohuggg/status/1755173835396239826...

4⃣️ 📱 MiniCPM端侧大模型: 面壁智能与清华大学共同开发,支持手机端运行。 优于现有模型,提供流式输出速度。

🔗 https://x.com/xiaohuggg/status/1755140675270795646...

5⃣️ 🔥 Anything in Any Scene技术: 无缝插入任何物体至视频,保持自然融合。 特点包括物体准确放置、真实光照阴影模拟、风格一致性。

🔗 Anything in Any Scene

🔗 https://x.com/xiaohuggg/status/1755084128721277336...

6⃣️ 🗣️ Stability AI的新型文本到语音模型: 不需人声样本,通过文字描述生成声音。 特点包括高保真语音生成、自然语言控制、创造新声音。

🔗 text description to speech

🔗 https://arxiv.org/abs/2402.01912

🔗 https://x.com/xiaohuggg/status/1755062275000733905...

7⃣️ 👁️ OpenAI的DALL-E 3添加C2PA水印: 为AI生成图像添加水印,增加内容来源识别。 C2PA技术标准应用,提升媒体内容可信度。

🔗 https://c2pa.org

🔗 https://x.com/xiaohuggg/status/1755054688591073325...