Skip to main content

5 posts tagged with "ElevenLabs"

View All Tags

· 3 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🤖OS-Copilot:智能代理框架 与操作系统交互完成广泛复杂任务。 自我学习和改进,处理文件管理、数据处理等。 FRIDAY代理:从图片、视频或文本中学习执行计算机任务。

🔗 SOCIAL MEDIA TITLE TAG

🔗 [2402.07456] OS-Copilot: Towards Generalist Comput...

🔗 https://x.com/xiaohuggg/status/1757769869637132381...

2⃣️ 🎬Boximator:视频控制技术 通过双重盒子约束控制视频中对象位置、形状或运动路径。 硬盒子用于精确定位,软盒子控制自由移动。

🔗 Boximator: Generating Rich and Controllable Motion...

🔗 [2402.01566] Boximator: Generating Rich and Contro...

🔗 https://x.com/xiaohuggg/status/1757620469069656265...

3⃣️ 📉奥特曼CEO的态度转变 自从上次CEO风波后,开始故意降低对公司未来的预期。 不再过度夸大。

🔗 https://x.com/xiaohuggg/status/1757596275451781452...

4⃣️ 🗣️Elevenlabs Speech to Speech 提供29种语言版本的语音到语音变换。 高保真重现每一个声音细节,创建自定义AI声音。

🔗 Voice Changer: Use AI To Change Your Voice For Fre...

🔗 https://x.com/xiaohuggg/status/1757593879468294424...

5⃣️ 💬ChatGPT永久记忆功能上线 跨聊天记忆用户信息,提供更相关个性化回答。 用户控制记忆内容,隐私和安全考虑。 GPTs也将拥有记忆功能。

🔗 Memory and new controls for ChatGPT

🔗 https://x.com/xiaohuggg/status/1757582626372935696...

6⃣️ 💻NVIDIA Chat With RTX:本地模型 连接个人内容,获得上下文相关答案。 利用RAG、TensorRT-LLM和RTX加速技术。 专为搭载NVIDIA RTX显卡的Windows系统设计。

🔗 NVIDIA Chat With RTX

🔗 https://x.com/xiaohuggg/status/1757574748324979146...

· 3 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🎨 Stable Cascade 图像生成模型: 引入“三阶段方法”提升图片生成质量与灵活性。 训练成本比SD模型低16倍,减少对高端硬件需求。 支持根据需求选择不同大小的模型,提升用户体验。

🔗 https://x.com/xiaohuggg/status/1757431125579047408...

2⃣️ 📈 NVIDIA 成为全球市值第四大公司: 市值超过亚马逊和谷歌,达到1.831万亿美元。 2024年初6周内市值增加6500亿美元,超特斯拉公司市值。 全球市值排名更新,微软、苹果、沙特阿美领先。

🔗 https://x.com/xiaohuggg/status/1757388396996280482...

3⃣️ 📝 notesGPT 语音笔记工具: 自动转录语音为文本,生成内容总结和行动项。 100%免费开源,支持广泛技术栈如Convex、Next.js等。 提高笔记效率和任务规划。

在线体验:notesGPT - Take notes with your voice

🔗 https://x.com/xiaohuggg/status/1757355823460991485...

4⃣️ 🎙️ ElevenLabs 声音分享平台: 允许用户创建、分享AI声音并赚取收入。 提供高级选项,包括合作创建高质量默认声音。 加强个人品牌影响力,设置价格和使用参数。 详细:Voice Actor Payouts | ElevenLabs

🔗 https://x.com/xiaohuggg/status/1757240458944844074...

5⃣️ 💡 Azure OpenAI Service 新功能: Assistants API 公开预览,支持持久化和无限长的对话线程。 新的文本到语音功能,即将推出GPT-4 Turbo和GPT-3.5 Turbo模型。 简化对话状态管理,提升AI助手体验。

详细:https://msft.it/6019ihVTb

🔗 https://x.com/xiaohuggg/status/1757231958088949810...

6⃣️ 🖼️ Keyframer 动画工具: 苹果开发,利用LLMs将静态SVG图像转换成动画。 支持通过文字描述来生成CSS动画代码。 为设计师提供更灵活的动画创作工具。

论文:[2402.06071] Keyframer: Empowering Animation Desig...

🔗 https://x.com/xiaohuggg/status/1757225933138952546...

· 3 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🌍 Google Bard全球更新: 支持Gemini Pro,覆盖40种语言、230多个国家和地区。 新增图像生成功能,基于Imagen 2模型,目前仅支持英语。 多语言双重检查功能,通过“G”图标验证Bard回答的准确性。 图像生成中加入可识别水印(SynthID)。

🔗 Google Bard update: Image generation and Gemini Pr...

2⃣️ 📷 JoyTag开源图像标注模型: 输出5000多个标签预测,无内容过滤,支持性正面内容。 基于ViT-B/16构建,输入尺寸448x448x3,9100万参数,训练样本660M。 适合多样化图像内容,特别优化Diffusion模型训练。

🔗 https://x.com/xiaohuggg/status/1753393342266916991...

3⃣️ 🎥 Wonder Studio摄像机追踪与点云技术: 自动识别摄像机移动和拍摄场景,精确CGI与实景融合。 包括摄像机追踪和点云技术,支持3D场景重建和CG元素自然移动。

🔗 https://x.com/xiaohuggg/status/1753386192224362950...

4⃣️ 🖼️ Google ImageFX工具: 基于Imagen 2,通过点击关键词合成提示词生成图片。 类似Google MusicFX操作体验。

🔗 https://aitestkitchen.withgoogle.com/tools/image-f...

🔗 https://x.com/xiaohuggg/status/1753376925773635616...

5⃣️ 🔧 InstructIR图像恢复工具: 根据文字描述改善图片,支持去噪、去雨、去模糊等。 使用NAFNet和指令条件块(ICB),支持多任务学习。

🔗 https://mv-lab.github.io/InstructIR/

🔗 [2401.16468] High-Quality Image Restoration Follow...

🔗 https://x.com/xiaohuggg/status/1753345751911198802...

6⃣️ 📝 InternLM-XComposer图文创作模型: 自由形式输入下的图文创作和理解,包含海量图文知识库。 支持图像识别、感知和视觉推理。

🔗 GitHub - InternLM/InternLM-XComposer: InternLM-XCo...

🔗 [2401.16420] InternLM-XComposer2: Mastering Free-f...

🔗 https://x.com/xiaohuggg/status/1753261066136752494...

7⃣️ 🎨 Poe Image Remix功能: 修改AI生成图片的风格、布局和颜色。 支持SDXL和Playground v2图像生成机器人,适用于Web、macOS、Windows,计划扩展到iOS和Android。 s 🔗 https://x.com/xiaohuggg/status/1753257680804946390...

· 2 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🔬OpenAI研究生物武器风险评估系统:

  • 开发评估系统以识别大型语言模型辅助生物武器制造的风险。
  • 研究了GPT-4在生物威胁创建任务中的影响。
  • 发现准确性和完整性有轻微提升,但影响有限。

🔗 https://openai.com/research/building-an-early-warning-system-for-llm-aided-biological-threat-creation

🔗 https://x.com/xiaohuggg/status/1753019124840874270?s=20

2⃣️ 🎮使用LLaMa开发的单词小游戏:

  • 有助于学英语,结合TTS技术提高互动性。
  • 结合AI生成图像,通过视觉辅助学习单词。
  • 提供试玩链接。

🔗 http://neal.fun/infinite-craft/

🔗 https://x.com/xiaohuggg/status/1753011273946849490?s=20

3⃣️ 🕹️Meta Quest3与Apple Vision Pro比较:

  • 价格差异明显,性价比高。
  • Quest 3提供良好的生态体验。

🔗 https://x.com/xiaohuggg/status/1752996560496206253?s=20

4⃣️ 🗣️ElevenLabs推出官方GPTs:

  • 提供文本到语音的转换服务。
  • 支持Jarvis以及经典男女声旁白。
  • 目前只支持英文。

🔗 https://chat.openai.com/g/g-h0lbLuFF1-elevenlabs-text-to-speech

🔗 https://x.com/xiaohuggg/status/1752978752907444367?s=20

5⃣️ 🎨Glif StyleHunter:创意Chrome扩展:

  • 在网页上选择图像,根据提示词生成混合风格图像。
  • 使用StableDiffusion技术,快速创造新艺术作品。

🔗 https://chromewebstore.google.com/detail/glif-style-hunter/abfbooehhdjcgmbmcpkcebcmpfnlingo?hl=en&authuser=0

🔗 https://x.com/xiaohuggg/status/1752948310032486687?s=20

6⃣️ 👤Media2Face:3D面部动画创造工具:

  • 根据声音生成同步的3D面部动画。
  • 允许个性化调整,如情感表达。
  • 应用于对话场景、情感歌唱等多种场合。

🔗 https://sites.google.com/view/media2face

🔗 https://arxiv.org/abs/2401.15687

🔗 https://x.com/xiaohuggg/status/1752871200303480928?s=20

· 3 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🦄 语言克隆初创公司ElevenLabs融资突破:

  • 完成了8000万美元B轮融资,公司估值超10亿美元。
  • 开发逼真声音克隆工具,可调整语调、情感。
  • 计划年底前团队扩展至100人。

🔗 https://x.com/xiaohuggg/status/1749404294493999570?s=20

2⃣️ 📹 HeyGen的AI视频聊天新功能:

  • 通过文字与AI进行视频对话。
  • 视频里的人物、声音和回答完全由AI生成。
  • 文字转视频技术展示。

🔗 https://x.com/xiaohuggg/status/1749367612197499282?s=20

3⃣️ 🤖 Google ASPIRE技术提升AI准确性:

  • AI自我评估以区分正确和错误答案。
  • 对答案提供信心分数,增强答案的可靠性。
  • 适用于不同规模的模型,增强用户决策透明度。

🔗 https://x.com/xiaohuggg/status/1749361410981949814?s=20

4⃣️ 🩺 DermaSensor获FDA批准,AI医疗突破:

  • 首个能检测所有主要皮肤癌的AI设备。
  • 高灵敏度,正确阳性率达96%。
  • 非侵入式扫描技术,易于使用。

🔗 https://x.com/xiaohuggg/status/1749340458315354278?s=20

5⃣️ 🔐 GPT Auth引入GPTs应用用户认证:

  • 提供用户认证,确保GPT应用的访问授权。
  • 支持收费模式,如订阅和按次使用。
  • 跟踪GPTs使用情况,助力开发者了解用户需求。

详细:🔗https://gpt-auth.com

https://x.com/xiaohuggg/status/1749286572246348112?s=20

6⃣️ 🎵 Beatoven AI音乐生成器面向创作者:

  • AI技术创作版权免费背景音乐。
  • 用户友好界面,简单操作流程。
  • 音乐定制化,支持多种情绪和风格选择。

在线体验:🔗https://beatoven.ai

🔗 https://x.com/xiaohuggg/status/1749271902424912046?s=20

7⃣️ 🎨 ComfyUI中GragNUWA技术展示:

  • 复刻Runway Multi Motion Brush。
  • 增加细节运动路径,展现灵活性。
  • GragNUWA技术潜力无限

🔗 https://x.com/ZHOZHO672070/status/1749003377810522416?s=20

Alt text