Blog | AIBrain

Skip to main content

AIBrain日报-2024.02.12

February 12, 2024 · 2 min read

aibrain.wiki日报

🤯神秘人工智能链接🤯

（神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……）

✨✨✨✨✨✨✨✨

1⃣️ 🚀纽约大学新技术：无人机18秒快速学飞在MacBook Pro上训练无人机稳定飞行。适用于各种大小和类型的无人机。仿真环境训练，无风险快速学习。

🔗 https://arxiv.org/abs/2311.13081

🔗 GitHub - arplaboratory/learning-to-fly: Training t...

🔗 https://youtu.be/NRD43ZA1D-4

🔗 https://x.com/xiaohuggg/status/1756915564692545660...

2⃣️ 🤖TweetReader GPT：Twitter阅读助手长Thread展开、推文翻译、摘要及视频下载。

🔗 https://chat.openai.com/g/g-jQyjBVVhg-tweetreader

🔗 https://x.com/dotey/status/1756901189646422132?s=2...

3⃣️ 👨🦯盲人导演利用Pixel 8 "Guided Frame" 功能通过Google AI技术，让视力障碍者更易拍照分享。

🔗 https://x.com/xiaohuggg/status/1756938521179517436...

4⃣️ 🎥Direct-a-Video：通过语言控制视频创作控制摄像机和对象运动，创作复杂视频场景。通过文本指令实现细粒度视频生成控制。

🔗 SOCIAL MEDIA TITLE TAG

🔗 https://x.com/xiaohuggg/status/1756962287691444265...

5⃣️ 💸MoneyPrinter：自动化YouTube短视频赚钱项目自动视频生成，音乐和字体自定义。利用MoviePy和YouTube API实现视频自动上传。

🔗 GitHub - FujiwaraChoki/MoneyPrinter: Automate Crea...

🔗 https://x.com/xiaohuggg/status/1756977011782979921...

6⃣️ 🎨Canvastique3D：实时3D手工设计预览工具结合OpenCV和OpenAI技术。让设计师即时看到设计在3D模型上的效果。

🔗 https://x.com/xiaohuggg/status/1757022189201858603...

AIBrain日报-2024.02.10-11

February 10, 2024 · 2 min read

aibrain.wiki日报

🤯神秘人工智能链接🤯

（神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……）

✨✨✨✨✨✨✨✨

1⃣️ 🤖 神经网络视觉端到端学习机器人综述：完全独立执行任务，不依赖人类远程操控或预设脚本。实时通过神经网络计算得出所有动作，基于视觉的端到端学习。通过训练理解广泛物理行为，如清洁、整理、社交互动等。

🔗 All Neural Networks, All Autonomous, All 1X speed

🔗 https://x.com/xiaohuggg/status/1756531196933419330...

2⃣️ 🏆 Vision Arena：视觉模型竞技场：测试比较GPT-4V、Gemini等视觉语言模型。用户盲测投票决定哪个模型更优秀。

🔗 https://huggingface.co/spaces/WildVision/vision-ar...

🔗 https://x.com/xiaohuggg/status/1756516368269312196...

3⃣️ 💰 Maybe：开源个人财务操作系统：跟踪管理收入、支出、投资和财富。包含财务顾问功能，联系专业财务管理建议。因商业模式未成功而关闭，现开源复兴。

🔗 GitHub - maybe-finance/maybe: The OS for your pers...

🔗 https://x.com/xiaohuggg/status/1756508424551227405...

AIBrain日报-2024.02.09

February 9, 2024 · 2 min read

aibrain.wiki日报

🤯神秘人工智能链接🤯

（神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……）

✨✨✨✨✨✨✨✨

1⃣️ 🤖 Google DeepMind的革命性象棋AI：使用Transformer模型下象棋，超越AlphaZero。达到国际象棋大师级别，减少计算需求。展示了Transformer模型在策略游戏中的应用潜力。

🔗 [2402.04494] Grandmaster-Level Chess Without Searc...

🔗 lichess.org • 免费在线国际象棋

🔗 https://x.com/xiaohuggg/status/1755840200260096210...

2⃣️ 🧠 Vercel的AI集成革新：集成了9个AI，创建Model Playground。提供一站式AI应用开发工具，简化AI功能部署。支持生成文本、图像、音频等多种内容。

🔗 Introducing AI Integrations on Vercel – Vercel

🔗 Deploy AI at the speed of frontend – Vercel

🔗 https://x.com/xiaohuggg/status/1755832179014484162...

3⃣️ 🖼️ ComfyUI 3D Pack引入3D图像处理：快速将图片转换为3D模型，支持多角度查看。使用3D高斯扩散技术提升模型质量。支持多种格式导出，集成先进3D处理算法。

🔗 GitHub - MrForExample/ComfyUI-3D-Pack: An extensiv...

🔗 https://x.com/xiaohuggg/status/1755824687811346514...

AIBrain日报-2024.02.08

February 8, 2024 · 2 min read

aibrain.wiki日报

🤯神秘人工智能链接🤯

（神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……）

✨✨✨✨✨✨✨✨

1⃣️ 🤖 Google DeepMind的革命性象棋AI：使用Transformer模型下象棋，超越AlphaZero。达到国际象棋大师级别，减少计算需求。展示了Transformer模型在策略游戏中的应用潜力。

🔗 [2402.04494] Grandmaster-Level Chess Without Searc...

🔗 lichess.org • 免费在线国际象棋

🔗 https://x.com/xiaohuggg/status/1755840200260096210...

2⃣️ 🧠 Vercel的AI集成革新：集成了9个AI，创建Model Playground。提供一站式AI应用开发工具，简化AI功能部署。支持生成文本、图像、音频等多种内容。

🔗 Introducing AI Integrations on Vercel – Vercel

🔗 Deploy AI at the speed of frontend – Vercel

🔗 https://x.com/xiaohuggg/status/1755832179014484162...

3⃣️ 🖼️ ComfyUI 3D Pack引入3D图像处理：快速将图片转换为3D模型，支持多角度查看。使用3D高斯扩散技术提升模型质量。支持多种格式导出，集成先进3D处理算法。

🔗 GitHub - MrForExample/ComfyUI-3D-Pack: An extensiv...

🔗 https://x.com/xiaohuggg/status/1755824687811346514...

AIBrain日报-2024.02.07

February 7, 2024 · 3 min read

aibrain.wiki日报

🤯神秘人工智能链接🤯

（神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……）

✨✨✨✨✨✨✨✨

1⃣️ 🚀 Gemini Ultra 上线，Bard更名为Gemini： Gemini Ultra带来界面优化、Gemini Advanced付费计划。提供复杂任务执行能力，如编程、逻辑推理。即将推出Gemini APP，与Google应用集成。

🔗 https://gemini.google.com/updates

🔗 https://x.com/xiaohuggg/status/1755600097239536034...

2⃣️ 🤖 OpenAI开发新型代理软件：代理软件通过控制设备自动完成任务。支持文档数据转移到电子表格、自动填写费用报告。

🔗 https://x.com/xiaohuggg/status/1755587992067125449...

3⃣️ 🎶 Stability AI发布AudioSparx 1.0音乐模型：高效生成长达95秒的立体声音乐。支持可变长度音频输出和立体声渲染。性能优于AudioLDM2和MusicGen。

🔗 https://arxiv.org/abs/2402.04825

🔗 GitHub - Stability-AI/stable-audio-tools: Generati...

🔗 GitHub - Stability-AI/stable-audio-metrics

🔗 stable-audio-demo

🔗 https://x.com/xiaohuggg/status/1755565282285015484...

4⃣️ 🔍 Vision Pro拆解揭示显示技术：双显示屏分辨率和像素密度超高。电池包复杂设计，提供高容量。显示体验高密度，展示Apple技术领先。

🔗 Vision Pro Teardown Part 2: What’s the Display Res...

🔗 https://x.com/xiaohuggg/status/1755558069143306328...

5⃣️ 📢 最新版ChatGPT 4 System Prompt：

🔗 https://x.com/xiaohuggg/status/1755493510395109631...

6⃣️ 🤖 Archax操作型机器人详解：总高度4.5米，重量3.5吨，26个关节自由度。机器人/车辆模式，最高速度10km/h。驾驶舱内部设有四面显示屏和九个摄像头。

🔗 https://x.com/xiaohuggg/status/1755445005739753592...

7⃣️ 🏥 CheXagent自动解读胸部X光图像：自动分析胸部X光，生成放射学报告。解读性能高效，超越通用和医疗领域模型。支持多样化任务处理，如图像理解、问题回答。

🔗 [2401.12208] CheXagent: Towards a Foundation Model...

🔗 GitHub - Stanford-AIMI/CheXagent: [Arxiv-2024] Che...

🔗 https://x.com/xiaohuggg/status/1755434771994525928...

8⃣️ 🔊 MetaVoice-1B文本到语音转换模型： 1.2亿参数，10万小时语音数据训练。支持情感语音节奏、跨语言语音克隆。零样本克隆支持，适合长篇内容语音合成。

🔗 https://huggingface.co/metavoiceio/metavoice-1B-v0...

🔗 GitHub - metavoiceio/metavoice-src: AI for human-l...

🔗 TTS by MetaVoice

🔗 https://x.com/xiaohuggg/status/1755423130464772568...

AIBrain日报-2024.02.06

February 6, 2024 · 3 min read

aibrain.wiki日报

🤯神秘人工智能链接🤯

（神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……）

✨✨✨✨✨✨✨✨

1⃣️ 📸 RMBG-1.4去除照片背景模型：高精度背景去除，适用于电商、广告等场景。支持视频背景批量去除，提供蒙版输出功能。云端处理速度快，性能卓越。

🔗 GitHub - ZHO-ZHO-ZHO/ComfyUI-BRIA_AI-RMBG: Unoffic...

🔗 https://x.com/xiaohuggg/status/1755075272410538450...

2⃣️ 👨⚕️ Medivis的SurgicalAR手术应用：将2D医疗图像转化为3D互动视觉，提高手术精度。支持3D模型的放大、缩小、旋转，精确手术计划。

🔗 https://t.co/3tUvxB0L4I

🔗 https://x.com/xiaohuggg/status/1755183564021473404...

3⃣️ 🎨 DALL·E 3图像编辑器功能预告：即将推出的功能，增强图像生成一致性。

🔗 https://x.com/xiaohuggg/status/1755173835396239826...

4⃣️ 📱 MiniCPM端侧大模型：面壁智能与清华大学共同开发，支持手机端运行。优于现有模型，提供流式输出速度。

🔗 https://x.com/xiaohuggg/status/1755140675270795646...

5⃣️ 🔥 Anything in Any Scene技术：无缝插入任何物体至视频，保持自然融合。特点包括物体准确放置、真实光照阴影模拟、风格一致性。

🔗 Anything in Any Scene

🔗 https://x.com/xiaohuggg/status/1755084128721277336...

6⃣️ 🗣️ Stability AI的新型文本到语音模型：不需人声样本，通过文字描述生成声音。特点包括高保真语音生成、自然语言控制、创造新声音。

🔗 text description to speech

🔗 https://arxiv.org/abs/2402.01912

🔗 https://x.com/xiaohuggg/status/1755062275000733905...

7⃣️ 👁️ OpenAI的DALL-E 3添加C2PA水印：为AI生成图像添加水印，增加内容来源识别。 C2PA技术标准应用，提升媒体内容可信度。

🔗 https://c2pa.org

🔗 https://x.com/xiaohuggg/status/1755054688591073325...

AIBrain日报-2024.02.05

February 5, 2024 · 3 min read

aibrain.wiki日报

🤯神秘人工智能链接🤯

（神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……）

✨✨✨✨✨✨✨✨

1⃣️ 🕵️♂️OnlyFake地下网站制假身份证：使用AI技术制作以假乱真的身份证和驾驶证。通过加密货币交易所OKX的身份验证。允许用户快速生成假身份证，可能绕过在线验证系统。

🔗 Inside the Underground Site Where ‘Neural Networks...

🔗 https://x.com/xiaohuggg/status/1754862694329626817...

2⃣️ 🚀PopAi升级功能：接入DALLE3，提供图像文本提取、翻译等。支持拍照作业检查，设计用词校对。

🔗 https://producthunt.com/posts/popai

🔗 PopAi: Your Personal AI Workspace

🔗 https://x.com/xiaohuggg/status/1754857535268659311...

3⃣️ 🌍V-IRL虚拟环境模拟：基于真实世界数据创建虚拟环境。支持全球城市移动定位，视觉感知，语言处理。案例展示AI代理执行现实世界任务的能力。

🔗 V-IRL: Grounding Virtual Intelligence in Real Life

🔗 [2402.03310] V-IRL: Grounding Virtual Intelligence...

🔗 GitHub - VIRL-Platform/VIRL

🔗 https://x.com/xiaohuggg/status/1754845355060154412...

4⃣️ 📊ChatGPT统计数据汇总： 1.8亿用户，每月17亿次网站浏览。预计2024年产生10亿美元收入。覆盖用户习惯、网站流量等数据。

🔗 100 ChatGPT Statistics 2024 · AIPRM

🔗 https://x.com/xiaohuggg/status/1754834365190934848...

5⃣️ 🎵Image to Music V2功能：将上传的照片自动转换成音乐。结合图像识别、自然语言处理和音乐生成。提供个性化的音乐创作体验。

🔗 https://huggingface.co/posts/fffiloni/484223631728...…

🔗 https://huggingface.co/spaces/fffiloni/image-to-mu...

🔗 https://x.com/xiaohuggg/status/1754713450352349582...

6⃣️ 🤖Atlas人形机器人：波士顿动力的Atlas机器人开始执行实际工作。主要用于装配物品，类似军用机器人。

🔗 https://x.com/xiaohuggg/status/1754687614081523864...

7⃣️ 🧠Qwen1.5版本更新：发布多种尺寸模型，包括72B最强版本。在多项性能评估中展现出色能力，支持长文本理解。展现强大的多语言能力和外部系统连接能力。

🔗 http://qwenlm.github.io/blog/qwen1.5/

🔗 https://huggingface.co/spaces/Qwen/Qwen1.5-72B-Cha...…

🔗 http://hf.co/Qwen

🔗 GitHub - QwenLM/Qwen1.5: Qwen1.5 is the improved v...

🔗 https://x.com/xiaohuggg/status/1754682119044145290...

AIBrain日报-2024.02.04

February 4, 2024 · 2 min read

aibrain.wiki日报

🤯神秘人工智能链接🤯

（神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……）

✨✨✨✨✨✨✨✨

1⃣️ 📹 HeyGen AI实时视频聊天功能上线与HeyGen CEO的AI分身进行实时视频聊天。视频回答由AI实时生成。

体验地址：https://labs.heygen.com/streaming-avatar

🔗 https://x.com/xiaohuggg/status/1754129432716120533...

2⃣️ 🔄 Stable Video Diffusion (SVD) 模型1.1 发布微调优化提高视频输出质量。改进生成性能，提供流畅高质量视觉体验。

模型下载地址：https://huggingface.co/stabilityai/stable-video-di...

🔗 https://x.com/xiaohuggg/status/1754118113807970659...

3⃣️ 👓 Polycam登陆Apple Vision Pro 浏览和互动数百万个原生3D资源。使用iPhone扫描物体变成3D模型。详细信息：Native 3D App & Models for Apple Vision Pro

🔗 https://x.com/xiaohuggg/status/1754112096193949958...

4⃣️ 🌌 Gemini Ultra即将上线，Bard更名为Gemini Gemini Ultra上线，界面优化。推出Gemini Advanced付费计划，访问最强大AI模型。将推出Gemini APP，与Google其他应用集成。

🔗 https://x.com/xiaohuggg/status/1754100742603100579...

5⃣️ 🔧 ML Blocks：无代码AI图像生成和分析平台提供拖放式界面，创建图像处理工作流。支持多步骤图像生成或分析管道。传送门：ML Blocks | Home 工作原理：What on Earth is ML Blocks? - by Neil Mathew

🔗 https://x.com/xiaohuggg/status/1754058907264376833...

6⃣️ 🔍 iFixit发布Apple Vision Pro拆解视频展示了Apple Vision Pro的内部结构。

完整视频：https://youtu.be/JVJPAYwY8Us

🔗 https://x.com/xiaohuggg/status/1754027450181517353...

7⃣️ ⏳ Google开发的TimesFM时间序列预测模型预测未来事件，适用于商业、金融等领域。支持长期预测，模型规模相对较小。

详细信息：https://blog.research.google/2024/02/a-decoder-onl...

🔗 https://x.com/xiaohuggg/status/1754021393967292429...

AIBrain日报-2024.02.03

February 3, 2024 · 2 min read

aibrain.wiki日报

🤯神秘人工智能链接🤯

（神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……）

✨✨✨✨✨✨✨✨

1⃣️ 🤖 Motion-I2V：革新视频生成：

从静态图片生成连贯可控视频。
显式运动建模，提高自然度和真实感。
支持零样本视频风格转换，高质量输出。

🔗 https://xiaoyushi97.github.io/Motion-I2V

🔗 [2401.15977] Motion-I2V: Consistent and Controllab...

2⃣️ 🌲 《Wisp World》：与AI森林精灵互动：

Apple Vision Pro养成游戏，AI驱动成长变化。
与精灵交流，享受美妙声音。

🔗 https://x.com/xiaohuggg/status/1753677477959123345...

3⃣️ 🤖 HuggingFace 发布 Hugging Chat 助手：

定制版聊天机器人，支持多种AI模型。
可以在HuggingFace托管模型，创建个性化聊天助手。

🔗 https://huggingface.co/chat/assistants

🔗 https://x.com/xiaohuggg/status/1753630690942611654...

4⃣️ 📌 ADeus：$100 AI可穿戴设备：

开源项目，实时记录语音和环境数据。
个人小秘书，多种智能功能，完全数据控制。

🔗 GitHub - adamcohenhillel/ADeus: Open-Source AI wea...

🔗 https://x.com/xiaohuggg/status/1753628612136419616...

5⃣️ 🎨 最佳AI辅助学习工具：

无限大画板，自动拓展知识点，支持多语言。
集成搜索、图片、视频卡片，支持GPT4V读图。

🔗 https://x.com/Yangyixxxx/status/175342569094135854...

6⃣️ 🏢 美图收购站酷：

交易总价约2.85亿元，提升美图设计业务。
站酷聚集全球创意从业者，强化美图AI视觉大模型生态。

🔗 https://x.com/xiaohuggg/status/1753449500612682054...

AIBrain日报-2024.02.02

February 2, 2024 · 3 min read

aibrain.wiki日报

🤯神秘人工智能链接🤯

（神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……）

✨✨✨✨✨✨✨✨

1⃣️ 🌍 Google Bard全球更新：支持Gemini Pro，覆盖40种语言、230多个国家和地区。新增图像生成功能，基于Imagen 2模型，目前仅支持英语。多语言双重检查功能，通过“G”图标验证Bard回答的准确性。图像生成中加入可识别水印（SynthID）。

🔗 Google Bard update: Image generation and Gemini Pr...

2⃣️ 📷 JoyTag开源图像标注模型：输出5000多个标签预测，无内容过滤，支持性正面内容。基于ViT-B/16构建，输入尺寸448x448x3，9100万参数，训练样本660M。适合多样化图像内容，特别优化Diffusion模型训练。

🔗 https://x.com/xiaohuggg/status/1753393342266916991...

3⃣️ 🎥 Wonder Studio摄像机追踪与点云技术：自动识别摄像机移动和拍摄场景，精确CGI与实景融合。包括摄像机追踪和点云技术，支持3D场景重建和CG元素自然移动。

🔗 https://x.com/xiaohuggg/status/1753386192224362950...

4⃣️ 🖼️ Google ImageFX工具：基于Imagen 2，通过点击关键词合成提示词生成图片。类似Google MusicFX操作体验。

🔗 https://aitestkitchen.withgoogle.com/tools/image-f...

🔗 https://x.com/xiaohuggg/status/1753376925773635616...

5⃣️ 🔧 InstructIR图像恢复工具：根据文字描述改善图片，支持去噪、去雨、去模糊等。使用NAFNet和指令条件块（ICB），支持多任务学习。

🔗 https://mv-lab.github.io/InstructIR/

🔗 [2401.16468] High-Quality Image Restoration Follow...

🔗 https://x.com/xiaohuggg/status/1753345751911198802...

6⃣️ 📝 InternLM-XComposer图文创作模型：自由形式输入下的图文创作和理解，包含海量图文知识库。支持图像识别、感知和视觉推理。

🔗 GitHub - InternLM/InternLM-XComposer: InternLM-XCo...

🔗 [2401.16420] InternLM-XComposer2: Mastering Free-f...

🔗 https://x.com/xiaohuggg/status/1753261066136752494...

7⃣️ 🎨 Poe Image Remix功能：修改AI生成图片的风格、布局和颜色。支持SDXL和Playground v2图像生成机器人，适用于Web、macOS、Windows，计划扩展到iOS和Android。 s 🔗 https://x.com/xiaohuggg/status/1753257680804946390...