Skip to main content

· 2 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🚀纽约大学新技术:无人机18秒快速学飞 在MacBook Pro上训练无人机稳定飞行。 适用于各种大小和类型的无人机。 仿真环境训练,无风险快速学习。

🔗 https://arxiv.org/abs/2311.13081

🔗 GitHub - arplaboratory/learning-to-fly: Training t...

🔗 https://youtu.be/NRD43ZA1D-4

🔗 https://x.com/xiaohuggg/status/1756915564692545660...

2⃣️ 🤖TweetReader GPT:Twitter阅读助手 长Thread展开、推文翻译、摘要及视频下载。

🔗 https://chat.openai.com/g/g-jQyjBVVhg-tweetreader

🔗 https://x.com/dotey/status/1756901189646422132?s=2...

3⃣️ 👨🦯盲人导演利用Pixel 8 "Guided Frame" 功能 通过Google AI技术,让视力障碍者更易拍照分享。

🔗 https://x.com/xiaohuggg/status/1756938521179517436...

4⃣️ 🎥Direct-a-Video:通过语言控制视频创作 控制摄像机和对象运动,创作复杂视频场景。 通过文本指令实现细粒度视频生成控制。

🔗 SOCIAL MEDIA TITLE TAG

🔗 https://x.com/xiaohuggg/status/1756962287691444265...

5⃣️ 💸MoneyPrinter:自动化YouTube短视频赚钱项目 自动视频生成,音乐和字体自定义。 利用MoviePy和YouTube API实现视频自动上传。

🔗 GitHub - FujiwaraChoki/MoneyPrinter: Automate Crea...

🔗 https://x.com/xiaohuggg/status/1756977011782979921...

6⃣️ 🎨Canvastique3D:实时3D手工设计预览工具 结合OpenCV和OpenAI技术。 让设计师即时看到设计在3D模型上的效果。

🔗 https://x.com/xiaohuggg/status/1757022189201858603...

· 2 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🤖 神经网络视觉端到端学习机器人综述: 完全独立执行任务,不依赖人类远程操控或预设脚本。 实时通过神经网络计算得出所有动作,基于视觉的端到端学习。 通过训练理解广泛物理行为,如清洁、整理、社交互动等。

🔗 All Neural Networks, All Autonomous, All 1X speed

🔗 https://x.com/xiaohuggg/status/1756531196933419330...

2⃣️ 🏆 Vision Arena:视觉模型竞技场: 测试比较GPT-4V、Gemini等视觉语言模型。 用户盲测投票决定哪个模型更优秀。

🔗 https://huggingface.co/spaces/WildVision/vision-ar...

🔗 https://x.com/xiaohuggg/status/1756516368269312196...

3⃣️ 💰 Maybe:开源个人财务操作系统: 跟踪管理收入、支出、投资和财富。 包含财务顾问功能,联系专业财务管理建议。 因商业模式未成功而关闭,现开源复兴。

🔗 GitHub - maybe-finance/maybe: The OS for your pers...

🔗 https://x.com/xiaohuggg/status/1756508424551227405...

· 2 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🤖 Google DeepMind的革命性象棋AI: 使用Transformer模型下象棋,超越AlphaZero。 达到国际象棋大师级别,减少计算需求。 展示了Transformer模型在策略游戏中的应用潜力。

🔗 [2402.04494] Grandmaster-Level Chess Without Searc...

🔗 lichess.org • 免费在线国际象棋

🔗 https://x.com/xiaohuggg/status/1755840200260096210...

2⃣️ 🧠 Vercel的AI集成革新: 集成了9个AI,创建Model Playground。 提供一站式AI应用开发工具,简化AI功能部署。 支持生成文本、图像、音频等多种内容。

🔗 Introducing AI Integrations on Vercel – Vercel

🔗 Deploy AI at the speed of frontend – Vercel

🔗 https://x.com/xiaohuggg/status/1755832179014484162...

3⃣️ 🖼️ ComfyUI 3D Pack引入3D图像处理: 快速将图片转换为3D模型,支持多角度查看。 使用3D高斯扩散技术提升模型质量。 支持多种格式导出,集成先进3D处理算法。

🔗 GitHub - MrForExample/ComfyUI-3D-Pack: An extensiv...

🔗 https://x.com/xiaohuggg/status/1755824687811346514...

· 2 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🤖 Google DeepMind的革命性象棋AI: 使用Transformer模型下象棋,超越AlphaZero。 达到国际象棋大师级别,减少计算需求。 展示了Transformer模型在策略游戏中的应用潜力。

🔗 [2402.04494] Grandmaster-Level Chess Without Searc...

🔗 lichess.org • 免费在线国际象棋

🔗 https://x.com/xiaohuggg/status/1755840200260096210...

2⃣️ 🧠 Vercel的AI集成革新: 集成了9个AI,创建Model Playground。 提供一站式AI应用开发工具,简化AI功能部署。 支持生成文本、图像、音频等多种内容。

🔗 Introducing AI Integrations on Vercel – Vercel

🔗 Deploy AI at the speed of frontend – Vercel

🔗 https://x.com/xiaohuggg/status/1755832179014484162...

3⃣️ 🖼️ ComfyUI 3D Pack引入3D图像处理: 快速将图片转换为3D模型,支持多角度查看。 使用3D高斯扩散技术提升模型质量。 支持多种格式导出,集成先进3D处理算法。

🔗 GitHub - MrForExample/ComfyUI-3D-Pack: An extensiv...

🔗 https://x.com/xiaohuggg/status/1755824687811346514...

· 3 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🚀 Gemini Ultra 上线,Bard更名为Gemini: Gemini Ultra带来界面优化、Gemini Advanced付费计划。 提供复杂任务执行能力,如编程、逻辑推理。 即将推出Gemini APP,与Google应用集成。

🔗 https://gemini.google.com/updates

🔗 https://x.com/xiaohuggg/status/1755600097239536034...

2⃣️ 🤖 OpenAI开发新型代理软件: 代理软件通过控制设备自动完成任务。 支持文档数据转移到电子表格、自动填写费用报告。

🔗 https://x.com/xiaohuggg/status/1755587992067125449...

3⃣️ 🎶 Stability AI发布AudioSparx 1.0音乐模型: 高效生成长达95秒的立体声音乐。 支持可变长度音频输出和立体声渲染。 性能优于AudioLDM2和MusicGen。

🔗 https://arxiv.org/abs/2402.04825

🔗 GitHub - Stability-AI/stable-audio-tools: Generati...

🔗 GitHub - Stability-AI/stable-audio-metrics

🔗 stable-audio-demo

🔗 https://x.com/xiaohuggg/status/1755565282285015484...

4⃣️ 🔍 Vision Pro拆解揭示显示技术: 双显示屏分辨率和像素密度超高。 电池包复杂设计,提供高容量。 显示体验高密度,展示Apple技术领先。

🔗 Vision Pro Teardown Part 2: What’s the Display Res...

🔗 https://x.com/xiaohuggg/status/1755558069143306328...

5⃣️ 📢 最新版ChatGPT 4 System Prompt:

🔗 https://x.com/xiaohuggg/status/1755493510395109631...

6⃣️ 🤖 Archax操作型机器人详解: 总高度4.5米,重量3.5吨,26个关节自由度。 机器人/车辆模式,最高速度10km/h。 驾驶舱内部设有四面显示屏和九个摄像头。

🔗 https://x.com/xiaohuggg/status/1755445005739753592...

7⃣️ 🏥 CheXagent自动解读胸部X光图像: 自动分析胸部X光,生成放射学报告。 解读性能高效,超越通用和医疗领域模型。 支持多样化任务处理,如图像理解、问题回答。

🔗 CheXagent

🔗 [2401.12208] CheXagent: Towards a Foundation Model...

🔗 GitHub - Stanford-AIMI/CheXagent: [Arxiv-2024] Che...

🔗 https://x.com/xiaohuggg/status/1755434771994525928...

8⃣️ 🔊 MetaVoice-1B文本到语音转换模型: 1.2亿参数,10万小时语音数据训练。 支持情感语音节奏、跨语言语音克隆。 零样本克隆支持,适合长篇内容语音合成。

🔗 https://huggingface.co/metavoiceio/metavoice-1B-v0...

🔗 GitHub - metavoiceio/metavoice-src: AI for human-l...

🔗 TTS by MetaVoice

🔗 https://x.com/xiaohuggg/status/1755423130464772568...

· 3 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 📸 RMBG-1.4去除照片背景模型: 高精度背景去除,适用于电商、广告等场景。 支持视频背景批量去除,提供蒙版输出功能。 云端处理速度快,性能卓越。

🔗 GitHub - ZHO-ZHO-ZHO/ComfyUI-BRIA_AI-RMBG: Unoffic...

🔗 https://x.com/xiaohuggg/status/1755075272410538450...

2⃣️ 👨⚕️ Medivis的SurgicalAR手术应用: 将2D医疗图像转化为3D互动视觉,提高手术精度。 支持3D模型的放大、缩小、旋转,精确手术计划。

🔗 https://t.co/3tUvxB0L4I

🔗 https://x.com/xiaohuggg/status/1755183564021473404...

3⃣️ 🎨 DALL·E 3图像编辑器功能预告: 即将推出的功能,增强图像生成一致性。

🔗 https://x.com/xiaohuggg/status/1755173835396239826...

4⃣️ 📱 MiniCPM端侧大模型: 面壁智能与清华大学共同开发,支持手机端运行。 优于现有模型,提供流式输出速度。

🔗 https://x.com/xiaohuggg/status/1755140675270795646...

5⃣️ 🔥 Anything in Any Scene技术: 无缝插入任何物体至视频,保持自然融合。 特点包括物体准确放置、真实光照阴影模拟、风格一致性。

🔗 Anything in Any Scene

🔗 https://x.com/xiaohuggg/status/1755084128721277336...

6⃣️ 🗣️ Stability AI的新型文本到语音模型: 不需人声样本,通过文字描述生成声音。 特点包括高保真语音生成、自然语言控制、创造新声音。

🔗 text description to speech

🔗 https://arxiv.org/abs/2402.01912

🔗 https://x.com/xiaohuggg/status/1755062275000733905...

7⃣️ 👁️ OpenAI的DALL-E 3添加C2PA水印: 为AI生成图像添加水印,增加内容来源识别。 C2PA技术标准应用,提升媒体内容可信度。

🔗 https://c2pa.org

🔗 https://x.com/xiaohuggg/status/1755054688591073325...

· 3 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🕵️♂️OnlyFake地下网站制假身份证: 使用AI技术制作以假乱真的身份证和驾驶证。 通过加密货币交易所OKX的身份验证。 允许用户快速生成假身份证,可能绕过在线验证系统。

🔗 Inside the Underground Site Where ‘Neural Networks...

🔗 https://x.com/xiaohuggg/status/1754862694329626817...

2⃣️ 🚀PopAi升级功能: 接入DALLE3,提供图像文本提取、翻译等。 支持拍照作业检查,设计用词校对。

🔗 https://producthunt.com/posts/popai

🔗 PopAi: Your Personal AI Workspace

🔗 https://x.com/xiaohuggg/status/1754857535268659311...

3⃣️ 🌍V-IRL虚拟环境模拟: 基于真实世界数据创建虚拟环境。 支持全球城市移动定位,视觉感知,语言处理。 案例展示AI代理执行现实世界任务的能力。

🔗 V-IRL: Grounding Virtual Intelligence in Real Life

🔗 [2402.03310] V-IRL: Grounding Virtual Intelligence...

🔗 GitHub - VIRL-Platform/VIRL

🔗 https://x.com/xiaohuggg/status/1754845355060154412...

4⃣️ 📊ChatGPT统计数据汇总: 1.8亿用户,每月17亿次网站浏览。 预计2024年产生10亿美元收入。 覆盖用户习惯、网站流量等数据。

🔗 100 ChatGPT Statistics 2024 · AIPRM

🔗 https://x.com/xiaohuggg/status/1754834365190934848...

5⃣️ 🎵Image to Music V2功能: 将上传的照片自动转换成音乐。 结合图像识别、自然语言处理和音乐生成。 提供个性化的音乐创作体验。

🔗 https://huggingface.co/posts/fffiloni/484223631728...…

🔗 https://huggingface.co/spaces/fffiloni/image-to-mu...

🔗 https://x.com/xiaohuggg/status/1754713450352349582...

6⃣️ 🤖Atlas人形机器人: 波士顿动力的Atlas机器人开始执行实际工作。 主要用于装配物品,类似军用机器人。

🔗 https://x.com/xiaohuggg/status/1754687614081523864...

7⃣️ 🧠Qwen1.5版本更新: 发布多种尺寸模型,包括72B最强版本。 在多项性能评估中展现出色能力,支持长文本理解。 展现强大的多语言能力和外部系统连接能力。

🔗 http://qwenlm.github.io/blog/qwen1.5/

🔗 https://huggingface.co/spaces/Qwen/Qwen1.5-72B-Cha...…

🔗 http://hf.co/Qwen

🔗 GitHub - QwenLM/Qwen1.5: Qwen1.5 is the improved v...

🔗 https://x.com/xiaohuggg/status/1754682119044145290...

· 2 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 📹 HeyGen AI实时视频聊天功能上线 与HeyGen CEO的AI分身进行实时视频聊天。 视频回答由AI实时生成。

体验地址:https://labs.heygen.com/streaming-avatar

🔗 https://x.com/xiaohuggg/status/1754129432716120533...

2⃣️ 🔄 Stable Video Diffusion (SVD) 模型1.1 发布 微调优化提高视频输出质量。 改进生成性能,提供流畅高质量视觉体验。

模型下载地址:https://huggingface.co/stabilityai/stable-video-di...

🔗 https://x.com/xiaohuggg/status/1754118113807970659...

3⃣️ 👓 Polycam登陆Apple Vision Pro 浏览和互动数百万个原生3D资源。 使用iPhone扫描物体变成3D模型。 详细信息:Native 3D App & Models for Apple Vision Pro

🔗 https://x.com/xiaohuggg/status/1754112096193949958...

4⃣️ 🌌 Gemini Ultra即将上线,Bard更名为Gemini Gemini Ultra上线,界面优化。 推出Gemini Advanced付费计划,访问最强大AI模型。 将推出Gemini APP,与Google其他应用集成。

🔗 https://x.com/xiaohuggg/status/1754100742603100579...

5⃣️ 🔧 ML Blocks:无代码AI图像生成和分析平台 提供拖放式界面,创建图像处理工作流。 支持多步骤图像生成或分析管道。 传送门:ML Blocks | Home 工作原理:What on Earth is ML Blocks? - by Neil Mathew

🔗 https://x.com/xiaohuggg/status/1754058907264376833...

6⃣️ 🔍 iFixit发布Apple Vision Pro拆解视频 展示了Apple Vision Pro的内部结构。

完整视频:https://youtu.be/JVJPAYwY8Us

🔗 https://x.com/xiaohuggg/status/1754027450181517353...

7⃣️ ⏳ Google开发的TimesFM时间序列预测模型 预测未来事件,适用于商业、金融等领域。 支持长期预测,模型规模相对较小。

详细信息:https://blog.research.google/2024/02/a-decoder-onl...

🔗 https://x.com/xiaohuggg/status/1754021393967292429...

· 2 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🤖 Motion-I2V:革新视频生成:

  • 从静态图片生成连贯可控视频。
  • 显式运动建模,提高自然度和真实感。
  • 支持零样本视频风格转换,高质量输出。

🔗 https://xiaoyushi97.github.io/Motion-I2V

🔗 [2401.15977] Motion-I2V: Consistent and Controllab...

2⃣️ 🌲 《Wisp World》:与AI森林精灵互动:

  • Apple Vision Pro养成游戏,AI驱动成长变化。
  • 与精灵交流,享受美妙声音。

🔗 https://x.com/xiaohuggg/status/1753677477959123345...

3⃣️ 🤖 HuggingFace 发布 Hugging Chat 助手:

  • 定制版聊天机器人,支持多种AI模型。
  • 可以在HuggingFace托管模型,创建个性化聊天助手。

🔗 https://huggingface.co/chat/assistants

🔗 https://x.com/xiaohuggg/status/1753630690942611654...

4⃣️ 📌 ADeus:$100 AI可穿戴设备:

  • 开源项目,实时记录语音和环境数据。
  • 个人小秘书,多种智能功能,完全数据控制。

🔗 GitHub - adamcohenhillel/ADeus: Open-Source AI wea...

🔗 https://x.com/xiaohuggg/status/1753628612136419616...

5⃣️ 🎨 最佳AI辅助学习工具:

  • 无限大画板,自动拓展知识点,支持多语言。
  • 集成搜索、图片、视频卡片,支持GPT4V读图。

🔗 https://x.com/Yangyixxxx/status/175342569094135854...

6⃣️ 🏢 美图收购站酷:

  • 交易总价约2.85亿元,提升美图设计业务。
  • 站酷聚集全球创意从业者,强化美图AI视觉大模型生态。

🔗 https://x.com/xiaohuggg/status/1753449500612682054...

· 3 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🌍 Google Bard全球更新: 支持Gemini Pro,覆盖40种语言、230多个国家和地区。 新增图像生成功能,基于Imagen 2模型,目前仅支持英语。 多语言双重检查功能,通过“G”图标验证Bard回答的准确性。 图像生成中加入可识别水印(SynthID)。

🔗 Google Bard update: Image generation and Gemini Pr...

2⃣️ 📷 JoyTag开源图像标注模型: 输出5000多个标签预测,无内容过滤,支持性正面内容。 基于ViT-B/16构建,输入尺寸448x448x3,9100万参数,训练样本660M。 适合多样化图像内容,特别优化Diffusion模型训练。

🔗 https://x.com/xiaohuggg/status/1753393342266916991...

3⃣️ 🎥 Wonder Studio摄像机追踪与点云技术: 自动识别摄像机移动和拍摄场景,精确CGI与实景融合。 包括摄像机追踪和点云技术,支持3D场景重建和CG元素自然移动。

🔗 https://x.com/xiaohuggg/status/1753386192224362950...

4⃣️ 🖼️ Google ImageFX工具: 基于Imagen 2,通过点击关键词合成提示词生成图片。 类似Google MusicFX操作体验。

🔗 https://aitestkitchen.withgoogle.com/tools/image-f...

🔗 https://x.com/xiaohuggg/status/1753376925773635616...

5⃣️ 🔧 InstructIR图像恢复工具: 根据文字描述改善图片,支持去噪、去雨、去模糊等。 使用NAFNet和指令条件块(ICB),支持多任务学习。

🔗 https://mv-lab.github.io/InstructIR/

🔗 [2401.16468] High-Quality Image Restoration Follow...

🔗 https://x.com/xiaohuggg/status/1753345751911198802...

6⃣️ 📝 InternLM-XComposer图文创作模型: 自由形式输入下的图文创作和理解,包含海量图文知识库。 支持图像识别、感知和视觉推理。

🔗 GitHub - InternLM/InternLM-XComposer: InternLM-XCo...

🔗 [2401.16420] InternLM-XComposer2: Mastering Free-f...

🔗 https://x.com/xiaohuggg/status/1753261066136752494...

7⃣️ 🎨 Poe Image Remix功能: 修改AI生成图片的风格、布局和颜色。 支持SDXL和Playground v2图像生成机器人,适用于Web、macOS、Windows,计划扩展到iOS和Android。 s 🔗 https://x.com/xiaohuggg/status/1753257680804946390...