Skip to main content

12 posts tagged with "OpenAI"

View All Tags

· 2 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🔍 Google 推出Gemma模型: 轻量级、开源,适用于多种设备。 Gemma家族包括2B和7B两种尺寸,性能卓越。 技术上与Gemini共享,安全且负责任。

🔗 详细:https://dpmd.ai/3UJu1Y1

🔗 访问:http://ai.google.dev/gemma

🔗 https://x.com/xiaohuggg/status/1760312395078205746...

2⃣️ 👨🏫 蒋路加入字节TikTok: Google VideoPoet项目Research Lead,CMU兼职教授。 VideoPoet是Google的竞争项目。

🔗 https://scholar.google.com/citations?user=jIKjjSYA...

🔗 https://x.com/xiaohuggg/status/1760204483785814355...

3⃣️ 🧠 Neuralink人体试验更新: 首位脑机接口人体试验患者进展良好。 无神经不良影响,能通过思考控制鼠标。

🔗 https://x.com/xiaohuggg/status/1760198564658180525...

4⃣️ 🖼️ SDXL-Lightning项目: 字节跳动开发,优化扩散模型。 一步/少步生成1024px分辨率图像。 结合渐进式蒸馏和对抗式蒸馏。

🔗 模型:https://huggingface.co/ByteDance/SDXL-Lightning

🔗 https://x.com/xiaohuggg/status/1760191358298710370...

5⃣️ 🎯 YOLOv8目标检测跟踪模型: 快速准确的多对象识别和定位。 支持实例分割、人体姿态估计等。 多平台兼容,一站式视觉识别解决方案。

🔗 详细介绍:https://docs.ultralytics.com/models/

🔗 GitHub:GitHub - ultralytics/ultralytics: NEW - YOLOv8 🚀 i...

🔗 https://x.com/xiaohuggg/status/1760149057249636570...

6⃣️ 🎥 Sora工作原理解析: 结合扩散模型和Transformer架构。 采用空间时间补丁和时空立方体。 利用知识图谱组合视频,显示巨大潜力。

🔗 https://x.com/xiaohuggg/status/1760139842783248609...

7⃣️ 🚀 OpenAI技术人员的一天...

🔗 https://x.com/xiaohuggg/status/1760130189932265553...

· 3 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🖼️ Sora图像生成能力: Sora能生成图像,虽不及Midjourney,但优于Dalle 3。

🔗 https://x.com/xiaohuggg/status/1758491331272622202...

2⃣️ 💻 Reor:AI开源桌面笔记应用: 作为个人知识管理工具,构建“第二大脑”。 自动组织连接想法,支持检索式问答。 链接笔记与思想,提高问答和编辑效率。

下载地址:Reor

GitHub链接:GitHub - reorproject/reor: AI note-taking app that...

🔗 https://x.com/xiaohuggg/status/1758468281319792659...

3⃣️ 🚀 Google Gemini Pro 1.5 更新: 高度复杂的跨模态理解与推理。 分析无声电影,识别特定场景。 超越GPT 4的能力。

🔗 https://x.com/xiaohuggg/status/1758394427238912138...

Sherlock Jr. (1924) 视频:https://youtube.com/watch?v=rOVtjJkqtiA

4⃣️ 🎥 OpenAI发布文本转视频模型Sora: 生成长达60秒的高清视频。 视频展示详细场景、复杂动作和丰富情感。 旨在理解模拟动态物理世界。

🔗 https://x.com/xiaohuggg/status/1758286500964577514...

5⃣️ 🎮 Sora在视频游戏模拟中的能力: 零次学习控制“Minecraft”中的角色。 展示高级视频内容理解与生成。 模拟复杂交互和动态环境的潜力。

🔗 https://x.com/xiaohuggg/status/1758332220706828544...

6⃣️ 📺 OpenAI视频模型Sora技术报告: 视频生成模型作为世界模拟器。 支持不同宽高比的视频生成。 展示3D一致性、长期一致性等能力。

完整报告:Video generation models as world simulators

🔗 https://x.com/xiaohuggg/status/1758316094828511718...

7⃣️ 🔍 Meta推出V-JEPA: 自学习模拟物理世界。 不需人类监督或视频数据集标记。 预测视频内容,提高训练效率。

详细信息:https://ai.meta.com/blog/v-jepa-yann-lecun-ai-mode...

GitHub链接:GitHub - facebookresearch/jepa: PyTorch code and m...

🔗 https://x.com/xiaohuggg/status/1758310386728927724...

· 3 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🚀 Gemini Ultra 上线,Bard更名为Gemini: Gemini Ultra带来界面优化、Gemini Advanced付费计划。 提供复杂任务执行能力,如编程、逻辑推理。 即将推出Gemini APP,与Google应用集成。

🔗 https://gemini.google.com/updates

🔗 https://x.com/xiaohuggg/status/1755600097239536034...

2⃣️ 🤖 OpenAI开发新型代理软件: 代理软件通过控制设备自动完成任务。 支持文档数据转移到电子表格、自动填写费用报告。

🔗 https://x.com/xiaohuggg/status/1755587992067125449...

3⃣️ 🎶 Stability AI发布AudioSparx 1.0音乐模型: 高效生成长达95秒的立体声音乐。 支持可变长度音频输出和立体声渲染。 性能优于AudioLDM2和MusicGen。

🔗 https://arxiv.org/abs/2402.04825

🔗 GitHub - Stability-AI/stable-audio-tools: Generati...

🔗 GitHub - Stability-AI/stable-audio-metrics

🔗 stable-audio-demo

🔗 https://x.com/xiaohuggg/status/1755565282285015484...

4⃣️ 🔍 Vision Pro拆解揭示显示技术: 双显示屏分辨率和像素密度超高。 电池包复杂设计,提供高容量。 显示体验高密度,展示Apple技术领先。

🔗 Vision Pro Teardown Part 2: What’s the Display Res...

🔗 https://x.com/xiaohuggg/status/1755558069143306328...

5⃣️ 📢 最新版ChatGPT 4 System Prompt:

🔗 https://x.com/xiaohuggg/status/1755493510395109631...

6⃣️ 🤖 Archax操作型机器人详解: 总高度4.5米,重量3.5吨,26个关节自由度。 机器人/车辆模式,最高速度10km/h。 驾驶舱内部设有四面显示屏和九个摄像头。

🔗 https://x.com/xiaohuggg/status/1755445005739753592...

7⃣️ 🏥 CheXagent自动解读胸部X光图像: 自动分析胸部X光,生成放射学报告。 解读性能高效,超越通用和医疗领域模型。 支持多样化任务处理,如图像理解、问题回答。

🔗 CheXagent

🔗 [2401.12208] CheXagent: Towards a Foundation Model...

🔗 GitHub - Stanford-AIMI/CheXagent: [Arxiv-2024] Che...

🔗 https://x.com/xiaohuggg/status/1755434771994525928...

8⃣️ 🔊 MetaVoice-1B文本到语音转换模型: 1.2亿参数,10万小时语音数据训练。 支持情感语音节奏、跨语言语音克隆。 零样本克隆支持,适合长篇内容语音合成。

🔗 https://huggingface.co/metavoiceio/metavoice-1B-v0...

🔗 GitHub - metavoiceio/metavoice-src: AI for human-l...

🔗 TTS by MetaVoice

🔗 https://x.com/xiaohuggg/status/1755423130464772568...

· 3 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 📸 RMBG-1.4去除照片背景模型: 高精度背景去除,适用于电商、广告等场景。 支持视频背景批量去除,提供蒙版输出功能。 云端处理速度快,性能卓越。

🔗 GitHub - ZHO-ZHO-ZHO/ComfyUI-BRIA_AI-RMBG: Unoffic...

🔗 https://x.com/xiaohuggg/status/1755075272410538450...

2⃣️ 👨⚕️ Medivis的SurgicalAR手术应用: 将2D医疗图像转化为3D互动视觉,提高手术精度。 支持3D模型的放大、缩小、旋转,精确手术计划。

🔗 https://t.co/3tUvxB0L4I

🔗 https://x.com/xiaohuggg/status/1755183564021473404...

3⃣️ 🎨 DALL·E 3图像编辑器功能预告: 即将推出的功能,增强图像生成一致性。

🔗 https://x.com/xiaohuggg/status/1755173835396239826...

4⃣️ 📱 MiniCPM端侧大模型: 面壁智能与清华大学共同开发,支持手机端运行。 优于现有模型,提供流式输出速度。

🔗 https://x.com/xiaohuggg/status/1755140675270795646...

5⃣️ 🔥 Anything in Any Scene技术: 无缝插入任何物体至视频,保持自然融合。 特点包括物体准确放置、真实光照阴影模拟、风格一致性。

🔗 Anything in Any Scene

🔗 https://x.com/xiaohuggg/status/1755084128721277336...

6⃣️ 🗣️ Stability AI的新型文本到语音模型: 不需人声样本,通过文字描述生成声音。 特点包括高保真语音生成、自然语言控制、创造新声音。

🔗 text description to speech

🔗 https://arxiv.org/abs/2402.01912

🔗 https://x.com/xiaohuggg/status/1755062275000733905...

7⃣️ 👁️ OpenAI的DALL-E 3添加C2PA水印: 为AI生成图像添加水印,增加内容来源识别。 C2PA技术标准应用,提升媒体内容可信度。

🔗 https://c2pa.org

🔗 https://x.com/xiaohuggg/status/1755054688591073325...

· 3 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🌍 Google Bard全球更新: 支持Gemini Pro,覆盖40种语言、230多个国家和地区。 新增图像生成功能,基于Imagen 2模型,目前仅支持英语。 多语言双重检查功能,通过“G”图标验证Bard回答的准确性。 图像生成中加入可识别水印(SynthID)。

🔗 Google Bard update: Image generation and Gemini Pr...

2⃣️ 📷 JoyTag开源图像标注模型: 输出5000多个标签预测,无内容过滤,支持性正面内容。 基于ViT-B/16构建,输入尺寸448x448x3,9100万参数,训练样本660M。 适合多样化图像内容,特别优化Diffusion模型训练。

🔗 https://x.com/xiaohuggg/status/1753393342266916991...

3⃣️ 🎥 Wonder Studio摄像机追踪与点云技术: 自动识别摄像机移动和拍摄场景,精确CGI与实景融合。 包括摄像机追踪和点云技术,支持3D场景重建和CG元素自然移动。

🔗 https://x.com/xiaohuggg/status/1753386192224362950...

4⃣️ 🖼️ Google ImageFX工具: 基于Imagen 2,通过点击关键词合成提示词生成图片。 类似Google MusicFX操作体验。

🔗 https://aitestkitchen.withgoogle.com/tools/image-f...

🔗 https://x.com/xiaohuggg/status/1753376925773635616...

5⃣️ 🔧 InstructIR图像恢复工具: 根据文字描述改善图片,支持去噪、去雨、去模糊等。 使用NAFNet和指令条件块(ICB),支持多任务学习。

🔗 https://mv-lab.github.io/InstructIR/

🔗 [2401.16468] High-Quality Image Restoration Follow...

🔗 https://x.com/xiaohuggg/status/1753345751911198802...

6⃣️ 📝 InternLM-XComposer图文创作模型: 自由形式输入下的图文创作和理解,包含海量图文知识库。 支持图像识别、感知和视觉推理。

🔗 GitHub - InternLM/InternLM-XComposer: InternLM-XCo...

🔗 [2401.16420] InternLM-XComposer2: Mastering Free-f...

🔗 https://x.com/xiaohuggg/status/1753261066136752494...

7⃣️ 🎨 Poe Image Remix功能: 修改AI生成图片的风格、布局和颜色。 支持SDXL和Playground v2图像生成机器人,适用于Web、macOS、Windows,计划扩展到iOS和Android。 s 🔗 https://x.com/xiaohuggg/status/1753257680804946390...

· 2 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🔬OpenAI研究生物武器风险评估系统:

  • 开发评估系统以识别大型语言模型辅助生物武器制造的风险。
  • 研究了GPT-4在生物威胁创建任务中的影响。
  • 发现准确性和完整性有轻微提升,但影响有限。

🔗 https://openai.com/research/building-an-early-warning-system-for-llm-aided-biological-threat-creation

🔗 https://x.com/xiaohuggg/status/1753019124840874270?s=20

2⃣️ 🎮使用LLaMa开发的单词小游戏:

  • 有助于学英语,结合TTS技术提高互动性。
  • 结合AI生成图像,通过视觉辅助学习单词。
  • 提供试玩链接。

🔗 http://neal.fun/infinite-craft/

🔗 https://x.com/xiaohuggg/status/1753011273946849490?s=20

3⃣️ 🕹️Meta Quest3与Apple Vision Pro比较:

  • 价格差异明显,性价比高。
  • Quest 3提供良好的生态体验。

🔗 https://x.com/xiaohuggg/status/1752996560496206253?s=20

4⃣️ 🗣️ElevenLabs推出官方GPTs:

  • 提供文本到语音的转换服务。
  • 支持Jarvis以及经典男女声旁白。
  • 目前只支持英文。

🔗 https://chat.openai.com/g/g-h0lbLuFF1-elevenlabs-text-to-speech

🔗 https://x.com/xiaohuggg/status/1752978752907444367?s=20

5⃣️ 🎨Glif StyleHunter:创意Chrome扩展:

  • 在网页上选择图像,根据提示词生成混合风格图像。
  • 使用StableDiffusion技术,快速创造新艺术作品。

🔗 https://chromewebstore.google.com/detail/glif-style-hunter/abfbooehhdjcgmbmcpkcebcmpfnlingo?hl=en&authuser=0

🔗 https://x.com/xiaohuggg/status/1752948310032486687?s=20

6⃣️ 👤Media2Face:3D面部动画创造工具:

  • 根据声音生成同步的3D面部动画。
  • 允许个性化调整,如情感表达。
  • 应用于对话场景、情感歌唱等多种场合。

🔗 https://sites.google.com/view/media2face

🔗 https://arxiv.org/abs/2401.15687

🔗 https://x.com/xiaohuggg/status/1752871200303480928?s=20

· 4 min read
AJ

    星期一(2024.01.29)晚上,Midjourney首席执行官David Holz宣布发布Niji V6的方式与他通常宣布新模型的方式完全不同寻常。

Alt text

Niji模型专注于动漫风格的图像。但别被愚弄:它们不仅可用于动漫。
许多人更喜欢Niji模型,而不是标准的Midjourney模型,用于各种艺术任务。
那么Niji有什么新功能呢?

1.非常主观的默认风格

Holz表示,Niji V6的默认风格比以前的模型更强烈。由于其非常饱和的颜色,该默认风格相当独特。

通过使用--style raw参数关闭默认风格,您可以获得更具艺术性、多样化的结果。

Alt text
standing in concrete, brutalist futuristic city, fisheye perspective , faded pastel, intricate 1980 1990 anime retro nostalgia, painterly painted, oil masterpiece --ar 2:1 --s 90 --c 3 --style raw --niji 6
站在混凝土中,蛮荒未来城市,鱼眼透视,褪色的粉彩,错综复杂的1980年代和1990年代的动漫复古怀旧感,油画般的绘画杰作 --ar 2:1 --s 90 --c 3 --style raw --niji 6

是的,你也可以生成逼真的图像:

Alt text
realistic medium shot portrait photo of a german man with light skin and messy long blond hair --ar 16:9 --style raw --niji 6
一个德国男子的逼真中景肖像照片,皮肤白皙,头发凌乱而长,--ar 16:9 --style raw --niji 6

2.提高了提示理解

只需看看主题和风格理解在这个中的提升。

Alt text
astronaut walking through a quaint village with snowcapped mountains in the background, swiss mountains, oil painting by john singer sargent --ar 16:9 --niji 6
有如行星漫步般穿越一个宁静的村庄,雪山在背后耸立。瑞士的群山,由约翰·辛格·萨金特的油画绘制。

Alt text

这将让我们编写更长、更复杂的提示,准确描述我们想要的内容。

3.文本功能

和标准的 Midjourney V6 一样,Niji V6 中的文本功能得到了极大的改进。将文本用引号括起来,"像这样"。

Alt text
girl on porch lazily looking at city with speech bubbles "I'm so bored, what day is it?" --ar 2:1 --niji 6
女孩懒散地坐在阳台上,眼望着城市,口中冒出对话框:"我好无聊,今天是星期几?" --ar 2:1 --niji 6

4.图像的凝聚性

Niji系列模型生成的图像凝聚性是我在AI图像中见过的最好的之一。

这将是我制作印刷品和其他定制产品的首选。

同样,使用--style raw来减少不必要的细节和饱和度。

alt text
cute carrot character with vector lines, sticker design --style raw --niji 6
可爱的胡萝卜角色,矢量线条,贴纸设计 --style raw --niji 6
alt text
vector graphics chibi pygmy round blue jelly slime character --style raw --niji 6
矢量图形的迷你圆形蓝色果冻史莱姆角色 --style raw --niji 6

· 3 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🤖 微软和OpenAI对人形机器人的巨额投资:

  • 投资1亿美元于人形机器人公司Figure。
  • Figure 01展示了自主煮咖啡等能力。
  • 公司估值可能达到19亿美元。

🔗 https://x.com/xiaohuggg/status/1752673475058393116?s=20

2⃣️ 🔌 @MultiOn_AI:一个多功能AI代理:

  • 使用GPT进行网络操作,如订票和订餐。
  • 能自动安排Google会议和发推文。

🔗 https://x.com/xiaohuggg/status/1752617872931930435?s=20

3⃣️ 🏝️ 安圭拉岛:AI热潮带来的意外收益:

  • 通过“.ai”域名销售增长四倍。
  • 每月约300万美元收入用于偿还债务和取消税收。

🔗 https://spectrum.ieee.org/ai-domains

🔗 https://x.com/xiaohuggg/status/1752609992228897051?s=20

4⃣️ 🛒 使用Apple Vision Pro购买Cybertruck的新体验:

  • 展示了一种全新的线上购物体验。
  • 使用户足不出户即可感受购物震撼。

🔗 https://x.com/xiaohuggg/status/1752591353807303006?s=20

5⃣️ 🗣️ WhisperKit:实时语音推理转录Swift软件包:

  • 易于部署和实时语音转录。
  • 支持流式转录和性能优化。
  • 开源模型支持,便于更新和部署。

🔗 https://takeargmax.com/blog/whisperkit

🔗 https://x.com/xiaohuggg/status/1752545423074717859?s=20

6⃣️ 📱 MobileAgent:阿里巴巴的多模态AI代理:

  • 通过纯视觉解决方案模拟人类操作手机。
  • 无需系统代码,能完成多种任务。
  • 特点包括无需预训练,即插即用。

🔗 https://github.com/X-PLUG/MobileAgent

🔗 https://arxiv.org/abs/2401.16158

🔗 https://x.com/xiaohuggg/status/1752531832288231548?s=20

7⃣️ 🚶 马斯克展示擎天柱机器人的进步:

  • 步态更趋于人类,速度提升。
  • 展示第三代改进版本的测试。

🔗 https://x.com/xiaohuggg/status/1752523683586101663?s=20

8⃣️ 🧮 AutoMathText:200GB的数学文本数据集:

  • 适用于数学推理和生成模型。
  • 包含一个 200GB 的数学文本数据集
  • 以及一个200万个数学问题和答案的集合数据集

🔗 https://huggingface.co/datasets/math-ai/AutoMathText

🔗 https://x.com/xiaohuggg/status/1752511801391268208?s=20

· 2 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 🛠️ #AppleVisionPro 的创新设计工具:

  • 在VR和MR模式间无缝切换,超越2D设计局限。
  • 提供灵活的视角调整,优化设计互动。
  • 使用@ShapesXR工具,简化设计流程,无需3D设计技能。

🔗 https://x.com/xiaohuggg/status/1751202779501384052?s=20

2⃣️ 🗣️ DuckDB-NSQL-7B:文本到SQL转换:

  • DuckDB-NSQL-7B模型将自然语言转换成SQL代码。
  • 使非专业用户能轻松与数据库交互。
  • 基于大量真实和合成的DuckDB SQL查询训练。

🔗 https://github.com/NumbersStationAI/DuckDB-NSQL

🔗 https://x.com/xiaohuggg/status/1751081213459415164?s=20

3⃣️ 🌐 AI时代UX设计的新高标准 - Perplexity:

  • 应用Jakob Nielson的10个可用性原则,提升用户体验。
  • 强调以用户为中心的产品设计。
  • Perplexity成为AI产品中用户体验的典范。

原文:https://mttmr.com/2024/01/10/perplexitys-high-bar-for-ux-in-the-age-of-ai/

🔗 https://x.com/xiaohuggg/status/1751064514886594962?s=20

4⃣️ 🖼️ DALL·E 3的精细化图像控制:

  • 引入DALL·E Controls,提供更细致的图像调整选项。
  • 包括调整提示精度、选择风格、设定长宽比等。
  • 使用户能更精确地控制图片生成效果。

🔗 https://x.com/xiaohuggg/status/1751088219461189705?s=20

5⃣️ 🔗 ChatGPT新功能 - Mention:

  • 新增@功能,便于在聊天窗口直接召唤GPTs。
  • 无需切换窗口,简化多任务处理。
  • 支持显示最近使用的GPTs和通过搜索找到其他GPTs。

🔗 https://x.com/xiaohuggg/status/1751055137827946681?s=20

· 3 min read
AIBrain

🤯神秘人工智能链接🤯

(神秘链接可以指向任何与人工智能相关的内容。工具、模因、文章、视频等等……)

神秘按钮

✨✨✨✨✨✨✨✨

1⃣️ 👚Diffuse to Choose:在线购物“虚拟试穿”模型

  • 可以将商品放入任何环境中,与环境完美融合。
  • 例如,把椅子放进客厅照片,看实际效果。
  • 提高了在线购物体验,使产品在真实环境中的样子更清晰。

🔗 https://diffuse2choose.github.io

🔗 https://x.com/xiaohuggg/status/1750829664766198026?s=20

2⃣️ 🌐 Web LLM:在浏览器中运行大语言模型

  • 利用WebGPU加速,无需服务器,直接在浏览器运行。
  • 支持多种模型,如Llama 2 7B/13B等。
  • 可以降低成本,增强个性化和保护隐私。

🔗 https://webllm.mlc.ai

🔗 https://x.com/xiaohuggg/status/1750796204668342624?s=20

3⃣️ 🎨 SUPIR:图像修复模型

  • 通过增加参数数量提升修复能力。
  • 支持文本提示引导的图像修复。
  • 核心技术包括模型放大、多模态技术等。

🔗 https://supir.xpixel.group

🔗 https://x.com/xiaohuggg/status/1750706833751408858?s=20

4⃣️ 🤖 Adept Fuyu-Heavy:多模态数字代理模型

  • 世界第三大多模态模型,擅长理解用户界面。
  • 可以解释和操作各种软件和应用程序的界面。
  • 帮助执行任务如自动化流程、响应查询等。

🔗 https://x.com/xiaohuggg/status/1750704152605499508?s=20

5⃣️ 🔊 SpeechGPT-Gen:跨模态对话能力的大语言模型

  • 处理和生成语音数据,实现文本与语音的无缝对话。
  • 包含8亿参数,有效处理语义和知觉信息。

🔗 https://arxiv.org/abs/2401.13527

🔗 https://github.com/0nutation/SpeechGPT

🔗 https://x.com/xiaohuggg/status/1750694801517969900?s=20

6⃣️ 💡 OpenAI推出新一代嵌入模型

  • 新嵌入模型:text-embedding-3-small和text-embedding-3-large。
  • 新模型性能普遍优于上一代,特别是在多语言检索方面。
  • GPT-4 Turbo预览版模型更新,提高代码生成等任务的完成度。

🔗 https://x.com/xiaohuggg/status/1750688990104330481?s=20