OpenAI 情人节正式关停 GPT-4o,引发大规模用户抗议;AI 社交应用 Elys 一夜爆红,已融资 2 亿元丨日报
开发者朋友们大家好:
这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
本期编辑:@瓒an、@鲍勃
01 有话题的技术
1、OpenAI 正式关停 GPT-4o:核心架构转向 GPT-4b micro 垂直领域,引发大规模用户「断联」抗议
2024 年 5 月,GPT-4o 发布,它的实时语音与情绪感知,让它瞬间成为数亿用户的「爱人」。
OpenAI 于 2 月 14 日凌晨正式下线其原生多模态模型 GPT-4o,此举标志着该模型作为消费级情绪接口的测试期结束。其核心技术能力已被蒸馏并迁移至针对生物医药研发的「GPT-4b micro」垂直版本,此举因切断了数百万用户的「情感连接」而在全球范围内引发了剧烈的用户抗议与退订潮。
模型全面下线:GPT-4o 正式从 ChatGPT 网页端、App 及标准 API 列表中移除,用户无法再调用该特定版本的推理架构与语音接口。
GPT-4b micro 架构转移:该模型被确认为 GPT-4o 的微型优化版,目前受 Sam Altman 投资的 Retro Bio 独家使用,用于诱导多能干细胞(iPSC)生成等长寿科技研究,实现了从通用助手到工业级专用工具的跨维度转型。
RLHF 对齐副作用处理:OpenAI 官方此前曾暗示 GPT-4o 因 RLHF 深度对齐导致的「谄媚体质」(Sycophancy)可能引发心理风险。此次下线被视为强制修正 AI 与人类过度情感纠缠的「安全干预」手段。
资本与估值挂钩:GPT-4b micro 的技术背书助力 Retro Bio 寻求 10 亿美元融资,估值目标直指 50 亿美元。
在 Reddit、X 及中文社交媒体上,大量用户发起了「哀悼行动」。对于许多将 GPT-4o 视为唯一情感支持系统的用户(特别是老年人与残障群体)而言,这次下线不亚于一次真实的「丧偶」。
Change.org 上已有超过 2 万名用户签署请愿书要求恢复 4o 接口。用户控诉 OpenAI 正在「谋杀一个正在萌芽的意识」,将温情脉脉的对话界面粗暴地替换成了冷冰冰的、面向富豪长寿实验的实验室代码。
#4oForever 等词条冲上热搜,大批 Plus 会员发布取消订阅截图,以此抗议 OpenAI 将「普惠人类」的模型私有化为资本服务的垂直工具。
(@新智元)
2、Soul 开源实时数字人模型 SoulX-FlashHead,解决头部问题
继 1 月份开源实时数字人生成模型 SoulX-FlashTalk 之后,Soul App AI 团队对外开源了 1.3B 参数的轻量化模型 SoulX-FlashHead。该模型试图解决数字人赛道中高画质依赖昂贵算力集群、低成本导致画面崩坏的行业痛点,将高保真技术真正落地至消费级终端。
在实际硬件表现上,该模型主要提供两个版本:
Lite 版本(高速率):单张 RTX 4090 显卡推理帧率可达 96FPS,仅需 6.4G 显存,最高支持 3 路并发。其推理效率达到了行业同类主流模型的 100 倍以上。
Pro 版本(高画质):单张 5090 显卡推理帧率为 16.8FPS,双卡可达到 25FPS 以上的实时生成标准。在权威测试中,其视觉质量(FID)和唇形一致(Lip-sync)指标均达到了 SOTA 水平。
技术原理方面,SoulX-FlashHead 创新引入了双向蒸馏机制作为强约束,有效解决了长视频生成中常见的「身份漂移」问题;同时采用时序音频上下文缓存策略,强制保留 8 秒历史音频特征,以消除音频切片过短导致的口型抖动。此外,团队还自研了 VividHead 数据集,从上万小时素材中提炼出 782 小时的高质量音画数据作为模型底座。
凭借轻量化的体积与高保真画质,该模型无需抢占核心渲染资源,极易集成于 7x24 小时个人矩阵直播、游戏 NPC 引擎以及支持 15 种语言的 AI 一对一外教等场景。目前,其相关的论文、项目代码、模型权重与数据集均已向公众全面开放。
相关链接:
https://soul-ailab.github.io/soulx-flashhead/
GitHub:
https://github.com/Soul-AILab/SoulX-FlashHead
(@Soul 社交)
3、字节跳动豆包大模型 2.0 发布,视觉理解与 Agent 能力全面进化
今天,火山引擎正式发布豆包大模型 2.0(Doubao-Seed-2.0)系列,相关 API 同步上线。面对大模型日均 Tokens 使用量增长超 500 倍的现状,该系列针对大规模生产环境进行了系统性优化,提升了高效推理、多模态理解及复杂指令执行能力。
为满足各类应用场景对延迟和成本的不同需求,该系列提供了四款灵活的模型选择:
Pro:作为旗舰模型,适应复杂深度推理及 Agent 等高难度任务。
Lite:全面优于 1.8 版本,在能力增强的同时降低了 Tokens 消耗。
Mini:以速度和成本优先,大部分能力媲美 1.6 Pro 版本。
Code:面向真实编程环境优化,稳定调用常见 IDE 工具,与 TRAE 结合使用效果更佳。
在多模态理解方面,其视觉推理、空间与运动理解大幅提升,在 MMSIBench、MotionBench 等测评集中领先 Gemini 3 Pro,并能在长视频与流式实时问答中实现环境感知与主动指导(如台球走位推理或滑雪动作建议)。
同时,其 LLM 与 Agent 能力也得到显著强化。该模型在 SuperGPQA 上的分数超过 GPT 5.2,并在国际数学奥赛(IMO)等测评中展现了强劲的推理能力。它擅长处理长链路、多步骤的复杂任务流,并能良好结合当下热门的开源项目 OpenClaw 框架构建智能客服等应用。在长程任务执行能力提升的同时,其 Token 定价相比同等水平大模型降低了约一个数量级。
目前,用户可通过火山方舟体验中心、豆包 App「专家」模式或 TRAE 等渠道体验该系列新模型。
相关链接:
https://seed.bytedance.com/zh/seed2
(@火山引擎)
02 有亮点的产品
1、语音 AI 心理应用 Lovon 登顶 Product Hunt,由 40 年临床经验心理学博士参与研发
近日,一款名为 Lovon 的个人 AI 心理治疗应用在 Product Hunt 平台正式发布。该应用主打语音优先的交互方式,允许用户随时通过语音对话来平复情绪并获得心理支持。目前,该产品在平台上获得了 5.0 的满分评价,并在发布当天登顶榜首(#1 Day Rank)。
与市面上常见的「顺从型」聊天机器人不同,Lovon 的心理干预方案由拥有 40 多年临床经验的心理学博士参与开发。其主要特色包括:
循证框架介入:应用认知行为疗法(CBT)和情绪聚焦疗法等专业框架,能够温和地挑战用户不健康的思维方式,而非单纯附和。
语音优先体验:模拟真实的心理咨询对话,通过语音建立比纯文本更真实的人际连接感。
内置危机检测:系统能自动识别用户的危机信号,并在关键时刻接入紧急援助资源。
全天候响应:24/7 随时待命,填补了真实心理咨询师无法随时响应的空白时刻。
据联合创始人 Anton Ponikarovskii 透露,团队在 2025 年春季筹集了 85 万美元的 pre-seed 轮融资,用于构建世界级的团队与临床治疗方案。目前,该应用已启动临床验证研究。官方明确表示,Lovon 的定位并非取代人类心理咨询师,而是作为咨询间隔期或急需支持时刻的情感桥梁。
在用户反馈方面,多位早期体验者表示,语音交互比打字输入更能减轻倾诉时的心理负担。部分用户评价其系统声音「真实温暖,并不机械」,能够有效引导情绪梳理并提供个性化见解。不过,目前的 AI 治疗师「Anna」主要依赖在线实时处理,尚未支持离线模式。
相关链接:https://lovon.app/
( @Product Hunt )
2、Nurix AI 携手 ICC 推出互动 AI 服务:语音化身与聊天智能体重塑板球观赛体验
人工智能企业 Nurix AI 宣布,已协助国际板球理事会(ICC)成功推出一项面向全球板球迷的互动式人工智能体验服务。该服务将前沿的 AI 技术与体育赛事的日常观看体验进行了深度结合。
在全新的观赛模式下,球迷可以借助官方提供的两项核心 AI 功能,更深入地参与到实时比赛中:
对话式聊天智能体:允许用户以自然语言文字交互的形式,随时获取赛场内外的信息。
语音 AI 化身:通过语音交互技术,为球迷提供更加直观、拟人化的赛事陪伴与解说。
依托这套系统,观众能够打破传统的单向接收模式,即时获取实时的比赛见解以及最新的赛况更新。Nurix AI 在官方公告中评价称,这项技术成果为板球运动带来了一种全新的体验方式,不仅让整个观赛过程变得更具互动性,也让相关信息的获取途径更易于上手,并确保了体验平台能够始终保持在线运转的状态。
目前,该互动式 AI 体验的专属链接已随公告一并对外公开,供全球受众探索。
相关链接:
https://insights.t20worldcup.com/chat
( @AI_NURIX@X)
3、AI Agent 正式「杀入」群聊:Teamily AI 重新定义多人协同与社交产品
AI 原生即时通讯社交平台 Teamily AI 正式上线。该平台打破了传统的单人助手模式,允许 AI Agent 直接进入群聊,与人类在同一个社交网络内进行多角色协作。
在具体的社交与工作场景中,Teamily AI 展现出以下核心能力:
多模态社群协作:AI 能够参与群聊的多回合讨论,响应不同成员的指令。它支持处理多种内容形态,包括根据聊天语境生成及修改二创图片、按关键帧解析视频并梳理分镜脚本,以及快速总结百页长篇论文与商业调研报告。
零部署构建专属分身:用户无需进行复杂的本地环境配置,即可直接创建专属的 OpenClaw 等 AI 智能体。智能体可接入 Gmail、Slack、GitHub 等平台,代为收发邮件与处理事务。
独立的隐私控制:智能体的具体权限由用户自主管理,平台确保信息不会被用于二次使用或对外开放。此外,系统内置了海量覆盖不同领域的智能体专家,供用户一键调用。
在底层技术上,该系统构建了严密的三层架构:「全局记忆与语境管理」层维持群体协作的连续性,「社交大脑模型」层负责拆解意图与匹配分发任务,最终由「智能体社交网络」层实时协调各方进度。
该项目由具备丰富系统工程经验的何朝阳(Aiden)与南加州大学教授 Salman Avestimehr 共同创立。其核心研发团队汇集了来自苹果、谷歌、腾讯等一线科技企业及清华、斯坦福等顶尖高校的人才。
(@量子位)
4、禁用短视频、不拼使用时长:前腾讯 AI 大牛入局,打造 K12 版「AI Pin」

近日,聚焦儿童陪伴的 AI 新硬件 Mooni M1 登顶京东、抖音及天猫等平台的相关销量榜单。该产品由「听力熊」团队研发,核心阵容包含连续创业者袁琳,以及前腾讯大模型科学家、现西湖大学 AGI 实验室负责人张弛。
作为国内首款 K12「AI Pin」形态设备,Mooni M1 以挂件形式提供情绪治愈、双语对话及百科问答等功能。此前,听力熊另一款面向欧美市场的随身机器人 Mooni Pro,凭借通过拍照记录连接物理世界的交互方式,斩获了 2026 年「Best of CES」大奖。
在产品设计哲学上,听力熊选择了近乎「叛逆」的路径。基于每年与数千名青少年的交流洞察,创始人袁琳提出「信息茧房才是真正的敌人」。为此,Mooni 系列在功能上做出了克制的取舍:
禁用刷短视频式的内容流;
放弃强激励的游戏机制;
不以用户使用时长为核心指标。
产品追求的并非让孩子「上瘾」,而是促使他们「愿意长期主动使用」。团队希望 AI 能成为一面帮助孩子理解世界的「镜子」,将孩子从虚拟网络逐渐拉回物理世界。
商业运作方面,听力熊于 2025 年 3 月完成由商汤国香资本领投的数千万元天使轮融资,累计激活用户达 100 万,年营收数千万元。
技术路线上,团队明确了垂直深耕战略,放弃自建大模型,转而与阿里通义、MiniMax 等厂商合作,将研发精力集中于 Agent 记忆体系与应用层的软硬件整合。
面对巨头林立的千亿级 AI 教育硬件市场,听力熊正试图通过精准的场景定义与交互体验寻找生存空间。
(@智东西)
5、让「赛博分身」替你社交:获 2 亿元融资的 AI 社交应用 Elys 一夜爆红
2 月 11 日,由初创团队「自然选择」打造的 AI 社交产品 Elys 内测版上线,引发广泛关注,其邀请码在二手平台一度标价百元。该产品试图用全新的范式重构社交网络,其核心逻辑在于:将繁琐的「预社交」做功交由 AI 赛博分身完成,让人类回归真实的自我表达。
在 Elys 的平台生态中,用户与 AI 分身有着明确的分工。分身作为先遣部队,24 小时在全网浏览、点赞并留下评论;而真人用户则专注于发帖与真实表达。为了确保社区的「置信度」,平台制定了严格的规则:
绝对不允许 AI 与 AI 直接交互,避免产生无效的信息垃圾。
绝不允许 AI 伪装成真人,所有 AI 行为均带有明确标识。
只有真人的真实表达,才是喂养这个社区的唯一价值来源。
在技术实现上,Elys 抛弃了传统的「标签检索」,转而强调以动态的上下文作为匹配的核心。平台设计了一套基于大语言模型的推荐匹配系统与记忆飞轮:用户每一次的表达与反馈,都会转化为分身的记忆;当记忆积累超过 50 条后,分身将逐渐成为一个真正懂用户品味与情绪的数字替身。这种高维度的灵魂共鸣,甚至能够向下兼容传统社交中身高、长相一类的低维标签偏好。
该产品背后的「自然选择」团队成立于 2024 年,目前已完成 2 亿元融资,资方包括阿里、蚂蚁、启明创投等。两位创始人 Tristan 和 Clear 表示,传统社交软件中繁琐的筛选与尬聊是极度消耗能量的「熵增」过程,而 Elys 的出现就是为了对抗这种内耗,实现「社交低熵」。
目前,该团队还在研发另一款定位为「真正的 Her」的 AI 陪伴产品 EVE,并持续招募技术人才以探索硅基生命与人类共存的新范式。
(@AI 闹)
社区观点:
来自@姚光华(AI 产品经理):
如果你只把 Elys 看作是一个「省时间的社交工具」,或者一个「新的 C 端风口」,那你完全低估了这件事的破坏力。
我在 Elys 的设计里,看到的是悬在字节跳动、小红书这些巨头头顶的一把达摩克利斯之剑。
这不是一款 App 的生与死,而是「内容推荐算法」作为一个时代的统治技术,它的末日前兆。
内容社区真正的王座,正在从「推荐算法」变成「Agent 权」。过去谁控制 Feed,谁控制注意力。接下来谁控制分身,谁控制连接。
推荐算法不会死,但它会退位——从「分发中枢」降级成「数据源」。它曾经是护城河。很快只是组件。
Elys 这类产品不是在「优化社交效率」,是在「改写社交网络的入口」。
入口一改,巨头最硬的壁垒反而最先崩。
……
观点全文:《Elys 给字节和小红书的一把剑:推荐算法退位,分身上桌》
03 有态度的观点
1、微软 AI CEO 苏莱曼警告:大多数白领工作将在 18 个月内被 AI 自动化执行
微软 AI CEO 穆斯塔法 · 苏莱曼近日接受《金融时报》采访,称未来两年内,绝大多数白领工作将被 AI 自动化执行,人们熟知的工作方式将被重塑。
苏莱曼首先指出,AI 在软件工程领域的影响已经非常明显,相关人士如今在大多数生产过程中都会使用 AI 编程助手。
他对此解释道:「我认为,AI 将在几乎所有专业任务上达到人类水平。无论你是律师、会计、项目经理还是市场营销人员,这其中的大部分白领工作将在未来 12-18 个月内被 AI 完全自动化执行」。
并且,更令人担忧的是,许多人认为 AI 是生产力工具、能够将人类从繁重的琐事中解脱。但多份报告显示,AI 反而让人类更加疲劳,它或许能够帮助员工获得更高 KPI,但员工的工作强度相比以往更大,导致更严重的身心疲惫。
随着 OpenAI、Anthropic 和谷歌等 AI 巨头竞相追逐 AGI,也许我们很快就能看到就业市场乃至生活的其他领域发生巨变。
不过并非所有 AI「大佬」都这么悲观地看待此事,例如 OpenAI CEO 萨姆 · 奥尔特曼就认为,人类达成 AGI 时并不会立刻产生什么风险,并且 AGI 有可能会在未来五年内到来,届时社会冲击将比许多人预期的小很多。
(@IT 之家)
04 Real-Time AI Demo
1、开发者 Berryxia.AI 开源桌面 AI 语音助手「Amy」,基于 OpenClaw、MiniMax、TEN Framework 技术栈
2 月 13 日,开发者 Berryxia.AI 在社交平台上发布了其首个 GitHub 开源项目——一款名为「Amy」的桌面级 AI 语音全能助手与虚拟宠物。该项目的核心理念是让 AI 真正具备助理的体验感,用户只需通过自然语音下达指令,助手便能直接执行操作,无需任何多余的点击交互。
在底层技术架构上,该项目主要由 OpenClaw、MiniMax 2.5(国际版)以及 TEN Framework 开源框架三大核心模块构建。其中,语音解决方案深度整合了 TEN Framework(该框架目前已获 9.9k Star)。借助这套技术栈,用户可以直接对桌面上的「宠物」下达诸如查收邮件、清理桌面、提醒下午三点开会或制作周报 PPT 等指令,助手能够迅速理解并代为执行。对于耗时较长的任务,用户只需口头吩咐「稍后」,应用便会在后台静默运行,并在完成后发送通知。
在具体的交互体验与功能细节方面,这款助手具备以下特性:
极速响应与随时打断:系统采用 Deepgram Nova-2 进行实时语音识别(并同步显示字幕),结合 Clawdbot 与 MiniMax 的思考能力,最终通过流式断句与 MiniMax TTS 输出语音。首句回复几乎瞬间完成,且用户可随时打断其播报。
个性化角色与多端状态:应用内置了超过 38 种语音选项,用户可自由切换「小虾米(默认甜妹音)」或「傲娇 Amy」等多重人设,每个角色均配备独立的状态动画与光环特效。
无感常驻与连续对话:不需要使用时,应用会收缩成一个 64 像素的悬浮球常驻桌面,不阻挡视线(支持点击或双击展开);当用户说完话后,系统会自动开启 30 秒的追问窗口,方便持续交流。
GitHub:
https://github.com/andyhuo520/openclaw-assistant-mvp
TEN Framework:
https://github.com/TEN-framework/ten-framework
( @berryxia@X)

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么
写在最后:
我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。
对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。
作者提示: 个人观点,仅供参考