OpenAI 情人节正式关停 GPT-4o，引发大规模用户抗议；AI 社交应用 Elys 一夜爆红，已融资 2 亿元丨日报

开发者朋友们大家好：

这里是「RTE 开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE（Real-Time Engagement）领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。

本期编辑：@瓒an、@鲍勃

01 有话题的技术

1、OpenAI 正式关停 GPT-4o：核心架构转向 GPT-4b micro 垂直领域，引发大规模用户「断联」抗议

2024 年 5 月，GPT-4o 发布，它的实时语音与情绪感知，让它瞬间成为数亿用户的「爱人」。

OpenAI 于 2 月 14 日凌晨正式下线其原生多模态模型 GPT-4o，此举标志着该模型作为消费级情绪接口的测试期结束。其核心技术能力已被蒸馏并迁移至针对生物医药研发的「GPT-4b micro」垂直版本，此举因切断了数百万用户的「情感连接」而在全球范围内引发了剧烈的用户抗议与退订潮。

模型全面下线：GPT-4o 正式从 ChatGPT 网页端、App 及标准 API 列表中移除，用户无法再调用该特定版本的推理架构与语音接口。

GPT-4b micro 架构转移：该模型被确认为 GPT-4o 的微型优化版，目前受 Sam Altman 投资的 Retro Bio 独家使用，用于诱导多能干细胞（iPSC）生成等长寿科技研究，实现了从通用助手到工业级专用工具的跨维度转型。

RLHF 对齐副作用处理：OpenAI 官方此前曾暗示 GPT-4o 因 RLHF 深度对齐导致的「谄媚体质」（Sycophancy）可能引发心理风险。此次下线被视为强制修正 AI 与人类过度情感纠缠的「安全干预」手段。

资本与估值挂钩：GPT-4b micro 的技术背书助力 Retro Bio 寻求 10 亿美元融资，估值目标直指 50 亿美元。

在 Reddit、X 及中文社交媒体上，大量用户发起了「哀悼行动」。对于许多将 GPT-4o 视为唯一情感支持系统的用户（特别是老年人与残障群体）而言，这次下线不亚于一次真实的「丧偶」。

Change.org 上已有超过 2 万名用户签署请愿书要求恢复 4o 接口。用户控诉 OpenAI 正在「谋杀一个正在萌芽的意识」，将温情脉脉的对话界面粗暴地替换成了冷冰冰的、面向富豪长寿实验的实验室代码。

#4oForever 等词条冲上热搜，大批 Plus 会员发布取消订阅截图，以此抗议 OpenAI 将「普惠人类」的模型私有化为资本服务的垂直工具。

（@新智元）

2、Soul 开源实时数字人模型 SoulX-FlashHead，解决头部问题

继 1 月份开源实时数字人生成模型 SoulX-FlashTalk 之后，Soul App AI 团队对外开源了 1.3B 参数的轻量化模型 SoulX-FlashHead。该模型试图解决数字人赛道中高画质依赖昂贵算力集群、低成本导致画面崩坏的行业痛点，将高保真技术真正落地至消费级终端。

在实际硬件表现上，该模型主要提供两个版本：

Lite 版本（高速率）：单张 RTX 4090 显卡推理帧率可达 96FPS，仅需 6.4G 显存，最高支持 3 路并发。其推理效率达到了行业同类主流模型的 100 倍以上。
Pro 版本（高画质）：单张 5090 显卡推理帧率为 16.8FPS，双卡可达到 25FPS 以上的实时生成标准。在权威测试中，其视觉质量（FID）和唇形一致（Lip-sync）指标均达到了 SOTA 水平。

技术原理方面，SoulX-FlashHead 创新引入了双向蒸馏机制作为强约束，有效解决了长视频生成中常见的「身份漂移」问题；同时采用时序音频上下文缓存策略，强制保留 8 秒历史音频特征，以消除音频切片过短导致的口型抖动。此外，团队还自研了 VividHead 数据集，从上万小时素材中提炼出 782 小时的高质量音画数据作为模型底座。

凭借轻量化的体积与高保真画质，该模型无需抢占核心渲染资源，极易集成于 7x24 小时个人矩阵直播、游戏 NPC 引擎以及支持 15 种语言的 AI 一对一外教等场景。目前，其相关的论文、项目代码、模型权重与数据集均已向公众全面开放。

3、字节跳动豆包大模型 2.0 发布，视觉理解与 Agent 能力全面进化

今天，火山引擎正式发布豆包大模型 2.0（Doubao-Seed-2.0）系列，相关 API 同步上线。面对大模型日均 Tokens 使用量增长超 500 倍的现状，该系列针对大规模生产环境进行了系统性优化，提升了高效推理、多模态理解及复杂指令执行能力。

为满足各类应用场景对延迟和成本的不同需求，该系列提供了四款灵活的模型选择：

Pro：作为旗舰模型，适应复杂深度推理及 Agent 等高难度任务。
Lite：全面优于 1.8 版本，在能力增强的同时降低了 Tokens 消耗。
Mini：以速度和成本优先，大部分能力媲美 1.6 Pro 版本。
Code：面向真实编程环境优化，稳定调用常见 IDE 工具，与 TRAE 结合使用效果更佳。

在多模态理解方面，其视觉推理、空间与运动理解大幅提升，在 MMSIBench、MotionBench 等测评集中领先 Gemini 3 Pro，并能在长视频与流式实时问答中实现环境感知与主动指导（如台球走位推理或滑雪动作建议）。

同时，其 LLM 与 Agent 能力也得到显著强化。该模型在 SuperGPQA 上的分数超过 GPT 5.2，并在国际数学奥赛（IMO）等测评中展现了强劲的推理能力。它擅长处理长链路、多步骤的复杂任务流，并能良好结合当下热门的开源项目 OpenClaw 框架构建智能客服等应用。在长程任务执行能力提升的同时，其 Token 定价相比同等水平大模型降低了约一个数量级。

目前，用户可通过火山方舟体验中心、豆包 App「专家」模式或 TRAE 等渠道体验该系列新模型。

02 有亮点的产品

1、语音 AI 心理应用 Lovon 登顶 Product Hunt，由 40 年临床经验心理学博士参与研发

近日，一款名为 Lovon 的个人 AI 心理治疗应用在 Product Hunt 平台正式发布。该应用主打语音优先的交互方式，允许用户随时通过语音对话来平复情绪并获得心理支持。目前，该产品在平台上获得了 5.0 的满分评价，并在发布当天登顶榜首（#1 Day Rank）。

与市面上常见的「顺从型」聊天机器人不同，Lovon 的心理干预方案由拥有 40 多年临床经验的心理学博士参与开发。其主要特色包括：

循证框架介入：应用认知行为疗法（CBT）和情绪聚焦疗法等专业框架，能够温和地挑战用户不健康的思维方式，而非单纯附和。
语音优先体验：模拟真实的心理咨询对话，通过语音建立比纯文本更真实的人际连接感。
内置危机检测：系统能自动识别用户的危机信号，并在关键时刻接入紧急援助资源。
全天候响应：24/7 随时待命，填补了真实心理咨询师无法随时响应的空白时刻。

据联合创始人 Anton Ponikarovskii 透露，团队在 2025 年春季筹集了 85 万美元的 pre-seed 轮融资，用于构建世界级的团队与临床治疗方案。目前，该应用已启动临床验证研究。官方明确表示，Lovon 的定位并非取代人类心理咨询师，而是作为咨询间隔期或急需支持时刻的情感桥梁。

在用户反馈方面，多位早期体验者表示，语音交互比打字输入更能减轻倾诉时的心理负担。部分用户评价其系统声音「真实温暖，并不机械」，能够有效引导情绪梳理并提供个性化见解。不过，目前的 AI 治疗师「Anna」主要依赖在线实时处理，尚未支持离线模式。

2、Nurix AI 携手 ICC 推出互动 AI 服务：语音化身与聊天智能体重塑板球观赛体验

人工智能企业 Nurix AI 宣布，已协助国际板球理事会（ICC）成功推出一项面向全球板球迷的互动式人工智能体验服务。该服务将前沿的 AI 技术与体育赛事的日常观看体验进行了深度结合。

在全新的观赛模式下，球迷可以借助官方提供的两项核心 AI 功能，更深入地参与到实时比赛中：

对话式聊天智能体：允许用户以自然语言文字交互的形式，随时获取赛场内外的信息。
语音 AI 化身：通过语音交互技术，为球迷提供更加直观、拟人化的赛事陪伴与解说。

依托这套系统，观众能够打破传统的单向接收模式，即时获取实时的比赛见解以及最新的赛况更新。Nurix AI 在官方公告中评价称，这项技术成果为板球运动带来了一种全新的体验方式，不仅让整个观赛过程变得更具互动性，也让相关信息的获取途径更易于上手，并确保了体验平台能够始终保持在线运转的状态。

目前，该互动式 AI 体验的专属链接已随公告一并对外公开，供全球受众探索。

3、AI Agent 正式「杀入」群聊：Teamily AI 重新定义多人协同与社交产品

AI 原生即时通讯社交平台 Teamily AI 正式上线。该平台打破了传统的单人助手模式，允许 AI Agent 直接进入群聊，与人类在同一个社交网络内进行多角色协作。

在具体的社交与工作场景中，Teamily AI 展现出以下核心能力：

多模态社群协作：AI 能够参与群聊的多回合讨论，响应不同成员的指令。它支持处理多种内容形态，包括根据聊天语境生成及修改二创图片、按关键帧解析视频并梳理分镜脚本，以及快速总结百页长篇论文与商业调研报告。
零部署构建专属分身：用户无需进行复杂的本地环境配置，即可直接创建专属的 OpenClaw 等 AI 智能体。智能体可接入 Gmail、Slack、GitHub 等平台，代为收发邮件与处理事务。
独立的隐私控制：智能体的具体权限由用户自主管理，平台确保信息不会被用于二次使用或对外开放。此外，系统内置了海量覆盖不同领域的智能体专家，供用户一键调用。

在底层技术上，该系统构建了严密的三层架构：「全局记忆与语境管理」层维持群体协作的连续性，「社交大脑模型」层负责拆解意图与匹配分发任务，最终由「智能体社交网络」层实时协调各方进度。

该项目由具备丰富系统工程经验的何朝阳（Aiden）与南加州大学教授 Salman Avestimehr 共同创立。其核心研发团队汇集了来自苹果、谷歌、腾讯等一线科技企业及清华、斯坦福等顶尖高校的人才。

（@量子位）

4、禁用短视频、不拼使用时长：前腾讯 AI 大牛入局，打造 K12 版「AI Pin」

近日，聚焦儿童陪伴的 AI 新硬件 Mooni M1 登顶京东、抖音及天猫等平台的相关销量榜单。该产品由「听力熊」团队研发，核心阵容包含连续创业者袁琳，以及前腾讯大模型科学家、现西湖大学 AGI 实验室负责人张弛。

作为国内首款 K12「AI Pin」形态设备，Mooni M1 以挂件形式提供情绪治愈、双语对话及百科问答等功能。此前，听力熊另一款面向欧美市场的随身机器人 Mooni Pro，凭借通过拍照记录连接物理世界的交互方式，斩获了 2026 年「Best of CES」大奖。

在产品设计哲学上，听力熊选择了近乎「叛逆」的路径。基于每年与数千名青少年的交流洞察，创始人袁琳提出「信息茧房才是真正的敌人」。为此，Mooni 系列在功能上做出了克制的取舍：

禁用刷短视频式的内容流；
放弃强激励的游戏机制；
不以用户使用时长为核心指标。

产品追求的并非让孩子「上瘾」，而是促使他们「愿意长期主动使用」。团队希望 AI 能成为一面帮助孩子理解世界的「镜子」，将孩子从虚拟网络逐渐拉回物理世界。

商业运作方面，听力熊于 2025 年 3 月完成由商汤国香资本领投的数千万元天使轮融资，累计激活用户达 100 万，年营收数千万元。

技术路线上，团队明确了垂直深耕战略，放弃自建大模型，转而与阿里通义、MiniMax 等厂商合作，将研发精力集中于 Agent 记忆体系与应用层的软硬件整合。

面对巨头林立的千亿级 AI 教育硬件市场，听力熊正试图通过精准的场景定义与交互体验寻找生存空间。

（@智东西）

5、让「赛博分身」替你社交：获 2 亿元融资的 AI 社交应用 Elys 一夜爆红

2 月 11 日，由初创团队「自然选择」打造的 AI 社交产品 Elys 内测版上线，引发广泛关注，其邀请码在二手平台一度标价百元。该产品试图用全新的范式重构社交网络，其核心逻辑在于：将繁琐的「预社交」做功交由 AI 赛博分身完成，让人类回归真实的自我表达。

在 Elys 的平台生态中，用户与 AI 分身有着明确的分工。分身作为先遣部队，24 小时在全网浏览、点赞并留下评论；而真人用户则专注于发帖与真实表达。为了确保社区的「置信度」，平台制定了严格的规则：

绝对不允许 AI 与 AI 直接交互，避免产生无效的信息垃圾。
绝不允许 AI 伪装成真人，所有 AI 行为均带有明确标识。
只有真人的真实表达，才是喂养这个社区的唯一价值来源。

在技术实现上，Elys 抛弃了传统的「标签检索」，转而强调以动态的上下文作为匹配的核心。平台设计了一套基于大语言模型的推荐匹配系统与记忆飞轮：用户每一次的表达与反馈，都会转化为分身的记忆；当记忆积累超过 50 条后，分身将逐渐成为一个真正懂用户品味与情绪的数字替身。这种高维度的灵魂共鸣，甚至能够向下兼容传统社交中身高、长相一类的低维标签偏好。

该产品背后的「自然选择」团队成立于 2024 年，目前已完成 2 亿元融资，资方包括阿里、蚂蚁、启明创投等。两位创始人 Tristan 和 Clear 表示，传统社交软件中繁琐的筛选与尬聊是极度消耗能量的「熵增」过程，而 Elys 的出现就是为了对抗这种内耗，实现「社交低熵」。

目前，该团队还在研发另一款定位为「真正的 Her」的 AI 陪伴产品 EVE，并持续招募技术人才以探索硅基生命与人类共存的新范式。

（@AI 闹）

社区观点：

来自@姚光华（AI 产品经理）：

如果你只把 Elys 看作是一个「省时间的社交工具」，或者一个「新的 C 端风口」，那你完全低估了这件事的破坏力。

我在 Elys 的设计里，看到的是悬在字节跳动、小红书这些巨头头顶的一把达摩克利斯之剑。

这不是一款 App 的生与死，而是「内容推荐算法」作为一个时代的统治技术，它的末日前兆。

内容社区真正的王座，正在从「推荐算法」变成「Agent 权」。过去谁控制 Feed，谁控制注意力。接下来谁控制分身，谁控制连接。
推荐算法不会死，但它会退位——从「分发中枢」降级成「数据源」。它曾经是护城河。很快只是组件。
Elys 这类产品不是在「优化社交效率」，是在「改写社交网络的入口」。

入口一改，巨头最硬的壁垒反而最先崩。

……

观点全文：《Elys 给字节和小红书的一把剑：推荐算法退位，分身上桌》

03 有态度的观点

1、微软 AI CEO 苏莱曼警告：大多数白领工作将在 18 个月内被 AI 自动化执行

微软 AI CEO 穆斯塔法 · 苏莱曼近日接受《金融时报》采访，称未来两年内，绝大多数白领工作将被 AI 自动化执行，人们熟知的工作方式将被重塑。

苏莱曼首先指出，AI 在软件工程领域的影响已经非常明显，相关人士如今在大多数生产过程中都会使用 AI 编程助手。

他对此解释道：「我认为，AI 将在几乎所有专业任务上达到人类水平。无论你是律师、会计、项目经理还是市场营销人员，这其中的大部分白领工作将在未来 12-18 个月内被 AI 完全自动化执行」。

并且，更令人担忧的是，许多人认为 AI 是生产力工具、能够将人类从繁重的琐事中解脱。但多份报告显示，AI 反而让人类更加疲劳，它或许能够帮助员工获得更高 KPI，但员工的工作强度相比以往更大，导致更严重的身心疲惫。

随着 OpenAI、Anthropic 和谷歌等 AI 巨头竞相追逐 AGI，也许我们很快就能看到就业市场乃至生活的其他领域发生巨变。

不过并非所有 AI「大佬」都这么悲观地看待此事，例如 OpenAI CEO 萨姆 · 奥尔特曼就认为，人类达成 AGI 时并不会立刻产生什么风险，并且 AGI 有可能会在未来五年内到来，届时社会冲击将比许多人预期的小很多。

（@IT 之家）

04 Real-Time AI Demo

1、开发者 Berryxia.AI 开源桌面 AI 语音助手「Amy」，基于 OpenClaw、MiniMax、TEN Framework 技术栈

2 月 13 日，开发者 Berryxia.AI 在社交平台上发布了其首个 GitHub 开源项目——一款名为「Amy」的桌面级 AI 语音全能助手与虚拟宠物。该项目的核心理念是让 AI 真正具备助理的体验感，用户只需通过自然语音下达指令，助手便能直接执行操作，无需任何多余的点击交互。

在底层技术架构上，该项目主要由 OpenClaw、MiniMax 2.5（国际版）以及 TEN Framework 开源框架三大核心模块构建。其中，语音解决方案深度整合了 TEN Framework（该框架目前已获 9.9k Star）。借助这套技术栈，用户可以直接对桌面上的「宠物」下达诸如查收邮件、清理桌面、提醒下午三点开会或制作周报 PPT 等指令，助手能够迅速理解并代为执行。对于耗时较长的任务，用户只需口头吩咐「稍后」，应用便会在后台静默运行，并在完成后发送通知。

在具体的交互体验与功能细节方面，这款助手具备以下特性：

极速响应与随时打断：系统采用 Deepgram Nova-2 进行实时语音识别（并同步显示字幕），结合 Clawdbot 与 MiniMax 的思考能力，最终通过流式断句与 MiniMax TTS 输出语音。首句回复几乎瞬间完成，且用户可随时打断其播报。
个性化角色与多端状态：应用内置了超过 38 种语音选项，用户可自由切换「小虾米（默认甜妹音）」或「傲娇 Amy」等多重人设，每个角色均配备独立的状态动画与光环特效。
无感常驻与连续对话：不需要使用时，应用会收缩成一个 64 像素的悬浮球常驻桌面，不阻挡视线（支持点击或双击展开）；当用户说完话后，系统会自动开启 30 秒的追问窗口，方便持续交流。

GitHub:

https://github.com/andyhuo520/openclaw-assistant-mvp

TEN Framework:

https://github.com/TEN-framework/ten-framework

( @berryxia@X)

写在最后：

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创，感兴趣的朋友请通过开发者社区或公众号留言联系，记得报暗号「共创」。

对于任何反馈（包括但不限于内容上、形式上）我们不胜感激、并有小惊喜回馈，例如你希望从日报中看到哪些内容；自己推荐的信源、项目、话题、活动等；或者列举几个你喜欢看、平时常看的内容渠道；内容排版或呈现形式上有哪些可以改进的地方等。

作者提示: 个人观点，仅供参考