对话智能体评估平台 Coval 获 2800 万美元 A 轮融资 丨日报

图片


开发者朋友们大家好:

这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@koki、@鲍勃


01 有话题的技术

1、米哈游创始人蔡浩宇 AI 团队开源 Agentopia:利用 100 智能体十年社交模拟,大模型拟人化提升 23.7%

图片


图片


Anuttacon 研究团队发布多智能体社会系统 Agentopia,模拟 100 个智能体在虚拟社区生活 10 年,以此生成高质量社交与行为数据。该研究通过闭环微调,在无需人工标注数据的前提下,显着提升了大模型的角色扮演与拟人性表现。


  • 引入「生活奖励」机制:定义代表人类幸福感的指标(涵盖社交、职业与成长维度),引导智能体自主进行周计划、社交与职业更新,解决了传统 AI 小镇仅模拟基础物理操作的局限性。

  • 涌现阶层固化与情绪劳动枯竭:10 年模拟数据显示,顶层 25% 富裕阶层次年留存率达 72%~79%,底层留存率同样偏高,呈现阶层固化特征;同时,高频泛社交智能体出现「情绪劳动枯竭」(活力值归零),需通过干预转向少数深度关系。

  • 闭环自我微调机制:提取前 25% 高成长智能体的模拟行为数据对底层大模型进行微调,微调后的大模型在外部测试中,拟人化程度提升 23.7%,角色忠诚度提升 16.4%,整体测试表现超越 Claude-4.5-Sonnet。

  • 存在单一模型自循环偏见:由于智能体的行为、环境及评分均由同一 Qwen 架构大模型驱动,系统存在幻觉与「既当裁判又当运动员」的自闭环问题,导致智能体在模拟后期出现行为过度趋同。同时,系统目前仍无法模拟人类的实时感知与即时反应。

  • 愿景指向高交互虚拟世界:该研究路径高度契合蔡浩宇团队构建高拟真虚拟世界的终极愿景,其技术迭代的核心优先级在于通过社会性模拟,强化智能体的角色扮演深度与拟人性,为下一代高智能 NPC 提供底层架构支撑。


(@游戏葡萄)


2、Gradium 推出 stt-translate 与 s2s-translate:支持自定义克隆声线的实时语音翻译工具

图片


Gradium 宣布推出实时语音转文本工具 stt-translate 与实时语音转语音工具 s2s-translate。该产品通过将传统的「语音转文本、文本翻译、文本转语音」三阶段级联简化为双阶段架构,在保障翻译质量的同时,实现了 3.0 秒的平均端到端延迟。该服务通过单一双工 WebSocket 连接传输,并允许用户在输出中无缝调用自定义克隆声线以保留说话人身份。


  • 双阶段极简架构:基于 Hibiki-Zero 架构并结合强化学习,将转录与翻译合并为单阶段处理(stt-translate),消除了独立文本翻译阶段的推理耗时与接口握手延迟。

  • 双工 WebSocket 与原生声音克隆:s2s-translate 整合了 stt-translate 与 Gradium TTS 模型,仅需单一 WebSocket 连接即可流式接收音频与翻译文本;接口强制要求传入 voice_id,支持调用官方声音目录或用户克隆的个性化声线。

  • 3.0 秒平均端到端延迟:在全语种实测中,s2s-translate 的平均延迟为 3.0s,优于 gpt-realtime-translate(3.6s),逼近 gemini-3.5-live-translate(2.9s)。

  • 5 国语言与 20 组互译矩阵:支持英语、法语、德语、西班牙语和葡萄牙语 5 种语言的任意双向互译。在 BLEU 与 MetricX 评估中,其翻译质量全面领先 gemini-3.5-live-translate,且 BLEU 指标优于 gpt-realtime-translate。


试用链接:https://gradium.ai/translate


( @Gradium.ai)


3、Google 在 Gemini 3.5 Flash 中原生集成 computer use 功能:支持跨端自动化与对抗性训练防御

Google 在其轻量级模型 Gemini 3.5 Flash 中原生集成了 computer use 功能,废弃了此前需依赖独立专用模型的架构。该更新允许开发者直接通过 Flash 模型构建跨浏览器、移动端和桌面端的自动化智能体,在大幅降低延迟和成本的同时,提供了企业级的抗提示词注入防护。

  • 原生内置免调用独立模型:将此前在 Gemini 2.5 中作为独立模型存在的计算机操作能力直接内置于 Gemini 3.5 Flash 主模型中,显著降低了多模型协同产生的调用延迟,并与原生的函数调用、谷歌搜索及地图数据对齐工具链深度整合。

  • 跨平台端到端图形用户界面操作:智能体能够直接理解并操作浏览器、移动端和桌面系统,执行多步骤的长链路复杂任务,适用于软件持续集成测试、跨应用数据处理等企业级工作流。

  • 专门对抗性训练与熔断机制:针对生产环境中的提示词注入风险,模型经过专门的针对性对抗性训练。同时引入两项可选的企业级安全机制:对敏感或不可逆操作强制进行人工确认,以及在检测到间接提示词注入时自动中止任务。

  • 对标前沿模型的性能表现:在 OnlineMind2Web 等行业基准测试中,Gemini 3.5 Flash 的操作准确率对准行业主流前沿模型,同时具备更高的吞吐量和更低的推理成本,满足大规模工程化部署要求


(@GoogleAIStudio@X)



02 有亮点的产品

1、Assort Health 获 1.2 亿美元 C 轮融资:发布专有模型 Synapse 与跨触点患者记忆系统

图片


医疗 AI 智能体平台 Assort Health 完成由 Menlo Ventures 领投的 1.2 亿美元 C 轮融资估值达 12 亿美元。该公司依托专有模型 Synapse,将语音 AI 智能体扩展为覆盖预约、转诊、付款等八大环节的医疗流程全自动闭环平台,在 15 个月内实现营收 20 倍增长。


  • 专有模型 Synapse 自动生成边缘用例:基于 1.9 亿次患者交互、6.2 万套诊疗协议及 160 万条决策路径构建的专科数据集,Synapse 可针对不同专科的复杂排班与诊疗规则,自动生成边缘情况的应对方案和模拟测试,保障复杂工作流的自动化解决率。


图片


  • Patient Journey Memory 实现跨触点状态留存:投入 7000 万美元专项研发资金,构建可在 Concierge(多语言分诊与排班)、Activate(主动外呼与缺口护理)、Orchestrate(病历写入)及 Empower(员工副驾驶)间共享的记忆层避免患者在不同环节重复陈述病史

  • 深度双向 EHR 集成与自动化写入:Orchestrate 模块支持将转诊单、入院信息及定制化就诊前后表单直接双向写入电子病历系统,消除了传统的物理活页夹与手动录入流程,降低行政负担

  • 临床部署实现 20% 预约量增幅:在骨科与皮肤科等复杂专科诊所的部署数据显示,该平台通过多语言接入与实时保险资格核验,帮助医疗机构提升 20% 以上的预约量,并接住了非工作时间的全部挂号需求。


(@深思圈)


2、语音与对话智能体评估平台 Coval 获 2800 万美元 A 轮融资:引入自动驾驶级仿真与评估技术,解决语音智能体落地信任瓶颈

语音与对话智能体评估平台 Coval 完成 2800 万美元 A 轮融资,由 Norwest VP 领投,Base10 Partners、Twilio Ventures 和 Y Combinator 等参投。该公司将自动驾驶领域的仿真与评估技术引入语音 AI 领域,旨在解决企业在大规模部署自主对话系统时的安全与信任难题。目前其评估方案已在 Deepgram、Perplexity 及 Zoom 等企业中落地。

  • 自动驾驶级仿真架构:将自动驾驶系统的多场景、高压力模拟测试方法论引入语音 AI 评估,通过构建可控的模拟交互环境对自主对话系统进行自动化边界测试,代替低效的人工抽样。

  • 前 Waymo 仿真专家领衔底层研发:创始团队引入了在 Waymo 拥有十年自动驾驶仿真系统建设经验的技术专家,主导 Coval 语音模拟底层架构的开发,确保仿真环境的拟真度与高并发运行能力。

  • 针对高风险业务场景的定量评估针对智能体在直接对接客户、处理真实交易等高风险场景中的失控隐患,平台提供量化的信任度度量体系,对智能体决策的稳定性和合规性进行系统性把关。

  • 主流语音与搜索技术栈兼容:该评估方案已深度融入 Deepgram(语音识别/合成)、Perplexity(检索问答)等主流 AI 服务商的生产流中,验证了其在跨多模态、低延迟场景下的兼容性。


(@bnicholehopkins@X)

3、Reachy Mini 发布对话应用 0.8.0:新增持久化长期记忆,支持本地 SmolVLM2 视觉与多模态实时 API

开源机器人 Reachy Mini 发布其对话应用 0.8.0 版本。该版本引入了跨重启保持的持久化长期记忆,并支持通过 fastrtc 调用 OpenAI Realtime 与 Gemini Live 等主流多模态实时 API。此外,应用新增端侧本地视觉选项,实现了低延迟的音视频实时交互与分层动作控制

  • 持久化长期记忆:支持通过语音指令要求机器人记住或遗忘特定信息。相关数据在应用重启后依然保留,实现了跨会话的上下文衔接;同时新增启动主动问候功能

  • 基于 fastrtc 的低延迟语音流:集成 fastrtc 协议实现低延迟音频双向流。支持三种后端:默认的 Hugging Face 接口(内置或本地端点)、OpenAI Realtime(gpt-realtime-2,需 API 密钥)以及 Gemini Live(gemini-3.1-flash-live-preview,需 API 密钥)。

  • 端侧本地视觉推理:在调用摄像头时,视觉处理默认使用云端多模态后端。开发者也可通过 --local-vision 参数启用本地运行的 SmolVLM2 模型,在本地 CPU、GPU 或 MPS 上完成视觉推理。

  • 分层运动控制与异步调度:采用分层运动架构,支持在队列中编排主动作(如舞蹈、表情、姿态、呼吸),同时融合语音响应式微晃和头部追踪。系统通过异步工具调度,将机器人运动控制、摄像头捕捉与头部追踪深度整合。

  • 配置化 Web UI:提供可选的 --ui 启动参数,支持在网页端进行机器人性格选择、麦克风控制和系统参数配置。


https://github.com/pollen-robotics/reachy_mini_conversation_app


( @GitHub、@ailozovskaya@X)




03 有态度的观点

1、EA 高管:AI 已提升工作室创造力,可减少开发流程阻力

图片


据 Eurogamer 报道,EA 企业发展总裁劳拉・米耶勒在日前 Summer Game Fest 期间的《Game Business Live》活动上表示,AI 工具已经在 EA 旗下工作室带来「真正的创造力提升」,部分环节或能缩短游戏开发周期。


在被问及 AI 工具的兴起是否会带来更短开发周期时,米耶勒称,部分环节「或许会」。她表示,自己一直希望帮助工作室开发者减少流程阻力,并协助他们打造职业生涯中的代表性作品。


AI 能够帮助我们减少管线、工具和工作流中的阻力,这一点令人兴奋。它移除了一些枯燥工作,我看到了更快的原型制作、更快的创意产出,以及围绕创意达成一致时更短、更高效的沟通。


米耶勒称,当开发过程中部分重复性任务被移除后,创意工作会出现「真正的提升」。


( @APPSO)


04 Real-Time AI Demo

1、开发者与语音智能体一起游玩交互式游戏「西蒙说」:利用 gpt-realtime-2 模型构建且响应延迟低于 100ms

开发者@jxnlco@X:


Computah! Activate Firewall!


使用 gpt-realtime-2,你可以根据具体情境来设定唤醒词、推理过程,甚至可以创建一些有趣的小游戏。


看看我玩「西蒙说」这个游戏的样子吧……


剧透:它打败了我。

(@jxnlco@X)



05 社区黑板报

招聘、项目分享、求助……任何你想和社区分享的信息,请联系我们投稿。(加微信 creators2022,备注「社区黑板报」)


1、活动推荐|「2026 AI 发现者峰会・新加坡站」

AI 的上半场,是能力;下半场,是生意。2024 到 2025 年,AI 赛道最大的变化不是模型又升级了,而是:能跑模型的公司一抓一大把,能跑通商业化的公司凤毛麟角。Demo 满天飞,收入见不着;融资见涨,现金流见跌。进入 2026 年,问题变了 —— AI 的问题,已经从「能不能做」,变成了「能不能赚钱」。


如何赚到第一笔 AI 收入?


企业级应用落地的真正场景在哪里?


从 Agent 到商业化跃迁,真正的护城河怎么建?


2026 年 6 月 30 日,崔牛会主办的 「2026 AI 发现者峰会 · 新加坡站」 将正式启幕。我们邀请了顶尖的 AI 实践者、出海先锋与东南亚本地生态伙伴,抛开宏大叙事,只聊最干的“赚钱硬道理”。


详情见链接:6 月 30 日,新加坡见

图片

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。


图片

作者提示: 个人观点,仅供参考

注册登录 后评论
    // 作者
    R
    @RTE_Dev_Comm
    还什么也没有写~
    • 0
    // 本帖子
    关键词
    // 相关帖子
    Coming soon...
    • 0
    对话智能体评估平台 Coval 获 2800 万美元 A 轮融资 丨日报RTRTE_Dev_Comm