对话智能体评估平台 Coval 获 2800 万美元 A 轮融资丨日报

开发者朋友们大家好：

这里是「RTE 开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE（Real-Time Engagement）领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。

本期编辑：@koki、@鲍勃

01 有话题的技术

1、米哈游创始人蔡浩宇 AI 团队开源 Agentopia：利用 100 智能体十年社交模拟，大模型拟人化提升 23.7%

Anuttacon 研究团队发布多智能体社会系统 Agentopia，模拟 100 个智能体在虚拟社区生活 10 年，以此生成高质量社交与行为数据。该研究通过闭环微调，在无需人工标注数据的前提下，显着提升了大模型的角色扮演与拟人性表现。

引入「生活奖励」机制：定义代表人类幸福感的指标（涵盖社交、职业与成长维度），引导智能体自主进行周计划、社交与职业更新，解决了传统 AI 小镇仅模拟基础物理操作的局限性。
涌现阶层固化与情绪劳动枯竭：10 年模拟数据显示，顶层 25% 富裕阶层次年留存率达 72%～79%，底层留存率同样偏高，呈现阶层固化特征；同时，高频泛社交智能体出现「情绪劳动枯竭」（活力值归零），需通过干预转向少数深度关系。
闭环自我微调机制：提取前 25% 高成长智能体的模拟行为数据对底层大模型进行微调，微调后的大模型在外部测试中，拟人化程度提升 23.7%，角色忠诚度提升 16.4%，整体测试表现超越 Claude-4.5-Sonnet。
存在单一模型自循环偏见：由于智能体的行为、环境及评分均由同一 Qwen 架构大模型驱动，系统存在幻觉与「既当裁判又当运动员」的自闭环问题，导致智能体在模拟后期出现行为过度趋同。同时，系统目前仍无法模拟人类的实时感知与即时反应。
愿景指向高交互虚拟世界：该研究路径高度契合蔡浩宇团队构建高拟真虚拟世界的终极愿景，其技术迭代的核心优先级在于通过社会性模拟，强化智能体的角色扮演深度与拟人性，为下一代高智能 NPC 提供底层架构支撑。

（@游戏葡萄）

2、Gradium 推出 stt-translate 与 s2s-translate：支持自定义克隆声线的实时语音翻译工具

Gradium 宣布推出实时语音转文本工具 stt-translate 与实时语音转语音工具 s2s-translate。该产品通过将传统的「语音转文本、文本翻译、文本转语音」三阶段级联简化为双阶段架构，在保障翻译质量的同时，实现了 3.0 秒的平均端到端延迟。该服务通过单一双工 WebSocket 连接传输，并允许用户在输出中无缝调用自定义克隆声线以保留说话人身份。

双阶段极简架构：基于 Hibiki-Zero 架构并结合强化学习，将转录与翻译合并为单阶段处理（stt-translate），消除了独立文本翻译阶段的推理耗时与接口握手延迟。
双工 WebSocket 与原生声音克隆：s2s-translate 整合了 stt-translate 与 Gradium TTS 模型，仅需单一 WebSocket 连接即可流式接收音频与翻译文本；接口强制要求传入 voice_id，支持调用官方声音目录或用户克隆的个性化声线。
3.0 秒平均端到端延迟：在全语种实测中，s2s-translate 的平均延迟为 3.0s，优于 gpt-realtime-translate（3.6s），逼近 gemini-3.5-live-translate（2.9s）。
5 国语言与 20 组互译矩阵：支持英语、法语、德语、西班牙语和葡萄牙语 5 种语言的任意双向互译。在 BLEU 与 MetricX 评估中，其翻译质量全面领先 gemini-3.5-live-translate，且 BLEU 指标优于 gpt-realtime-translate。

试用链接：https://gradium.ai/translate

( @Gradium.ai)

3、Google 在 Gemini 3.5 Flash 中原生集成 computer use 功能：支持跨端自动化与对抗性训练防御

Google 在其轻量级模型 Gemini 3.5 Flash 中原生集成了 computer use 功能，废弃了此前需依赖独立专用模型的架构。该更新允许开发者直接通过 Flash 模型构建跨浏览器、移动端和桌面端的自动化智能体，在大幅降低延迟和成本的同时，提供了企业级的抗提示词注入防护。

原生内置免调用独立模型：将此前在 Gemini 2.5 中作为独立模型存在的计算机操作能力直接内置于 Gemini 3.5 Flash 主模型中，显著降低了多模型协同产生的调用延迟，并与原生的函数调用、谷歌搜索及地图数据对齐工具链深度整合。
跨平台端到端图形用户界面操作：智能体能够直接理解并操作浏览器、移动端和桌面系统，执行多步骤的长链路复杂任务，适用于软件持续集成测试、跨应用数据处理等企业级工作流。
专门对抗性训练与熔断机制：针对生产环境中的提示词注入风险，模型经过专门的针对性对抗性训练。同时引入两项可选的企业级安全机制：对敏感或不可逆操作强制进行人工确认，以及在检测到间接提示词注入时自动中止任务。
对标前沿模型的性能表现：在 OnlineMind2Web 等行业基准测试中，Gemini 3.5 Flash 的操作准确率对准行业主流前沿模型，同时具备更高的吞吐量和更低的推理成本，满足大规模工程化部署要求。

(@GoogleAIStudio@X)

02 有亮点的产品

1、Assort Health 获 1.2 亿美元 C 轮融资：发布专有模型 Synapse 与跨触点患者记忆系统

医疗 AI 智能体平台 Assort Health 完成由 Menlo Ventures 领投的 1.2 亿美元 C 轮融资，估值达 12 亿美元。该公司依托专有模型 Synapse，将语音 AI 智能体扩展为覆盖预约、转诊、付款等八大环节的医疗流程全自动闭环平台，在 15 个月内实现营收 20 倍增长。

专有模型 Synapse 自动生成边缘用例：基于 1.9 亿次患者交互、6.2 万套诊疗协议及 160 万条决策路径构建的专科数据集，Synapse 可针对不同专科的复杂排班与诊疗规则，自动生成边缘情况的应对方案和模拟测试，保障复杂工作流的自动化解决率。

Patient Journey Memory 实现跨触点状态留存：投入 7000 万美元专项研发资金，构建可在 Concierge（多语言分诊与排班）、Activate（主动外呼与缺口护理）、Orchestrate（病历写入）及 Empower（员工副驾驶）间共享的记忆层，避免患者在不同环节重复陈述病史。
深度双向 EHR 集成与自动化写入：Orchestrate 模块支持将转诊单、入院信息及定制化就诊前后表单直接双向写入电子病历系统，消除了传统的物理活页夹与手动录入流程，降低行政负担。
临床部署实现 20% 预约量增幅：在骨科与皮肤科等复杂专科诊所的部署数据显示，该平台通过多语言接入与实时保险资格核验，帮助医疗机构提升 20% 以上的预约量，并接住了非工作时间的全部挂号需求。

（@深思圈）

2、语音与对话智能体评估平台 Coval 获 2800 万美元 A 轮融资：引入自动驾驶级仿真与评估技术，解决语音智能体落地信任瓶颈

语音与对话智能体评估平台 Coval 完成 2800 万美元 A 轮融资，由 Norwest VP 领投，Base10 Partners、Twilio Ventures 和 Y Combinator 等参投。该公司将自动驾驶领域的仿真与评估技术引入语音 AI 领域，旨在解决企业在大规模部署自主对话系统时的安全与信任难题。目前其评估方案已在 Deepgram、Perplexity 及 Zoom 等企业中落地。

自动驾驶级仿真架构：将自动驾驶系统的多场景、高压力模拟测试方法论引入语音 AI 评估，通过构建可控的模拟交互环境对自主对话系统进行自动化边界测试，代替低效的人工抽样。
前 Waymo 仿真专家领衔底层研发：创始团队引入了在 Waymo 拥有十年自动驾驶仿真系统建设经验的技术专家，主导 Coval 语音模拟底层架构的开发，确保仿真环境的拟真度与高并发运行能力。
针对高风险业务场景的定量评估：针对智能体在直接对接客户、处理真实交易等高风险场景中的失控隐患，平台提供量化的信任度度量体系，对智能体决策的稳定性和合规性进行系统性把关。
主流语音与搜索技术栈兼容：该评估方案已深度融入 Deepgram（语音识别/合成）、Perplexity（检索问答）等主流 AI 服务商的生产流中，验证了其在跨多模态、低延迟场景下的兼容性。

(@bnicholehopkins@X)

3、Reachy Mini 发布对话应用 0.8.0：新增持久化长期记忆，支持本地 SmolVLM2 视觉与多模态实时 API

开源机器人 Reachy Mini 发布其对话应用 0.8.0 版本。该版本引入了跨重启保持的持久化长期记忆，并支持通过 fastrtc 调用 OpenAI Realtime 与 Gemini Live 等主流多模态实时 API。此外，应用新增端侧本地视觉选项，实现了低延迟的音视频实时交互与分层动作控制。

持久化长期记忆：支持通过语音指令要求机器人记住或遗忘特定信息。相关数据在应用重启后依然保留，实现了跨会话的上下文衔接；同时新增启动主动问候功能。
基于 fastrtc 的低延迟语音流：集成 fastrtc 协议实现低延迟音频双向流。支持三种后端：默认的 Hugging Face 接口（内置或本地端点）、OpenAI Realtime（gpt-realtime-2，需 API 密钥）以及 Gemini Live（gemini-3.1-flash-live-preview，需 API 密钥）。
端侧本地视觉推理：在调用摄像头时，视觉处理默认使用云端多模态后端。开发者也可通过 --local-vision 参数启用本地运行的 SmolVLM2 模型，在本地 CPU、GPU 或 MPS 上完成视觉推理。
分层运动控制与异步调度：采用分层运动架构，支持在队列中编排主动作（如舞蹈、表情、姿态、呼吸），同时融合语音响应式微晃和头部追踪。系统通过异步工具调度，将机器人运动控制、摄像头捕捉与头部追踪深度整合。
配置化 Web UI：提供可选的 --ui 启动参数，支持在网页端进行机器人性格选择、麦克风控制和系统参数配置。

https://github.com/pollen-robotics/reachy_mini_conversation_app

( @GitHub、@ailozovskaya@X)

03 有态度的观点

1、EA 高管：AI 已提升工作室创造力，可减少开发流程阻力

据 Eurogamer 报道，EA 企业发展总裁劳拉・米耶勒在日前 Summer Game Fest 期间的《Game Business Live》活动上表示，AI 工具已经在 EA 旗下工作室带来「真正的创造力提升」，部分环节或能缩短游戏开发周期。

在被问及 AI 工具的兴起是否会带来更短开发周期时，米耶勒称，部分环节「或许会」。她表示，自己一直希望帮助工作室开发者减少流程阻力，并协助他们打造职业生涯中的代表性作品。

AI 能够帮助我们减少管线、工具和工作流中的阻力，这一点令人兴奋。它移除了一些枯燥工作，我看到了更快的原型制作、更快的创意产出，以及围绕创意达成一致时更短、更高效的沟通。

米耶勒称，当开发过程中部分重复性任务被移除后，创意工作会出现「真正的提升」。

( @APPSO)

04 Real-Time AI Demo

1、开发者与语音智能体一起游玩交互式游戏「西蒙说」：利用 gpt-realtime-2 模型构建且响应延迟低于 100ms

开发者@jxnlco@X：

Computah! Activate Firewall!

使用 gpt-realtime-2，你可以根据具体情境来设定唤醒词、推理过程，甚至可以创建一些有趣的小游戏。

看看我玩「西蒙说」这个游戏的样子吧……

剧透：它打败了我。

(@jxnlco@X)

05 社区黑板报

招聘、项目分享、求助……任何你想和社区分享的信息，请联系我们投稿。（加微信 creators2022，备注「社区黑板报」）

1、活动推荐｜「2026 AI 发现者峰会・新加坡站」

AI 的上半场，是能力；下半场，是生意。2024 到 2025 年，AI 赛道最大的变化不是模型又升级了，而是：能跑模型的公司一抓一大把，能跑通商业化的公司凤毛麟角。Demo 满天飞，收入见不着；融资见涨，现金流见跌。进入 2026 年，问题变了 —— AI 的问题，已经从「能不能做」，变成了「能不能赚钱」。

如何赚到第一笔 AI 收入？

企业级应用落地的真正场景在哪里？

从 Agent 到商业化跃迁，真正的护城河怎么建？

2026 年 6 月 30 日，崔牛会主办的「2026 AI 发现者峰会 · 新加坡站」将正式启幕。我们邀请了顶尖的 AI 实践者、出海先锋与东南亚本地生态伙伴，抛开宏大叙事，只聊最干的“赚钱硬道理”。

详情见链接：6 月 30 日，新加坡见

写在最后：

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创，感兴趣的朋友请通过开发者社区或公众号留言联系，记得报暗号「共创」。

对于任何反馈（包括但不限于内容上、形式上）我们不胜感激、并有小惊喜回馈，例如你希望从日报中看到哪些内容；自己推荐的信源、项目、话题、活动等；或者列举几个你喜欢看、平时常看的内容渠道；内容排版或呈现形式上有哪些可以改进的地方等。

作者提示: 个人观点，仅供参考

对话智能体评估平台 Coval 获 2800 万美元 A 轮融资丨日报

01 有话题的技术

1、米哈游创始人蔡浩宇 AI 团队开源 Agentopia：利用 100 智能体十年社交模拟，大模型拟人化提升 23.7%

2、Gradium 推出 stt-translate 与 s2s-translate：支持自定义克隆声线的实时语音翻译工具

3、Google 在 Gemini 3.5 Flash 中原生集成 computer use 功能：支持跨端自动化与对抗性训练防御

02 有亮点的产品

1、Assort Health 获 1.2 亿美元 C 轮融资：发布专有模型 Synapse 与跨触点患者记忆系统

2、语音与对话智能体评估平台 Coval 获 2800 万美元 A 轮融资：引入自动驾驶级仿真与评估技术，解决语音智能体落地信任瓶颈

3、Reachy Mini 发布对话应用 0.8.0：新增持久化长期记忆，支持本地 SmolVLM2 视觉与多模态实时 API

03 有态度的观点

1、EA 高管：AI 已提升工作室创造力，可减少开发流程阻力

04 Real-Time AI Demo

1、开发者与语音智能体一起游玩交互式游戏「西蒙说」：利用 gpt-realtime-2 模型构建且响应延迟低于 100ms

05 社区黑板报

1、活动推荐｜「2026 AI 发现者峰会・新加坡站」

分类

关键词

对话智能体评估平台 Coval 获 2800 万美元 A 轮融资 丨日报

01 有话题的技术

1、米哈游创始人蔡浩宇 AI 团队开源 Agentopia：利用 100 智能体十年社交模拟，大模型拟人化提升 23.7%

2、Gradium 推出 stt-translate 与 s2s-translate：支持自定义克隆声线的实时语音翻译工具

3、Google 在 Gemini 3.5 Flash 中原生集成 computer use 功能：支持跨端自动化与对抗性训练防御

02 有亮点的产品

1、Assort Health 获 1.2 亿美元 C 轮融资：发布专有模型 Synapse 与跨触点患者记忆系统

2、语音与对话智能体评估平台 Coval 获 2800 万美元 A 轮融资：引入自动驾驶级仿真与评估技术，解决语音智能体落地信任瓶颈

3、Reachy Mini 发布对话应用 0.8.0：新增持久化长期记忆，支持本地 SmolVLM2 视觉与多模态实时 API

03 有态度的观点

1、EA 高管：AI 已提升工作室创造力，可减少开发流程阻力

04 Real-Time AI Demo

1、开发者与语音智能体一起游玩交互式游戏「西蒙说」：利用 gpt-realtime-2 模型构建且响应延迟低于 100ms

05 社区黑板报

1、活动推荐｜「2026 AI 发现者峰会・新加坡站」

分类

关键词

对话智能体评估平台 Coval 获 2800 万美元 A 轮融资丨日报