AI 录音初创 Plaud 累计出货超 200 万台 AI 硬件，订阅业务 ARR 突破 1 亿美元丨日报

开发者朋友们大家好：

这里是「RTE 开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE（Real-Time Engagement）领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。

本期编辑：@koki、@鲍勃

01 有话题的技术

1、清华大学发布 AgentSociety²：引入双角色智能体架构与 CodeGenRouter，实现文献检索至论文 PDF 生成的全流程闭环

清华大学研究团队提出面向可执行社会科学的一体化研究环境 AgentSociety²。该系统首次将负责组织研究流程的「AI 社会科学家」与在虚拟环境中行动的「硅基参与者」整合于同一运行环境中，打通了文献检索、假设生成、实验配置、仿真运行、数据分析到论文写作的完整科研闭环，使社会科学实验从单点 AI 辅助迈向人机协同的系统化自动执行。

「心智-记忆-行动」技能化架构：硅基参与者由传统的提示词角色扮演升级为具备观察、认知、计划、记忆四类内置技能的生成式社会智能体，在 ReAct 循环中执行决策，并通过文件系统式独立工作区（workspace）记录状态与行为轨迹，实现长期仿真的可追踪与回放。
分级上下文压缩机制：针对长时程仿真中的窗口限制，系统引入上下文分级压缩策略：轻度压力下清理低价值历史，中度压力下生成结构化摘要，高度压力下启用滚动摘要，并将完整线程写入工作区日志，解决 LLM 窗口漂移并保留完整审计链。
CodeGenRouter 与语义缓存：智能体化环境利用代码生成路由器（CodeGenRouter）将智能体的自然语言意图通过 AST 解析转化为安全的可执行代码；系统对高频观察和统计类请求采用预生成和语义缓存机制，并支持通过继承基础环境类、添加工具装饰器等方式轻量化接入第三方模拟器。
文献驱动的自动化科研工作流：AI 社会科学家工作流依托内置的 2 万余篇顶刊文献数据库（及 arXiv、OpenAlex 等外部接口）自动生成结构化假设包，经由「研究语义层-可执行配置层」分层设计驱动仿真，最终通过多视角审查智能体与质量门控直接编译生成论文 PDF 草稿。
智能体化数据基础设施：构建了包含数据集资产包、在线注册表及本地数据集技能的数据底座，将人口统计、价值偏好、历史行为等异构数据转化为可被智能体及实验配置主动调用的标准化研究资产。
官网：https://agentsociety2.fiblab.net/
论文：https://agentsociety2.fiblab.net/paper/AgentSociety2.pdf
GitHub: https://github.com/tsinghua-fib-lab/agentsociety/

（社区投稿@数据科学与智能实验室）

02 有亮点的产品

1、ZuzuZoos 查无此园获数千万元 Pre-A 轮融资：发布 3-4 自由度仿生交互与长期记忆系统的 AI 潮玩

科技潮玩品牌 ZuzuZoos 查无此园完成数千万元 Pre-A 轮融资，由锦秋基金领投。该公司推出了首款结合仿生硬件、定制音频与长期记忆系统的便携式 AI 陪伴潮玩，通过软硬件一体化设计提供高情绪价值交互。

3-4 个仿生自由度控制：硬件设备支持多点触控物理反馈，触摸爪部可触发折耳倾听或握手动作，触摸腹部可实现拥抱交互，以低时延的物理形变提供具身交互感。
100+ 独立定制声音系统：由游戏音频团队开发，为每个 IP 形象配置了超 100 种符合特定人设的专有声音与口癖，通过非机械化的声音曲线传递喜怒哀乐。
长期记忆与游戏化体验：软件端构建了长期记忆系统用以沉淀互动信任；产品弃用传统订阅制，交互体验采用游戏化任务与情景剧逐步解锁机制，模拟外星生物从牙牙学语到流畅对话的成长过程。
轻量化硬件配件扩展：未来计划推出可穿戴硬件扩展模块，允许用户通过外接配件为 AI 实体叠加听觉、视觉等多模态识别能力，以低研发成本实现硬件功能迭代。

（@极客公园）

2、时空壶发布 X1 Meeting：支持 5 语种 10 向同传，引入骨声纹双介质拾音技术

时空壶推出多语、多向、多人同传 AI 终端 X1 Meeting，专为跨国多语种会议场景设计。该终端通过自研硬件与 Babel OS，实现了单场会议最高 20 人、5 种语言、10 向同传互译的能力，显著降低了多语种会议的转译延迟与人工同传部署成本。

骨声纹与气导双介质拾音：通过骨传导采集颅骨震动提取声纹特征锁定发言人，结合气导麦克风补充高频细节，在 85 分贝噪音环境下实现 98% 的语音识别准确率。
支持 5 语 10 向与 20 人并行同传：单台设备网络支持最大 20 人本地互联，兼容 52 种语言及 106 种口音；旁听观众可通过扫描二维码接入，实现单人提问、多路并行翻译并分发至不同语言通道。
Babel OS 搭载 VAD 与语义分割：系统融合语音活动检测与 AI 语义分割技术，动态判断发言停顿并自动进行长句分割，平衡翻译的上下文准确度与实时响应延迟。
垂直领域词库与本地化安全：内置并支持下载超 4300 个行业专业词库（覆盖金融、医疗、法律、制造等），数据传输采用端到端加密，会议记录仅在本地保留以保障数据隐私。

（@酷玩实验室）

3、《粉雄救兵》生活教练卡拉莫·布朗推出健康应用 Kē：基于 Delphi 技术构建数字克隆，计划引入智能体自动配置功能

知名电视人卡拉莫·布朗联合 AI 初创公司 Delphi 推出个人健康应用 Kē。该应用利用 Delphi 提供的数字克隆技术，复刻布朗的声音、语调及知识库，为用户提供实时的个性化健康咨询与方案调整。

基于 Delphi 平台的数字克隆架构：Kē 的核心功能「AI Karamo」通过接入 Delphi 平台，导入布朗的采访、播客及视频等非结构化数据进行微调与训练，实现高度拟真的语音合成与文本交互。
基于用户数据的动态方案调整：应用支持根据用户现有的健身器材、日程安排及家中食材，通过内置 AI 聊天机器人实时重构并下发个性化健身与营养膳食计划。
规划引入智能体架构：Delphi 计划未来为 Kē 引入智能体功能，使其能够直接越过对话界面，代替用户在应用后台自动执行任务（如直接修改和配置「我的计划」标签页内容）。
数据隐私与安全监管机制：用户与数字克隆体的交互数据将流向 Delphi 平台；为防范大模型幻觉与安全风险，后台配有专门的人工监督团队及安全保障机制。

已在 iOS 与 Android 平台上线，提供 3 天免费试用，后续订阅费用为每月 14.99 美元。

( @TechCrunch)

4、健康科技公司 Clair Health 获 1160 万美元融资：推出搭载 10 生物传感器的无创激素监测穿戴设备

斯坦福大学毕业生创立的健康科技公司 Clair Health 宣布完成 1160 万美元融资，由 Khosla Ventures 领投。该公司推出了一款专为女性健康设计的无创可穿戴设备，通过集成新型硬件传感器与专用 AI 模型，实现实时、连续的激素波动监测，旨在替代传统的抽血检测。

10 生物传感器与新型 biomagnetic 传感器架构：区别于仅依赖陀螺仪、光学 PPG 和温度传感器的传统智能手表，该设备集成了 10 个生物传感器，其中包括一种用于获取激素波动特征的新型 biomagnetic 传感器，实现无创、连续的生理数据采集。
语音标志物周期检测 AI 模型：该设备在用户引导阶段通过几分钟的语音对话交互，利用自研的语音标志物分析模型，即可评估并确定用户当前所处的生理周期阶段。
基于数百万 EHR 数据的多模态预测模型：Clair Health 正通过数据合作引入数百万份电子健康档案（EHR）及纵向健康数据，训练其自研的多标志物预测模型，以提供针对子宫内膜异位症、经前不悦症（PMDD）及围绝经期的健康洞察。
四阶段连续追踪算法：该系统不依赖单一经期首日数据，而是连续监测月经周期的四个完整阶段，实时输出衰老速率、炎症水肿程度及主观体力感觉（RPE）等关联指标。

(@TechCrunch)

5、Plaud 累计出货超 200 万台 AI 硬件，订阅业务 ARR 突破 1 亿美元

AI 录音硬件初创公司 Plaud 宣布其无屏幕智能录音设备累计出货量已突破 200 万台。得益于高比例的硬件用户转化为付费订阅用户，该公司软件订阅业务的年度经常性收入（ARR）已突破 1 亿美元，在 AI 硬件商业化方向上完成了闭环。

硬件驱动的订阅转化率达 50%：Plaud 暂不提供独立的软件订阅，其 1 亿美元的 ARR 完全由硬件设备持有者贡献。用户购买 179 美元的硬件设备仅能获得每月 300 分钟的免费转录额度，目前约有 50% 的活跃设备用户选择付费升级至专业版或无限制版订阅方案。
桌面端与多端产品矩阵落地：除 Plaud Pro 和新款 Plaud Pin S 挂扣式硬件外，Plaud 于今年发布了桌面端应用，支持通过捕获系统音频直接录制在线会议并生成 Granola 风格的会议纪要。
推出 Plaud Teams 进军企业级市场：上月推出面向企业级协作的 Plaud Teams，引入「共享记忆」功能，支持团队成员共享会议转录文本与总结摘要。
赛道竞争格局加剧：在 AI 会议记录硬件领域，Plaud 目前面临安克创新（Anker）、传音控股支持的 Viaim、红杉中国支持的 Vibe 以及 YC 支持的 Pocket 等多方竞品的直接竞争。

（@TechCrunch）