工信部指导发布 AI 眼镜公约,要求本地化优先;作业帮布局健康穿戴与海外 AI 陪伴丨日报

图片


开发者朋友们大家好:

这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@koki、@鲍勃


01 有话题的技术

1、逻辑智能发布 SE-Bridge-TTS:基于 CosyVoice2 解决低资源语音合成退化,泰语、老挝语等跨语言提示合成准确率达 83.4%

图片


逻辑智能团队研发的低资源语音合成方案 SE-Bridge-TTS 已被 ICML 2026 接收。该方案基于 CosyVoice2 开源底座,通过构建 DGSA 与 TDSC 两套自对齐框架,系统性解决了低资源语种在合成数据扩容时面临的表现力退化问题。评测显示,该方案在泰语、老挝语的跨语言零样本声音克隆任务上达到 SOTA 水平。


  • 首次量化 Synthetic Erosion(合成侵蚀)效应:研究表明,合成数据并非越多越好。在泰语实验中,当合成数据比例超过 50% 后,虽然发音错误率持续下降,但由于合成语音分布平坦、熵值较低,模型继承自预训练底座的表现力遭到侵蚀,导致重复率大幅上升至 9.83%,自然度 MOS 降至 3.08。

  • DGSA 框架实现韵律-音色解耦自对齐:针对有少量真实参考语音的场景,利用流匹配模型天然的结构特性,通过控制 style token 生成「高表现力(高错误)」与「高稳定性(平淡)」的互补候选样本。以真实语音为正向锚点进行双目标 DPO 对齐训练,在 80% 高合成比例下成功恢复了语音的自然度与说话人相似度。

  • TDSC 框架实现极低资源自我修正:针对几无真实语音的极困难场景,通过多温度采样产生多元化候选,利用 ASR 过滤、长度及重复率校验构建自评判闭环。优质样本用于 SFT,差异样本用于 DPO 偏好学习。在老挝语实验中,该框架将 WER 从 38.5% 降至 29.8%,重复率由 7.62% 降至 4.15%。

  • FLEURS 跨语言提示合成指标达 SOTA:在「中文/英文提示音 → 老挝语/泰语目标语」的跨语言测试中,SE-Bridge-TTS 的校准合成准确率达到 83.4%,优于 Higgs Audio v3(78.2%)和 OmniVoice(75.9%),并实现了 1020 个测试样本的全语种覆盖。


https://github.com/InsiderX-Pro/video-translator


免费体验:https://luoji.cn/


(@机智流)


2、ElevenLabs 接入 SynthID 音频水印:首字节延迟零增加,支持抗裁剪压缩与 C2PA 标准

图片


ElevenLabs 宣布与 Google DeepMind 达成合作,在其生成的音频中直接嵌入 SynthID 数字水印技术。该技术可在不降低音频质量、不增加生成延迟的前提下,为 AI 生成音频引入抗篡改的隐式标识,并配套上线了免费的音频检测器(ElevenLabs Audio Detector)供公众验证。


  • 首字节延迟零增加:引入 SynthID 水印算法后,音频生成服务的首字节延迟(TTFB)保持零增加,且水印在人耳听觉频域完全不可闻,不造成任何听感上的音质损失。

  • 高鲁棒性防篡改能力:该数字水印直接隐式嵌入音频波形数据中。即使音频经历裁剪、变速、有损压缩、去除元数据、改变文件格式等常见编辑操作,水印仍能被精准提取,且无法被伪造或复制到非 ElevenLabs 生成的音频中。

  • 发布免费 ElevenLabs Audio Detector配套上线免费检测网页,替代原有的 AI 语音分类器。该工具利用 SynthID 识别机制,支持公众直接上传音频,核验其是否源自 ElevenLabs 平台。

  • 兼容 C2PA 软绑定标准:方案符合多国监管对 AI 生成内容需具备「机器可读标记」的合规要求。团队计划将 SynthID 引入 C2PA 软绑定列表,确保音频即使在内容凭证被恶意擦除后,仍能重新关联并恢复原始归属元数据。

( @elevenlabs)


02 有亮点的产品

1、Fika Jobs 获 400 万美元种子前轮融资:利用 Gemini 驱动的视频智能体自动生成结构化面试画像

图片


瑞典招聘平台 Fika Jobs 获得 400 万美元种子前轮融资,投资方包括 Luminar Ventures 及 King 联合创始人。该平台利用 Gemini 模型驱动的视频智能体与求职者进行 10 分钟交互面试,并自动将面试过程切片生成结构化视频档案。此举旨在通过 AI 智能体前置初筛流程,颠覆传统的简历投递与筛选模式。


  • Gemini 驱动的个性化面试:平台接入 Gemini 模型,自动分析求职者的 LinkedIn 背景数据并生成定制化面试问题,由视频智能体与求职者进行约 10 分钟的音视频实时交互面试。

  • 自动化视频切片建档:面试完成后,系统自动将候选人的视频回答分割为结构化的短视频片段,并整理为动态个人画像,供雇主直接检索,无需候选人针对不同岗位重复申请。

  • 10% 首年年薪佣金模式:该平台对求职者免费,仅在雇主成功录用后收取候选人首年年薪的 10% 作为服务费,低于传统猎头 20% 至 30% 的费率标准。

  • 视频招聘的偏见与合规挑战:与传统盲筛简历不同,视频首选模式会将候选人的外貌、年龄、口音及族裔提前暴露给雇主,在提升筛选效率的同时,增加了合规性与主观偏见风险。


( @TechCrunch)


2、作业帮布局健康穿戴与海外 AI 陪伴:招聘智能穿戴产品经理主导 PPG 与 ECG 软硬件方案,出海 AI 陪伴项目瞄准 Z 世代女性

图片


图片


作业帮近期释放多个核心岗位招聘,重点布局智能健康穿戴设备与海外 AI 情感陪伴业务。其中,智能穿戴产品线正从教育场景向健康、运动监测领域延伸,而海外 AI 陪伴项目则定位 Z 世代女性用户群。此举旨在通过软硬件技术升级与垂直应用出海,拓展其非教育类的软硬件业务版图


  • 集成 PPG 与 ECG 传感技术:新型智能穿戴产品将聚焦心率、血氧、心电、血压等健康及运动监测指标。产品经理需主导结合 PPG 与 ECG 等核心传感技术的软硬件一体化方案设计及量产交付。

  • 硬件定位转向健康与医疗级:该岗位要求候选人具备 5 年以上硬件经验,优先考虑拥有可穿戴类医疗器械从业经验、出海 3C 消费电子背景,或主导过智能眼镜、耳机等爆款硬件研发运营经验的人才。

  • 手腕场景产品线的升级转型:作业帮自 2022 年起布局手腕场景,曾推出支持表体拆卸、主打碎片化学习的 X9、K9 及 X9 Pro 学习手表。本次健康监测传感器的引入,意味着其穿戴硬件正从教育安全定位向通用健康监测设备升级

  • 开辟海外 AI 陪伴第二曲线:同步招聘的海外女性向陪伴类产品总监,负责面向海外 Z 世代女性情感场景的 AI 产品。招聘信息透露,其团队所属中心目前已运营有一款全球前三(Top 3)的 AI 陪伴类产品。


(@多知)


3、工信部指导发布《AI 眼镜可信视界自律公约》:不得超范围收集获取用户个人信息,本地化优先处理

图片


中国信通院 6 月 25 日宣布,在工业和信息化部信息通信管理局的指导下,中国信息通信研究院泰尔终端实验室联合深圳市 AI 眼镜产业联盟研究起草了《AI 眼镜可信视界自律公约》(以下简称《公约》),得到产业链上下游企业的积极响应。


《公约》发布仪式在 2026 人工智能眼镜生态大会(深圳)上举行。工业和信息化部信息通信管理局设备处、中国信通院、深圳市 AI 眼镜产业联盟,以及雷鸟创新、立讯精密、Rokid、莫界、千问、明智云、芯视佳、亿道、影目、中兴通讯的相关负责人,共同见证了《公约》的正式发布。


信通院泰尔终端实验室副主任果敢指出,随着人工智能技术与增强现实技术的深度融合,AI 眼镜作为下一代智能计算终端,正以前所未有的速度走进大众生活。音视频采集模组的广泛应用使得用户隐私保护面临考验,AI 算法的复杂性与不透明性,也引发了公众对技术可控性的深度关切,同时海量数据的采集、传输与处理,对全链路数据合规治理提出了更高要求。AI 眼镜正从「看得见」走向「看得懂」,从单一工具进化为智能伙伴,技术进步必须以信任为基石,产业发展必须以安全为前提。


IT之家整理主要内容如下:


《AI 眼镜可信视界自律公约》(主要条款)


第一章用户隐私守护


第一条最小必要原则


各签署单位承诺,在 AI 眼镜产品设计与开发过程中,严格遵循数据采集的“最小必要”原则。仅采集实现产品核心功能所必需的用户数据,不得超范围收集、滥用或变相获取用户个人信息。对于摄像头、麦克风等敏感传感器的数据采集,必须提供明确的启用提示与用户授权机制,确保用户知情权与选择权。


第二条透明告知义务


承诺以清晰、易懂、完整的方式向用户告知数据收集的目的、范围、方式及存储期限。隐私政策应避免冗长晦涩的技术术语,采用分层展示结构,确保普通用户能够充分理解其数据将如何被使用。涉及第三方数据共享的,须明确告知接收方身份、共享目的及用户退出机制。


第三条用户自主控制


产品须为用户提供便捷、有效的数据管理工具,包括但不限于:一键查看已采集数据、随时撤回授权、批量删除历史数据、导出个人数据副本等功能。用户撤回授权后,相关数据采集行为应立即停止,已采集数据应按照约定及时删除或匿名化处理。


第四条生物特征保护


对于虹膜识别、面部特征、声纹等生物特征数据的采集与使用,须采取最高级别的安全保护措施。生物特征原始数据原则上应在本地设备处理,确需上传服务器的,必须经过加密传输与加密存储,且不得用于产品功能以外的任何目的。


第二章终端技术可控


第五条算法可解释性


承诺持续提升 AI 算法的透明度与可解释性。对于涉及用户权益的关键决策(如内容推荐、身份验证、风险提示等),应提供可理解的决策依据说明。建立算法影响评估机制,定期审视算法可能带来的偏见与歧视风险,及时采取纠正措施。


第六条本地化优先处理


倡导“端侧智能、隐私优先”的技术路线。在算力允许的前提下,优先在设备端完成数据处理与分析,减少原始数据向云端传输。对于必须在云端处理的数据,应采用联邦学习、安全多方计算等隐私增强技术,实现“数据可用不可见”。


第七条安全更新机制


建立完善的安全漏洞发现与修复机制。对于已知安全漏洞,应在合理时间内发布补丁更新;对于可能影响用户隐私的重大安全事件,应在确认后 72 小时内向主管部门报告,并在 7 日内通知受影响用户。产品生命周期内持续提供安全更新支持,不得低于 5 年。


第八条开源与标准化


积极参与 AI 眼镜相关技术标准与安全规范的制定工作。鼓励在保障商业机密的前提下,开放安全相关的技术接口与测试工具,接受第三方安全审计。支持行业建立统一的安全评估框架与认证体系,推动安全能力的共建共享。


第三章全链数据合规


第九条数据分类分级


建立覆盖数据全生命周期的分类分级管理制度。按照数据敏感程度与重要性,划分为一般数据、重要数据、核心数据三个等级,分别制定差异化的采集、存储、使用、传输、删除策略。涉及个人信息处理的,严格遵守《个人信息保护法》等法律法规要求。


第十条跨境传输合规


数据出境活动严格遵循《数据出境安全评估办法》等相关规定。涉及个人信息出境的,须通过安全评估、标准合同备案或个人信息保护认证等法定途径。向用户明确告知数据跨境传输的目的、接收方所在国家 / 地区及当地数据保护水平。


第十一条供应链安全管理


将数据安全要求延伸至供应链各环节。对硬件供应商、软件开发商、云服务商等合作伙伴建立安全评估与准入机制,在合同中明确数据保护责任与义务。定期开展供应链安全审计,确保全链条数据安全措施的有效落实。


第十二条应急响应体系


建立数据安全事件应急响应机制,制定分级响应预案。发生数据泄露、篡改、丢失等安全事件时,立即启动应急响应流程,采取技术措施防止损害扩大,按照规定向监管部门报告,并及时告知受影响用户。定期开展应急演练,持续提升响应能力。


第四章监督与发布


第十三条自查与审计


定期开展全面的数据合规自查,鼓励引入独立第三方机构开展年度安全审计。


第十四条动态修订


本公约根据产业发展与技术进步需要,定期进行评估与修订。


第十五条发布生效


本公约自发布之日起生效。我们呼吁更多企业加入本公约,共同守护用户隐私、保障技术可控、维护数据合规,携手共建可信、透明、可持续的 AI 眼镜产业生态。


(@IT 之家)



4、章鱼动力完成 5000 万美元融资:推行 SYNTH 「手脑一体」架构,引入肌电信号与车规双目重构 WM2 物理世界模型

图片


图片


物理 AI 基础设施公司章鱼动力宣布完成 5000 万美元新一轮融资,近 3 个月累计融资额近 10 亿元人民币。资金将用于加速研发基于 SYNTH 架构的「手脑一体」平台及 WM2 阶段物理世界基础模型,推动具身智能从受限场景跨任务通用(L3)向开放场景通用操作(L4)演进


  • 聚焦 WM2 阶段世界模型与 L4 级物理 AI:公司技术路线锁定在具备强宏观物理建模能力的 WM2 阶段,目标是使模型从「预测下一帧画面」跳转为「预测物理状态与行动因果」;以此推动具身智能跨越单任务泛化,向家庭等非结构化开放场景下的 L4 级通用操作演进。

  • SYNTH 架构构建数据与推演闭环:该架构由负责操作数据沉淀的 SYNData、学习物理因果的 SYNWorld 以及执行策略转化的 SYNAction 组成,实现从真实数据、物理建模到执行的完整闭环

  • 首次引入高密度肌电信号规避视觉遮挡:在 SYNData 数据体系中提出 Bio2Robot 理念,通过大模型将人体生物学信号转换为机器人可用数据。高密度肌电信号能够捕捉视觉难以观测的接触力度与发力细节,弥补了单一视觉方案的力控死角。


计划于 2026 年下半年发布物理基础模型并推出核心产品,目前下一轮 5 亿元人民币的融资也已接近完成。


(@AI 科技评论)


03 有态度的观点

1、李飞飞:10 年后,职场或只剩两类工作者

图片


在日前的 Silicon Valley Girl 访谈中,美国国家工程院院士、World Labs 创始人李飞飞围绕 AI 对未来职场的影响表示,面对一种认知能力快速提升的技术,个人最需要培养的是「agency」,即主动理解、使用并驾驭工具的能力


她认为,AI 不应被简单视为取代人类的技术,而是一种需要被人类学习、设计和约束的强大工具。


面对这样一种认知能力很强的技术,agency 是关键。在谈到未来 10 年的公司形态时,李飞飞以产品经理为例称,过去产品经理通常需要在用户、市场、设计师和工程师之间协调,完成一个原型可能需要数月;现在,部分产品经理已经可以借助 AI 完成初步设计和代码编写,缩短从想法到反馈的周期。她强调,这并不意味着设计师和工程师会被取代,而是让他们有机会投入更复杂的工作


访谈中,MasterClass CEO David Rogier 将这一变化概括为职场的「杠铃效应」:一端是某一领域能力极强的顶尖专业人士,另一端是能够借助 AI 完成多类任务的高主动性通才。


李飞飞对此表示认同,并补充称,无论处在专家还是通才的位置,核心都在于是否具备主动使用工具、形成判断并创造性解决问题的能力


( @APPSO)

图片

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。


图片

作者提示: 个人观点,仅供参考

注册登录 后评论
    // 作者
    R
    @RTE_Dev_Comm
    还什么也没有写~
    • 0
    // 本帖子
    关键词
    // 相关帖子
    Coming soon...
    • 0
    工信部指导发布 AI 眼镜公约,要求本地化优先;作业帮布局健康穿戴与海外 AI 陪伴丨日报RTRTE_Dev_Comm