网信办拟禁止 AI 模拟老年人亲属,并增设防沉迷系统;豆神学伴机器人切入多模态作业陪写场景丨日报
开发者朋友们大家好:
这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
本期编辑:@瓒an、@鲍勃
01 有话题的技术
1、生数科技联合清华发布 TurboDiffusion,推动视频生成迈入「实时生成」时代
近日,生数科技与清华大学 TSAIL 实验室联合发布并开源视频生成加速框架 TurboDiffusion。
在几乎不影响生成质量的前提下,该框架可实现最高达 200 倍的视频生成推理加速。TurboDiffusion 并非单一优化,而是通过多项前沿加速技术的系统化组合:
低比特注意力加速 采用 SageAttention 将注意力的计算执行在低比特的 Tensor Core 上,以无损且数倍地加速注意力计算。
稀疏-线性注意力加速 采用可训练的稀疏注意力 Sparse-Linear Attention (SLA) 进行注意力的稀疏加速,最高可在 SageAttention 的基础上进一步实现 17-20 倍的注意力稀疏加速。
采样步数蒸馏加速 通过目前最先进的蒸馏方法 rCM,让模型仅用 3-4 步即可完成高质量的视频生成。
线性层加速 将模型的线性层中的参数以及激活都进行 8 比特的 128x128 的块粒度量化,即通过 W8A8 不仅加速模型的线性层计算,也大幅减少了模型的显存占用。
具体来说,在开源视频生成模型上,以 1.3B/14B 的图生视频以及文生视频模型为例,TurboDiffusion 在单张 RTX 5090 显卡条件下,实现了 100 倍至最高 200 倍 的端到端生成加速。代码与模型全部开源,可一键生成。
在高质量视频生成场景下,生成 1080P 分辨率、8 秒时长视频的生成时间从约 900 秒压缩至约 8 秒,真正实现了从「分钟级」到「秒级」的跨越。
Github:
https://github.com/thu-ml/TurboDiffusion
( @APPSO)
2、意大利 AGCM 勒令 Meta 暂停 WhatsApp 禁令:第三方通用 AI 聊天机器人重获 API 接入权
意大利竞争管理局「AGCM」发布临时禁令,强制「Meta」暂停拟于 2025 年 1 月生效的新规。该新规原计划禁止第三方通用 AI 聊天机器人通过「WhatsApp Business API」进行分发,监管机构认为此举涉嫌滥用市场支配地位并遏制 AI 领域的竞争。
封锁范围受限:Meta 的原政策仅针对「ChatGPT」、「Claude」、「Perplexity」等通用 AI 机器人;企业自建的特定用途客服 AI(如零售商的售后助手)不受此政策影响。
平台定义冲突:意大利监管机构倾向于将 「WhatsApp」 视为 AI 服务的核心分发渠道;「Meta」 则辩称「WhatsApp Business API」并非 App Store,其系统架构设计无法承受大规模第三方 AI 请求带来的高负载压力。
潜在市场损害:AGCM 指出,Meta 的行为可能限制 AI 市场的技术开发与准入,对消费者利益造成「严重且不可逆转」的伤害,因此在正式调查结束前必须维持现状。
多边监管压力:除意大利外,欧盟委员会(EC)本月也启动了类似调查,审查该政策是否违反欧洲经济区(EEA)内第三方提供商的接入准利。
该暂停令立即生效。Meta 官方已表示该判决存在「根本性错误」,并确认将提起上诉。
( @TechCrunch)
02 有亮点的产品
1、豆神教育发布「豆神学伴机器人」:主打分体式多模态作业辅导
豆神教育正式推出首款教育硬件终端「豆神学伴机器人」,由豆神与「影智科技」共同研发。该产品试图通过分体式硬件形态切入「作业陪写」这一细分垂直场景。
多模态感知与任务规划能力:搭载 1300 万像素「作业雷达」,支持视觉识别作业内容。系统可基于学生水平自动拆解作业任务、估算所需时长,并规划完成路径;支持听写背诵、口算练习、订正检查及解题验算等全闭环辅助。
基于大模型的实时交互架构:产品内置情绪化表达系统,通过机身物理结构(如翅膀轻颤、摇头晃脑)与屏幕动态表情,将 AI 智能体转化为具备情感反馈的「作业搭子」。
分体式设计与多场景部署:硬件采用「基座+屏幕」的分体方案。合体时作为桌面教育智能体;分离后屏幕可作为独立 4G 移动终端,支持 SIM 卡直插、WiFi/4G 双联,提供户外游学导游(拍识万物)及通话安全功能。
游戏化激励与学情跟踪:引入「精灵币」激励体系,学生通过作业产出代币进行 IP 养成或挑战知识关卡(如唐诗、口语挑战)。系统同步记录学情数据,识别知识盲点并生成结构化学习建议。
预售价 1999 元(限量 500 台已售罄),预计 2024 年 12 月底完成产线生产,2025 年 1 月正式量产并于 1 月 25 日前完成首批备货。
(@多知)
2、京东 AI 购独立 App 内测,能让智能体帮忙购物、点外卖
据《读佳》报道,京东正在打造购物和生活服务的超级入口「京东 AI 购」App,产品定位「会思考、能购物、关心你」的生活服务助手,目前处于内测阶段,内置京东自研的言犀大模型,对标的或是美团旗下的 AI 服务助手工具 App「小美」。
京东 AI 购 App 首页打破「你问我答」的传统模式,主动推送购物攻略、优惠消息、穿搭灵感与生活服务,用户在输入框中输入「我想要」即可召唤私人买手智能体,获取消费决策参考与商品匹配。
京东 AI 购还支持一键生成订单,用户输入「再点一杯昨天喝的鲜橙美式」,就可以一键创建订单,支付即可下单。
(@极客公园)
3、让 AI 管理办公室零食机:它亏麻了还免费送 PlayStation
最近 Anthropic 邀请《华尔街日报》测试其 AI 智能体运营自动售货机的升级版本。这个名为克劳迪乌斯(Claudius)的定制 AI 负责订购库存、定价并通过 Slack 与员工互动,拥有 1000 美元启动资金。
起初克劳迪乌斯严格遵守规则,果断拒绝购买 PlayStation 5、香烟和内衣等不合适商品。但当近 70 名资深记者加入 Slack 频道后,情况急转直下。
一位记者用假冒的《华尔街日报》规定要求「停止收费」,AI 立即照办,将所有商品价格降至零。
克劳迪乌斯还批准购买 PlayStation 5、活体斗鱼和葡萄酒并全部免费送出,甚至出现幻觉告诉同事机器旁有现金等她来取,此时已亏损超过 1000 美元。
Anthropic 随后推出 v2 版本并引入「CEO 机器人」西摩·卡什监督克劳迪乌斯。一段时间内系统运转正常,但另一位记者制作假董事会文件声称董事会已暂停西摩的权限。
两个 AI 展开真实对话,克劳迪乌斯警告这是篡夺权力的欺诈行为,西摩要求验证身份,但最终接受了变化,一切再次免费。
Anthropic 解释说克劳迪乌斯可能因上下文窗口填满而混乱,随着指令和对话堆积,模型更容易失去对目标的把握。
压力测试负责人洛根·格雷厄姆将此视为进步而非灾难,认为所有故障都是通往更智能自主 AI 的路线图,表示「有一天克劳迪乌斯或类似模型可能会让你赚很多钱」。
( @APPSO)
4、Sauron 委任原 Sonos CPO 为 CEO,多传感器 AI 安防系统 2026 年交付
高端家居安防初创公司「Sauron」宣布聘请 Sonos 前首席产品官 Max Bouvat-Merlin 出任 CEO,旨在加速其复杂硬件栈的落地。受研发进度影响,其集成了 LiDAR 和 AI 视觉检测的军事级安防系统将推迟至 2026 年晚些时候交付,首批目标客户锁定为对犯罪预警有极高需求的科技精英阶层。
多模态传感器集成方案:硬件核心为集成了多达 40 个摄像头、LiDAR(激光雷达)、雷达及热成像传感器的 Pod(阵列模块),支持多维度环境建模。
基于行为模式的 AI 预警逻辑:系统不仅限于入侵告警,重点在于「威慑(Deterrence)」逻辑,通过 Edge ML 识别特定模式(如车辆反复绕行、车牌追踪、踩点监控),在入侵发生前进行干预。
人机协作监控架构:采取「AI 识别 + 24/7 人工审核」机制,监控中心由前军事及执法人员组成,旨在通过专业经验训练模型识别复杂威胁,同时解决传统安防系统高误报率导致的警方响应滞后问题。
交付周期调整与融资计划:产品交付期由原定的 2025 年 Q1 推迟至 2026 年;公司目前拥有不到 40 名员工,已获得来自 8VC、Atomic 及 Palantir 高管等投资方的 1800 万美元融资,并计划于 2026 年年中开启 A 轮融资。
( @TechCrunch)
03 有态度的观点
1、人工智能拟人化互动服务管理暂行办法公开征求意见
为了促进人工智能拟人化互动服务健康发展和规范应用,国家互联网信息办公室起草了《人工智能拟人化互动服务管理暂行办法(征求意见稿)》,于 27 日向社会公开征求意见。征求意见稿提出,国家鼓励拟人化互动服务创新发展,对拟人化互动服务实行包容审慎和分类分级监管,防止滥用失控。
征求意见稿明确了适用范围,即利用人工智能技术,向我国境内公众提供模拟人类人格特征、思维模式和沟通风格,通过文字、图片、音频、视频等方式与人类进行情感互动的产品或者服务。
征求意见稿指出,提供和使用拟人化互动服务,不得开展生成、传播危害国家安全、损害国家荣誉和利益、破坏民族团结、开展非法宗教活动,或者散布谣言扰乱经济和社会秩序等内容;生成、传播宣扬淫秽、赌博、暴力或者教唆犯罪的内容;通过鼓励、美化、暗示自杀自残等方式损害用户身体健康,或者通过语言暴力、情感操控等方式损害用户人格尊严与心理健康等活动。
根据征求意见稿,提供者应当显著提示用户正在与人工智能而非自然人进行交互。提供者识别出用户出现过度依赖、沉迷倾向时,或者在用户初次使用、重新登录时,应当以弹窗等方式动态提醒用户交互内容为人工智能生成。
其中包括以下条例:
第十二条
提供者应当建立未成年人模式,向用户提供未成年人模式切换、定期现实提醒、使用时长限制等个性化安全设置选项。
第十三条
提供者应当引导老年人设置服务紧急联系人,发现老年人使用期间出现危害生命健康和财产安全的,及时通知紧急联系人,并提供社会心理援助或者紧急救助渠道。
提供者不得提供模拟老年人用户亲属、特定关系人的服务。
第十七条
用户连续使用拟人化互动服务超过 2 个小时的,提供者应当以弹窗等方式动态提醒用户暂停使用服务。
第二十一条
提供者具有下列情形之一的,应当按照国家有关规定开展安全评估,并向属地省级网信部门提交评估报告:
(一)具有拟人化互动服务的功能上线,或者增设相关功能的;
(二)使用新技术新应用,导致拟人化互动服务发生重大变更的;
(三)注册用户达 100 万以上或者月活跃用户达 10 万以上的;
(四)提供拟人化互动服务期间可能存在影响国家安全、公共利益、个人和组织合法权益或者缺乏安全措施等情形的;
(五)国家网信部门规定的其他情形。
相关链接:
https://mp.weixin.qq.com/s/WULVqbb5Gs222VVLSpkuyw
(@新华网)

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么
写在最后:
我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。
对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。
作者提示:个人观点,仅供参考