AI 硬件编排平台 Era 融资 1100 万美元,快速开发 AI 穿戴设备;DeepSeek 正式发布 V4 预览版丨日报

开发者朋友们大家好:
这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
本期编辑:@koki、@鲍勃
01 有话题的技术
1、Qwen 开源 Qwen3.6-27B:27B 稠密多模态模型,智能体编程能力超越 397B 前代旗舰
Qwen 团队宣布开源 270 亿参数稠密多模态模型 Qwen3.6-27B。该模型采用非 MoE 稠密架构,在参数量仅为前代旗舰(Qwen3.5-397B-A17B)十五分之一的情况下,在智能体(agent)编程及多模态推理基准上实现了全面超越。
Agent 编程性能跨级压制:在核心编程基准 SWE-bench Verified 取得 77.2 分,SWE-bench Pro 取得 53.5 分,并在 Terminal-Bench 2.0(59.3)和 SkillsBench(48.2)上大幅领先于参数规模高达 397B 的前代 MoE 模型。
原生多模态推理引擎:支持图像、视频与文本的统一理解,具备视觉语言「思考模式」(Thinking Mode),其推理性能指标 GPQA Diamond 得分为 87.8。
高效稠密架构设计:作为稠密模型(Dense Model),无需 MoE 路由逻辑,降低了推理延迟与部署复杂度,是主流显存规模环境下获取顶尖编程能力的理想规格。
API 引入 preserve_thinking 功能:阿里云百炼平台即将支持该参数,允许在 API 消息中保留所有前序轮次的思维链(CoT)内容,专门针对复杂智能体任务优化。
工具链深度集成:支持无缝接入 OpenClaw、Claude Code 及 Qwen Code 等第三方编程助手,实现具备上下文感知能力的工程级代码开发。
(@通义实验室)
2、DeepSeek 发布 V4 系列模型:全系标配 1M 上下文,同步开源 1.6T MoE 权重
DeepSeek 正式发布 V4 预览版大模型,包含主打极致性能的 V4-Pro 与主打低延迟的 V4-Flash 两个版本。本次更新全系标配 1M(百万)tokens 上下文长度,并同步开源完整模型权重与配套工具链。开发者无需修改原有的 base_url 即可接入,直接获取具备增强智能体(agent)与代码能力的基座模型。
1.6T MoE 架构与全系 1M 上下文:V4-Pro 采用总参数 1.6T、激活参数 49B 的 MoE 架构,预训练数据量达 33T;全系列(含 V4-Flash)将上下文长度从上一代 V3.2 的 128K 直接跃升至 1M tokens,支持端到端导入完整代码库或百万字文档。
Flash 版本激活参数 13B,输入低至 0.2 元:V4-Flash 采用 13B 激活参数,并引入全新 token 压缩注意力机制与 DSA 稀疏注意力架构。API 采用阶梯计费,缓存命中输入为 0.2 元 / 百万 tokens(未命中为 1 元),输出 2 元 / 百万 tokens。Pro 版本缓存命中输入为 1 元 / 百万 tokens(未命中 12 元),输出 24 元 / 百万 tokens。
新增参数控制与多格式接口兼容:全系列同时支持思考与非思考双模式,开发者可通过新增的 reasoning_effort 参数自定义思考强度;全量支持 Json Output、Tool Calls 与对话前缀续写能力。API 原生兼容 OpenAI ChatCompletions 与 Anthropic 两种接口格式。
全量非阉割开源与 Day 0 框架适配:完整保留与云端 API 一致的全量能力(无功能阉割)并开源模型权重。同步提供微调、量化与推理加速全流程工具链,完成 vLLM、TGI 推理框架及 LangChain、LlamaIndex 等智能体框架的 Day 0 原生适配。
(@极客公园)
3、GPT-5.5 正式发布:更聪明、更省 token
今天凌晨,OpenAI 正式发布旗下最强旗舰模型 GPT-5.5 及 GPT-5.5 Pro,核心能力是接受杂乱、多步骤的复杂任务并自主完成 —— 规划路径、调用工具、校验结果、持续推进,无需用户逐步干预。
Terminal-Bench 2.0 得分 82.7%(GPT-5.4 为 75.1%),SWE-Bench Pro 达 58.6%,内部长任务评测 Expert-SWE 达 73.1%,且三项测试均以更少 token 完成;
GDPval 跨 44 职业评测获胜或打平比例 84.9%,Tau2-bench Telecom 客服工作流达 98.0%(GPT-5.4 为 92.8%),OSWorld 计算机操作达 78.7%;
BixBench 生物信息学评测 80.5%,居已发布分数模型首位;一个内部版本还证明了一个关于 Ramsey 数的长期猜想,并在 Lean 中完成形式化验证;
与英伟达 GB200/GB300 NVL72 系统联合设计,每 token 延迟与 GPT-5.4 持平,同时通过负载均衡优化将 token 生成速度提升超过 20%;同样的 Codex 任务,GPT-5.5 消耗的 token 显著更少。
Cursor 联合创始人兼 CEO Michael Truell 表示,GPT-5.5「面对复杂长期任务时能坚持更久而不中途停下」;Every 创始人兼 CEO Dan Shipper 验证了其能独立给出与资深工程师相同的系统重构方案;
一位英伟达工程师甚至表示「失去访问权限感觉就像肢体被截肢了一样」。
( @APPSO)
4、Era 获 1100 万美元融资:推出 AI 硬件编排平台,原生接入超 130 个 LLM
由前 Humane 和 Jony Ive 硬件项目(io)核心成员创立的初创公司 Era 宣布累计完成 1100 万美元融资。该公司针对 AI 硬件推出了一套软件编排与智能体调度平台,为硬件开发者提供处理多模态输入与模型推理的底层基础设施。此举将允许开发者无需自建复杂的模型调度后端,即可快速开发脱离传统 App 交互模式的新型 AI 穿戴设备。
开发者套件原型落地验证:今年 4 月,基于 Era 交付的最小化模块化开发套件(Developer Kit),早期开发者已构建出多款实验性终端,包括:播报特定国家文化笑话的实体纪念品、能根据股票数据预测「今日是否适合辞职」的类手机装置,以及空气质量监测仪。
更多原型作品:https://primavera.era.world/
原生集成超 130 个 LLM:平台已预置来自 14 家以上模型提供商的 130 多个大语言模型(LLM),为硬件开发者提供开箱即用的推理接口与定制化语音生成能力。
动态路由(Dynamic routing)与环境适配:平台核心引擎支持跨模型的动态请求路由,并专门针对边缘硬件在现实世界中的约束(如网络连接状态、低功耗限制)优化了调度逻辑。
无 App 化(App-less)架构设计:提供独立于手机操作系统的「智能层(Intelligence layer)」,支持向眼镜、戒指、家庭音响等非传统屏幕设备输出环境感知与交互能力。
用户级记忆与隐私解耦:在架构上允许终端用户自主选择记忆存储方式和底层模型提供商,以满足隐私隔离与数据合规需求。
开发者套件(Dev Kit)已向部分创客与艺术家内测,平台后续计划向开源及创客社区开放。
https://era.world/
(@TechCrunch)
02 有亮点的产品
1、ElevenLabs 联合 Turn.io 启动 2026 健康加速器:整合 TTS/STT 接口与 WhatsApp 基础设施
ElevenLabs 宣布联合 Turn.io 与 Anthropic 推出为期 24 周的「Chat for Health Accelerator 2026」。该项目旨在利用 ElevenLabs 的语音技术栈,将基于 WhatsApp 的医疗服务从纯文本交互升级为语音原生交互,以解决全球低识字率及多语言人群的医疗信息接入障碍。
全栈语音 AI 基础设施输出:提供 ElevenLabs TTS(文本转语音)、STT(语音转文本)以及 ElevenLabs Agents 接口,重点支持低资源语言(Low-resource languages)的实时交互。
$250,000 共享信用额度与模型集成:入选的 10 家机构将共享 25 万美元的语音服务额度,并整合 Anthropic 提供的模型算力支持,用于构建生产级对话智能体。
WhatsApp 生态规模化分发:利用 Turn.io 已有的 WHO(世卫组织)及 UNICEF(联合国儿童基金会)级基础设施,将语音交互无缝嵌入 WhatsApp 界面,覆盖现有近 300 家组织的医疗服务网络。
24 周生产级部署周期:项目从 2026 年 7 月运行至 12 月,核心目标并非原型(Pilot)验证,而是实现患者导航与互动服务的全量规模化上线。
( @elevenlabs)
2、GRAI 获 900 万美元种子轮融资:推出实时音频衍生管线,聚焦社交化音乐二次创作
白俄罗斯创业团队 GRAI 完成 900 万美元种子轮融资,由 Khosla Ventures 与 Inovo VC 领投。该公司避开 Suno、Udio 等纯生成式(Text-to-Music)路径,通过构建实时音频系统和权限管理机制,推动基于版权音乐的社交混音与二次创作。
实时音频衍生管线(Derivatives Pipeline): GRAI 自研了一套底层基础设施,支持在保留原曲核心特征(Identity)的前提下,实现实时的风格变换与混音。该系统旨在平衡「用户参与感」与「版权保护」,而非生成全新的 AI 音乐。
兴趣与参与图谱(Taste and Participation Graph): 针对 Gen Z 与 Gen Alpha 用户,GRAI 建立了一套社交发现机制,通过朋友关系链、粉丝群体和短视频语境(如 TikTok 模式)驱动音乐传播,而非依赖传统的流媒体被动收听。
合规性与版税分发模型: 核心产品逻辑为「先征得许可,再集成」。系统内置艺术家 Opt-in/Opt-out(选择加入/退出)机制,允许版权方通过用户生成的修改版本获取新增版税,试图解决生成式 AI 带来的版权侵权及「内容泛滥(Slop)」问题。
跨平台产品矩阵: 目前已发布 iOS 端的「Music with friends」应用及 Android 端的 AI 音乐实验平台,用于收集用户在实时互动、社交混音场景下的反馈,以优化其音频处理引擎。
( @TechCrunch)
03 有态度的观点
1、员工故意删除 AI 训练数据被起诉,北京市检察机关深化知识产权保护
北京市人民检察院发布《北京市检察机关知识产权检察白皮书(2025 年)》。
去年北京市检察机关共办理知识产权案件 1195 件,同比上升 10.34%,其中刑事检察案件 744 件、审查起诉 234 件 420 人,民事检察案件同比上升 2.15 倍,公益诉讼检察案件同比上升 5.5 倍。
在 AI 产业保护方面,北京市检察机关去年共办理涉人工智能产业、数据要素产业知识产权案件 113 件,涵盖 AI 技术侵权认定、模型训练数据法律属性、数据知识产权权属界定等前沿法律议题。
其中,东城区检察院办理的全市首例非法删除 AI 模型训练数据案尤为典型。涉案员工故意删除公司用于训练 AI 模型的大量数据,导致模型训练系统结构性破坏,造成重大经济损失。
检察机关最终以「破坏计算机信息系统罪」提起公诉,推动将 AI 模型训练系统纳入刑法保护范畴。通州区检察院则办理了全市首例利用 AI 生成模型侵犯著作权案,四名被告人均因犯侵犯著作权罪被判处刑罚。
(@APPSO)

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么
写在最后:
我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。
对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

作者提示: 个人观点,仅供参考