AI 硬件编排平台 Era 融资 1100 万美元，快速开发 AI 穿戴设备；DeepSeek 正式发布 V4 预览版丨日报

开发者朋友们大家好：

这里是「RTE 开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE（Real-Time Engagement）领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。

本期编辑：@koki、@鲍勃

01 有话题的技术

1、Qwen 开源 Qwen3.6-27B：27B 稠密多模态模型，智能体编程能力超越 397B 前代旗舰

Qwen 团队宣布开源 270 亿参数稠密多模态模型 Qwen3.6-27B。该模型采用非 MoE 稠密架构，在参数量仅为前代旗舰（Qwen3.5-397B-A17B）十五分之一的情况下，在智能体（agent）编程及多模态推理基准上实现了全面超越。

Agent 编程性能跨级压制：在核心编程基准 SWE-bench Verified 取得 77.2 分，SWE-bench Pro 取得 53.5 分，并在 Terminal-Bench 2.0（59.3）和 SkillsBench（48.2）上大幅领先于参数规模高达 397B 的前代 MoE 模型。
原生多模态推理引擎：支持图像、视频与文本的统一理解，具备视觉语言「思考模式」（Thinking Mode），其推理性能指标 GPQA Diamond 得分为 87.8。
高效稠密架构设计：作为稠密模型（Dense Model），无需 MoE 路由逻辑，降低了推理延迟与部署复杂度，是主流显存规模环境下获取顶尖编程能力的理想规格。
API 引入 preserve_thinking 功能：阿里云百炼平台即将支持该参数，允许在 API 消息中保留所有前序轮次的思维链（CoT）内容，专门针对复杂智能体任务优化。
工具链深度集成：支持无缝接入 OpenClaw、Claude Code 及 Qwen Code 等第三方编程助手，实现具备上下文感知能力的工程级代码开发。

（@通义实验室）

2、DeepSeek 发布 V4 系列模型：全系标配 1M 上下文，同步开源 1.6T MoE 权重

DeepSeek 正式发布 V4 预览版大模型，包含主打极致性能的 V4-Pro 与主打低延迟的 V4-Flash 两个版本。本次更新全系标配 1M（百万）tokens 上下文长度，并同步开源完整模型权重与配套工具链。开发者无需修改原有的 base_url 即可接入，直接获取具备增强智能体（agent）与代码能力的基座模型。

1.6T MoE 架构与全系 1M 上下文：V4-Pro 采用总参数 1.6T、激活参数 49B 的 MoE 架构，预训练数据量达 33T；全系列（含 V4-Flash）将上下文长度从上一代 V3.2 的 128K 直接跃升至 1M tokens，支持端到端导入完整代码库或百万字文档。

Flash 版本激活参数 13B，输入低至 0.2 元：V4-Flash 采用 13B 激活参数，并引入全新 token 压缩注意力机制与 DSA 稀疏注意力架构。API 采用阶梯计费，缓存命中输入为 0.2 元 / 百万 tokens（未命中为 1 元），输出 2 元 / 百万 tokens。Pro 版本缓存命中输入为 1 元 / 百万 tokens（未命中 12 元），输出 24 元 / 百万 tokens。

新增参数控制与多格式接口兼容：全系列同时支持思考与非思考双模式，开发者可通过新增的 reasoning_effort 参数自定义思考强度；全量支持 Json Output、Tool Calls 与对话前缀续写能力。API 原生兼容 OpenAI ChatCompletions 与 Anthropic 两种接口格式。

全量非阉割开源与 Day 0 框架适配：完整保留与云端 API 一致的全量能力（无功能阉割）并开源模型权重。同步提供微调、量化与推理加速全流程工具链，完成 vLLM、TGI 推理框架及 LangChain、LlamaIndex 等智能体框架的 Day 0 原生适配。

（@极客公园）

3、GPT-5.5 正式发布：更聪明、更省 token

今天凌晨，OpenAI 正式发布旗下最强旗舰模型 GPT-5.5 及 GPT-5.5 Pro，核心能力是接受杂乱、多步骤的复杂任务并自主完成 —— 规划路径、调用工具、校验结果、持续推进，无需用户逐步干预。

Terminal-Bench 2.0 得分 82.7%（GPT-5.4 为 75.1%），SWE-Bench Pro 达 58.6%，内部长任务评测 Expert-SWE 达 73.1%，且三项测试均以更少 token 完成；
GDPval 跨 44 职业评测获胜或打平比例 84.9%，Tau2-bench Telecom 客服工作流达 98.0%（GPT-5.4 为 92.8%），OSWorld 计算机操作达 78.7%；
BixBench 生物信息学评测 80.5%，居已发布分数模型首位；一个内部版本还证明了一个关于 Ramsey 数的长期猜想，并在 Lean 中完成形式化验证；
与英伟达 GB200/GB300 NVL72 系统联合设计，每 token 延迟与 GPT-5.4 持平，同时通过负载均衡优化将 token 生成速度提升超过 20%；同样的 Codex 任务，GPT-5.5 消耗的 token 显著更少。

Cursor 联合创始人兼 CEO Michael Truell 表示，GPT-5.5「面对复杂长期任务时能坚持更久而不中途停下」；Every 创始人兼 CEO Dan Shipper 验证了其能独立给出与资深工程师相同的系统重构方案；

一位英伟达工程师甚至表示「失去访问权限感觉就像肢体被截肢了一样」。

( @APPSO)

4、Era 获 1100 万美元融资：推出 AI 硬件编排平台，原生接入超 130 个 LLM

由前 Humane 和 Jony Ive 硬件项目（io）核心成员创立的初创公司 Era 宣布累计完成 1100 万美元融资。该公司针对 AI 硬件推出了一套软件编排与智能体调度平台，为硬件开发者提供处理多模态输入与模型推理的底层基础设施。此举将允许开发者无需自建复杂的模型调度后端，即可快速开发脱离传统 App 交互模式的新型 AI 穿戴设备。

开发者套件原型落地验证：今年 4 月，基于 Era 交付的最小化模块化开发套件（Developer Kit），早期开发者已构建出多款实验性终端，包括：播报特定国家文化笑话的实体纪念品、能根据股票数据预测「今日是否适合辞职」的类手机装置，以及空气质量监测仪。

更多原型作品：https://primavera.era.world/

原生集成超 130 个 LLM：平台已预置来自 14 家以上模型提供商的 130 多个大语言模型（LLM），为硬件开发者提供开箱即用的推理接口与定制化语音生成能力。

动态路由（Dynamic routing）与环境适配：平台核心引擎支持跨模型的动态请求路由，并专门针对边缘硬件在现实世界中的约束（如网络连接状态、低功耗限制）优化了调度逻辑。

无 App 化（App-less）架构设计：提供独立于手机操作系统的「智能层（Intelligence layer）」，支持向眼镜、戒指、家庭音响等非传统屏幕设备输出环境感知与交互能力。

用户级记忆与隐私解耦：在架构上允许终端用户自主选择记忆存储方式和底层模型提供商，以满足隐私隔离与数据合规需求。

开发者套件（Dev Kit）已向部分创客与艺术家内测，平台后续计划向开源及创客社区开放。

https://era.world/

（@TechCrunch）

02 有亮点的产品

1、ElevenLabs 联合 Turn.io 启动 2026 健康加速器：整合 TTS/STT 接口与 WhatsApp 基础设施

ElevenLabs 宣布联合 Turn.io 与 Anthropic 推出为期 24 周的「Chat for Health Accelerator 2026」。该项目旨在利用 ElevenLabs 的语音技术栈，将基于 WhatsApp 的医疗服务从纯文本交互升级为语音原生交互，以解决全球低识字率及多语言人群的医疗信息接入障碍。

全栈语音 AI 基础设施输出：提供 ElevenLabs TTS（文本转语音）、STT（语音转文本）以及 ElevenLabs Agents 接口，重点支持低资源语言（Low-resource languages）的实时交互。
$250,000 共享信用额度与模型集成：入选的 10 家机构将共享 25 万美元的语音服务额度，并整合 Anthropic 提供的模型算力支持，用于构建生产级对话智能体。
WhatsApp 生态规模化分发：利用 Turn.io 已有的 WHO（世卫组织）及 UNICEF（联合国儿童基金会）级基础设施，将语音交互无缝嵌入 WhatsApp 界面，覆盖现有近 300 家组织的医疗服务网络。
24 周生产级部署周期：项目从 2026 年 7 月运行至 12 月，核心目标并非原型（Pilot）验证，而是实现患者导航与互动服务的全量规模化上线。

( @elevenlabs)

2、GRAI 获 900 万美元种子轮融资：推出实时音频衍生管线，聚焦社交化音乐二次创作

白俄罗斯创业团队 GRAI 完成 900 万美元种子轮融资，由 Khosla Ventures 与 Inovo VC 领投。该公司避开 Suno、Udio 等纯生成式（Text-to-Music）路径，通过构建实时音频系统和权限管理机制，推动基于版权音乐的社交混音与二次创作。

实时音频衍生管线（Derivatives Pipeline）： GRAI 自研了一套底层基础设施，支持在保留原曲核心特征（Identity）的前提下，实现实时的风格变换与混音。该系统旨在平衡「用户参与感」与「版权保护」，而非生成全新的 AI 音乐。
兴趣与参与图谱（Taste and Participation Graph）： 针对 Gen Z 与 Gen Alpha 用户，GRAI 建立了一套社交发现机制，通过朋友关系链、粉丝群体和短视频语境（如 TikTok 模式）驱动音乐传播，而非依赖传统的流媒体被动收听。
合规性与版税分发模型： 核心产品逻辑为「先征得许可，再集成」。系统内置艺术家 Opt-in/Opt-out（选择加入/退出）机制，允许版权方通过用户生成的修改版本获取新增版税，试图解决生成式 AI 带来的版权侵权及「内容泛滥（Slop）」问题。
跨平台产品矩阵： 目前已发布 iOS 端的「Music with friends」应用及 Android 端的 AI 音乐实验平台，用于收集用户在实时互动、社交混音场景下的反馈，以优化其音频处理引擎。

( @TechCrunch)

03 有态度的观点

1、员工故意删除 AI 训练数据被起诉，北京市检察机关深化知识产权保护

北京市人民检察院发布《北京市检察机关知识产权检察白皮书（2025 年）》。

去年北京市检察机关共办理知识产权案件 1195 件，同比上升 10.34%，其中刑事检察案件 744 件、审查起诉 234 件 420 人，民事检察案件同比上升 2.15 倍，公益诉讼检察案件同比上升 5.5 倍。

在 AI 产业保护方面，北京市检察机关去年共办理涉人工智能产业、数据要素产业知识产权案件 113 件，涵盖 AI 技术侵权认定、模型训练数据法律属性、数据知识产权权属界定等前沿法律议题。

其中，东城区检察院办理的全市首例非法删除 AI 模型训练数据案尤为典型。涉案员工故意删除公司用于训练 AI 模型的大量数据，导致模型训练系统结构性破坏，造成重大经济损失。

检察机关最终以「破坏计算机信息系统罪」提起公诉，推动将 AI 模型训练系统纳入刑法保护范畴。通州区检察院则办理了全市首例利用 AI 生成模型侵犯著作权案，四名被告人均因犯侵犯著作权罪被判处刑罚。

(@APPSO)

阅读更多 Voice Agent 学习笔记：了解最懂 AI 语音的头脑都在思考什么

写在最后：

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创，感兴趣的朋友请通过开发者社区或公众号留言联系，记得报暗号「共创」。

对于任何反馈（包括但不限于内容上、形式上）我们不胜感激、并有小惊喜回馈，例如你希望从日报中看到哪些内容；自己推荐的信源、项目、话题、活动等；或者列举几个你喜欢看、平时常看的内容渠道；内容排版或呈现形式上有哪些可以改进的地方等。

作者提示: 个人观点，仅供参考