AI 语音转贴纸,儿童打印机 Stickerbox 融资 700 万美元;Spatial AI 发布第一人称真实世界数据集丨日报

开发者朋友们大家好:

这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@鲍勃

01 有话题的技术

1、Spatial AI 发布第一人称真实世界数据集,教会机器人在现实世界完成任务

Spatial AI 发布的首个开源数据集 SEA(Spatial Everyday Activities,空间日常活动)是迄今为止规模最大的、经过精心策划的以第一人称视角记录的、人们执行真实任务的数据集,数据量高达 10,000 小时。

Huggingface

https://huggingface.co/datasets/spatial-ai/sea-small

官网:

https://spatial-ai.com/


(@ycombinator@X)


2、LiveKit 重磅推出三大新功能,赋能开发者构建更卓越的语音智能体

LiveKit 在 Dev Day 活动宣布上线三项革命性新功能——Agent Builder、Phone Numbers 和 Agent Observability,旨在极大地简化语音智能体的开发、部署与调试流程,助力开发者以前所未有的速度构建和优化更智能、更可靠的语音应用。

1. Agent Builder:3 分钟内构建生产级语音智能体

全新的 Agent Builder 是一款基于浏览器的无代码/低代码平台,让开发者能够快速创建、测试并部署语音智能体。用户只需提供系统提示(system prompt),即可在几分钟内启动语音智能体的构建。该平台集成了背景降噪、多语言识别等内置语音处理能力,并支持通过 HTTP 工具轻松扩展功能,连接 CRM、API 等外部服务。Agent Builder 提供内置的实时测试与一键部署功能,并集成了 Deepgram、AssemblyAI、GPT-4.1、Gemini 2.5 Flash 等多家知名供应商的模型,让开发者可以在内测阶段自由对比模型性能。最重要的是,Agent Builder 被设计为从原型到代码的桥梁,支持导出代码,实现从低代码到专业 SDK 开发的平滑过渡,大幅缩短语音 AI 应用的上市时间。

2. Phone Numbers:60 秒内接入电话网络

LiveKit Phone Numbers 是一项全新的首方电话服务,开发者无需第三方 SIP Trunk 即可在数分钟内将语音智能体直接连接到电话网络。用户可在 LiveKit Cloud 仪表盘或 CLI 中直接购买美国本地或免费电话号码,并快速关联到语音智能体,实现「零配置」上线。此举消除了中间环节,减少了网络延迟和故障点,显著提升了通话质量、音频清晰度和语音转文本(STT)准确率,进而优化了整体语音交互体验。这项服务尤其适用于需要电话交互的行业,可快速搭建 24/7 咨询、订单查询等语音智能体。

3. Agent Observability:统一视图助力语音智能体故障排查

Agent Observability Beta 版本现已集成于 LiveKit Cloud Dashboard,旨在解决语音智能体开发与部署中的棘手故障排查问题。用户现在可以在单一视图下,同步查看会话的音频、转录、逐轮智能体调用(LLM、TTS、转折点检测、工具调用等)以及日志。这种端到端的可见性,使得开发者能够像「听」和「看」一样,快速定位导致响应延迟、中断或任务失败的根本原因,极大地简化了以往需要在不同服务间手动关联日志和时间戳的复杂过程。会话录制功能支持可选启用,并提供灵活的数据控制选项。

( @LiveKit 官网)

3、Google 正式发布 Gemini 3

今天凌晨,Google DeepMind 正式发布新一代旗舰模型 Gemini 3,号称拥有最先进的推理能力、世界领先的多模态理解能力,并支持新的智能编码体验。本次首发版本为 Gemini 3 Pro,并且即日起开始全球范围内推出,亮点如下:

  • Gemini 3 Pro 预览版原生多模态支持(文字、图像、视频、音频)

  • 在 LMArena 排行榜登顶,在推理、多模态、编程等主流测试中全面领先

  • 推理能力创纪录(GPQA Diamond 91.9%、MathArena Apex 23.4%)

  • 提供 Deep Think 深度思考模式(未来几周开放)

  • 100 万 token 上下文窗口 + 64K 输出

  • 推出全新 AI IDE:Google Antigravity,新模型已集成 Cursor、GitHub、JetBrains 等工具

值得一提的是, 推理能力方面, Gemini 3 Pro 在「人类最后的考试(Humanity’s Last Exam)」中拿到了 37.5% 的博士级推理成绩。



有趣的是,OpenAI CEO Sam Altman 刚刚也在 X 平台发文称:「恭喜 Google 成功推出 Gemini 3!看起来是个很棒的模型。」而马斯克则是表示「做得好」。

( @APPSO)



02 有亮点的产品

1、Hapiko 获 700 万美元融资,推出儿童 AI 语音转贴纸打印机 Stickerbox

总部位于布鲁克林的创意科技公司 Hapiko 宣布获得 700 万美元融资,并正式发布了其首款产品「Stickerbox」。这款 AI 驱动的语音转贴纸打印机专为儿童设计,允许他们通过语音描述图像,然后打印出可供涂鸦和定制的黑白贴纸,旨在鼓励安全、具象的创意玩乐,而非被动屏幕时间。

  • AI 语音转贴纸: 「Stickerbox」是首款能让儿童通过语音(如「骑着滑板的恐龙」)生成图像并打印成黑白贴纸的设备。

  • 鼓励具象化创意: 产品旨在引导儿童从被动接受信息转向主动、开放式的想象和创造,将口头想法转化为实体贴纸。

  • 安全与隐私优先: 采用墨水无关的热敏打印技术,使用不含 BPA 和 BPS 的纸张,无摄像头,无持续数据收集,AI 系统从零开始设计,内置年龄适宜性过滤。

  • 独立玩乐体验: 无需智能手机或笔记本电脑即可独立操作,支持儿童动手实践的玩乐方式。

  • 700 万美元融资: 本轮融资由 Maveron 和 Serena Ventures(由网球明星 Serena Williams 创立)领投,将用于扩大生产和拓展儿童创意玩具及 AI 市场。

「Stickerbox」现已在美国上市,可通过 stickerbox.com 购买,零售价为 99.99 美元。Hapiko 计划利用此次融资扩大生产规模并拓展市场。

(@Pulse 2.0)

2、连锁餐饮正在用炒菜机器人取代预制菜

据 36 氪报道,连锁餐饮品牌正加速引入炒菜机器人,以应对预制菜风波带来的行业挑战。

报道指出,老乡鸡、小菜园等餐企已在数百家门店部署智能烹饪设备,歌尔、富士康等大厂也开始在食堂场景中使用机器人,以提升出餐效率并降低人力成本。

炒菜机器人通过精准控温、自动搅拌与智能投料系统,实现标准化作业,既保留中餐「锅气」风味,又显著提高出餐速度。

烹饪机器人企业智谷天厨 CEO 耿凯平透露,过去一个月咨询需求增长近 10 倍,显示行业对智能化厨房的接受度快速提升。

市场数据显示,一台售价约 6 万元的中型炒菜机器人,使用寿命可达 8 至 10 年,月均成本约 600 元。相比传统厨师每月 8000 至 15000 元的薪资,企业可在生命周期内节省数十万元至百万元不等的运营开支。

在企业团餐场景中,机器人还配备智能调度系统,可实时监测菜品余量与人流分布,动态补餐,避免食材浪费。

据实测,其浪费率可降低 70% 以上。业内人士指出,随着消费者对预制菜的抵触情绪加剧,机器人现炒成为餐企兼顾效率与品质的更优解。

( @APPSO)


3、曝 Rabbit 公司停薪数月,官方坚称 Rabbit R1 下一代版本将面世

11 月 18 日消息,据外媒报道,最近 Rabbit 因另一件事又被推上了风口浪尖:多名 Rabbit 员工称公司已连续数月拖欠工资,部分员工甚至从 10 月起直接罢工——可就在这个节骨眼上,Rabbit CEO 吕骋(Jesse Lyu)仍对外声称「计划在 2026 年推出下一代 AI 硬件」。

据报道,今年 1 月起,Rabbit 公司就开始出现发薪延迟的问题。原本每月仅是晚几天,可后来越来越严重:最严重的一次延迟了整整 37 天才发薪。到了 7 月,Rabbit 部分员工与外包人员彻底「停薪」,再没收到任何工资。10 月初,三名员工因长期未领到薪水而发起罢工,并一直持续到现在。更戏剧性的是,Rabbit 并未否认这一点,其发言人确认罢工的确存在,并强调:「公司共有 26 名员工,目前只有 3 人在罢工,我们完全尊重他们的决定。」

此前报道,Rabbit 公司在 2024 年推出了「口袋 AI 设备」Rabbit R1,当时官方宣称要让这款设备成为用户和智能手机的交互中介,并在开售 5 天后卖出 50000 台。不过首发用户上手后却发现,这款设备的实际表现远逊于发布会上宣称的效果,例如在实景拍摄过程中至少要等 20 秒才会回应,「比 Siri 还慢」,甚至有用户指出这款设备就是一个低端安卓手机装了一个 APK 文件。

(@IT 之家、CSDN、雷锋网)


03 有态度的观点 

1、Take-Two Interactive CEO 认为游戏行业正转向 PC

Take-Two Interactive CEO Strauss Zelnick 在接受采访时表示,游戏行业正转向 PC 从封闭转向开放,但游戏机作为一种体验并不会消失。Zelnick 表示,游戏机和手游的市场份额产不多,但手游增长速度比游戏机更快。索尼 PS 和任天堂 Switch 的游戏机业务取得了成功,而竞争对手拥有 Xbox 的微软则暗示下一代硬件将更面向 PC 游戏。Valve 最近宣布的 Steam Machin 就是游戏机和 PC 的混合设备。

(@Solidot)


04 社区黑板报 

招聘、项目分享、求助……任何你想和社区分享的信息,请联系我们投稿。(加微信 creators2022,备注「社区黑板报」)

1、招聘实习生丨加入我们,共建 RTE 开发者社区

RTE 开发者社区·运营实习生(实时互动 / Voice AI 方向,本招聘长期有效)

地点:北京·朝阳区望京南/上海·杨浦区五角场

这份实习将给你带来:

产品与技术成长:深入学习垂类 AI 产品从技术到落地的全生命周期,构建全面的产品视角。

社区运营实战:与高潜力的开发者和创业者深度交流,共同探索行业前沿;并亲身体验顶级 AI 大会,拓展行业视野。

【你的职责】

  1. Voice AI / RTE 情报官:每日关注 Voice AI /实时互动领域的最新动态,提炼整理并分享行业洞察,定期撰写学习笔记,帮助团队和社区保持信息前沿。

  2. 社区连接者:负责 RTE 领域开发者、初创企业等核心群体的社群运营,主动建立并深化联系,鼓励并协助他们融入社区,共同维护社区的活力与生态。

  3. 活动协作者:深度参与 RTE Open Day、Meetup、Dev Talk 等线上线下活动的全流程运营,包括前期策划、中期执行、后期复盘,从实践中提升组织和协调能力。

  4. 行业洞察者:协助开展 RTE 相关行业及应用场景调研、产品竞争力分析,整理相关资料,形成对业务的深入理解和独到见解。

【希望你】

  1. 本科及以上学历,商业、技术、产品、媒体专业或经验背景优先,具备良好英文能力;

  2. 对 RTE / Voice AI 有浓厚兴趣和求知欲;具备优秀的信息收集与整合能力,乐于快速学习新事物,并具备严谨的逻辑思维。

  3. 能保证每周至少 4 天的工作时间,持续 3 个月以上。

【薪资】

180-220 元/天

【投递方式】

实习地点北京或上海,请将简历发送至 rtedevcommunity@gmail.com ;邮件标题请注明:【社区运营实习-姓名-学校-毕业年份-到岗日期-城市】

图片


阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。c


图片

素材来源官方媒体/网络新闻

注册登录 后评论
    // 作者
    R
    @RTE_Dev_Comm
    还什么也没有写~
    • 0
    // 本帖子
    关键词
    // 相关帖子
    Coming soon...
    • 0
    AI 语音转贴纸,儿童打印机 Stickerbox 融资 700 万美元;Spatial AI 发布第一人称真实世界数据集丨日报RTRTE_Dev_Comm