灵宇宙获 2 亿新融资,要做 AI 世界操作系统;Vogent :自然语言描述生成语音智能体丨日报

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@鲍勃

01 有话题的技术

1、 Vogent 推出 AI 语音智能体向导:描述即生成,分钟级部署语音智能体

Vogent 发布了 Voice Agent Wizard,旨在通过简化语音 AI 应用的开发流程,大幅缩短开发周期并降低技术门槛。用户只需提供描述和相关文件,即可在短短几分钟内生成一套完整、可部署的语音智能体。

  • 描述驱动生成: 借助自然语言描述语音智能体的功能和目标,并上传少量参考文件(如对话记录),AI 便能自动完成构建。

  • 海量数据训练: 该向导基于对数千个真实语音智能体设计过程的学习,深刻理解语音 AI 在实际生产环境中的运作原理。

  • 全流程自动化: AI 不仅能自动选择合适的架构、优化参数、生成系统提示,还能预测和处理潜在的边缘情况,实现全流程自动化。

  • 开发周期显著缩短: 过去需要数周甚至数月的试错和配置工作,现在仅需几分钟即可完成,从而显著加速产品上市时间。

  • 赋能快速迭代: 用户可以即时测试新的应用场景,并根据用户反馈进行实时迭代,将精力集中于产品本身,而非底层基础设施。

Vogent 的 AI 语音智能体向导现已上线,用户可通过 app.vogent.ai 访问并开始使用。

(@Y Combinator)

2、Talo 被 Palabra.ai 收购,整合打造全场景 AI 实时语音翻译平台

Talo 在被 Palabra.ai 收购后,正式整合并发布了其全方位的 AI 实时语音翻译平台。此次整合旨在打破语言障碍,提供从视频通话到直播、线下活动及 API 集成的无缝跨语言沟通解决方案。

  • 全场景覆盖: Talo 现已支持视频通话、网络研讨会、线下活动、直播广播以及通过 API 集成,满足多样化的翻译需求。

  • 核心技术升级: 实时视频通话翻译能力大幅提升,用户体验更为自然流畅。

  • 新增功能:

  • Palabra Events 支持网络研讨会和线下活动的实时翻译。

  • Palabra Broadcaster 提供直播广播的即时语音翻译。

  • 开发者平台: 推出 API 平台,赋能开发者构建自定义的翻译应用。

(@ Producthunt)

02 有亮点的产品

1、Proxis:AI 邮件智能体,以你的语调风格撰写邮件

Proxis 推出一款 AI 邮件智能体,能够连接用户的知识库和收件箱,模仿其邮件风格和语调,自动草拟并发送邮件。该工具旨在解决日益增长的邮件数量和信息处理难题,尤其适用于需要高强度邮件沟通的销售、运营及创始人等用户。

  • 个性化邮件草拟: Proxis 能够学习用户的语调和风格,生成听起来「像你本人」的邮件回复。

  • 语境优先: 可连接 CRM、Notion、Drive、Slack、帮助文档以及历史邮件,确保回复内容准确且符合品牌调性。

  • 智能发送机制: 仅在 AI 拥有高置信度时自动发送邮件,其他回复则保留在草稿箱供用户审核。

  • 持续学习: 用户的每一次发送和反馈都会帮助 AI 更好地学习和适应其沟通方式。

  • 规则配置: 用户可配置特定的规则来指导 AI 的行为。

(@Y Combinator)

2、Willow 发布 iOS 智能语音键盘,实现「边说边改」的无缝输入体验

Y Combinator 孵化的初创公司 Willow 发布了一款 iOS 智能语音键盘应用,支持在所有 App 中进行高效的语音输入。与传统语音转录工具不同,Willow 将完整的键盘与语音输入集成,解决了语音输入后「编辑困难」的核心痛点,旨在提供一种更高效、更自然的移动端输入方式。

  • 全功能键盘集成: Willow 的最大优势在于它是一个完整的键盘,而非单纯的语音输入面板。用户可以在语音转录后,无需切换键盘,直接进行光标移动、文字修改和输入,极大地提升了编辑效率。这一点是其与竞品 Wispr Flow 的核心差异。

  • 基于 LLM 的个性化引擎: 该应用支持超过 100种语言,并允许用户自定义专业词汇和写作风格(例如,区分工作、邮件、即时消息等场景)。其技术栈基于一系列模型,并重点调优了基于 Meta Llama 模型的文本到文本(text-to-text)管线,以实现精准的格式化与个性化。

  • 强劲的商业势头: 自发布以来,Willow 的用户量实现了每月 50% 的增长,并已获得包括 Uber、Heidi Health 等在内的企业客户。公司已获得由 Box Group、Y Combinator 以及 Reddit 联合创始人 Alexis Ohanian 等知名投资方提供的 450 万美元融资。

  • 超越听写的长期愿景: 在桌面端,Willow 还提供名为「Hey Willow」的语音助手,可以执行更复杂的指令,如用用户的语气风格撰写邮件回复。其长期目标是构建一个能通过语音控制计算机的下一代人机交互界面。

(@TechCrunch)

3、灵宇宙获 2 亿新融资,要做 AI 世界操作系统

「暗涌 Waves」获悉,灵宇宙近日完成 2 亿元 PreA 轮融资,由上海国际集团旗下国方创新、国泰海通、广发信德、滴滴出行、拉卡拉旗下考拉基金、润建股份等金融机构和上市公司参投,老股东超额追投。

「如果 AI 要进入生活,它一定得从家庭和随身场景开始理解人,而全球化是这类产品的自然方向。」顾嘉唯告诉「暗涌 Waves」,Luka 时代资本火热,大家都在冲机器人。但那时的底层模型没准备好、硬件也太贵,做终端就是在「逆风走钢丝」。现在完全不一样了,模型成熟了、基础成本降下来、交互方式变了,「AI 开始真正进入物理世界。」

基于这样的判断,大模型到来后顾嘉唯创立灵宇宙,这并非简单的二次创业,而是将其坚守十余年「万物有灵」的核心理念置于大模型时代的新基座上重新出发。不再只是单一爆款产品,目的打造一个面向下一代 AI 终端的操作系统生态,让机器真正具备感知、共情与主动交互的 「灵性」。

但 AI 硬件并不是顾嘉唯的终极目标。他想把验证有效的模型推向规模化,不再只是做陪伴机器,而是构建一个能在全球不同家庭中运行的人机交互系统——从 AI 伴读的单点突破,到面向全球家庭的具身智能系统化实验。

灵宇宙的关键引擎在于其自主研发的 LingOS 交互操作系统,而 LingOS 的核心价值在于其可迁移性——它不是一个被绑定在特定硬件上的固件,而是一个能够注入不同形态终端(从随身设备到家用消费机器人)的「AI 灵性」及「机器人灵魂」,通过持续收集的真实世界交互数据不断进化。在他的理想中,LingOS 不会局限于单一场景的智能响应,而是要成为跨越地域、文化与年龄的 「通用 AI 灵性接口」。

在顾嘉唯看来,「硬件只是接口,系统才是核心。」而从发展路径上看,系统的价值需要在更大市场——尤其是海外市场被验证和放大。

(@暗涌 Waves)

4、前云鲸产品副总裁李阳创业,聚焦陪伴具身赛道

雷峰网·鲸犀独家获悉,前云鲸智能产品副总裁李阳(Roger)离职后创业,成立公司「Ouropia」,主攻家庭陪伴具身领域,该项目将聚焦内容情绪消费与物理实体陪伴,通过深度情感交互实现 Physical AI 的家庭场景进入问题。

目前,李阳的创业项目已完成种子轮融资,获数千万美元融资。据了解,Ouropia 的首款产品将通过具身方式实现深度情绪交互和内容消费,产品将面向北美市场,预计客单价将处于较高区间。

另据雷峰网了解,Ouropia 创始团队包括来自大疆、影石、字节、清华的机器人和认知领域专家,以及知名产品设计团队,是一支磨合多年的成熟产品工程团队。李阳早年曾在大疆担任动力系统专家,后相继负责 Mavic 系列产品、教育机器人产品及自动驾驶相关业务,于 2021 年离开大疆加入云鲸。在云鲸期间担任产品副总裁,负责产品设计、研发工程管理、质量等工作,在团队中具有重要影响力。

(@雷峰网)

03 有态度的观点

1、 李彦宏回应百度总是「起大早赶晚集」:不能指望所有创新都成功,创新的特点就是大多数会失败

11 月 16 日消息,在 2025 百度世界大会后,百度创始人李彦宏接受媒体采访。在采访中,李彦宏谈到了一个外界非常关注的话题:「当然,别人说我们『起大早赶晚集』,这不冒犯,一些也是事实。甚至我在内部也让大家研讨说,我们为什么会『起大早赶晚集』。」

李彦宏表示:「我们不能够指望所有的创新尝试都是成功的,创新的特点就是,大多数创新会失败,我们要接受这样一个现实。所以百度内部可能起过十个不同的创新项目,如果九个都失败了,我认为是很正常的,它就应该失败,从概率上讲就应该失败,如果有一个成功了,那就非常好。」

李彦宏还说:「另外一方面,百度这些年有做成的、有做失败的。如果有什么规律性的话,当这件事的成败几乎完全取决于它技术的先进性的时候,我们的成功概率就会大不少,尤其是这个技术需要很多很多年的投入和迭代,那我们成功的概率就会更大一些。」

(@潇湘晨报)

04 社区黑板报

招聘、项目分享、求助……任何你想和社区分享的信息,请联系我们投稿。(加微信 creators2022,备注「社区黑板报」)

1、招聘实习生丨加入我们,共建 RTE 开发者社区

RTE 开发者社区·运营实习生(实时互动 / Voice AI 方向,本招聘长期有效)

地点:北京·朝阳区望京南/上海·杨浦区五角场

这份实习将给你带来:

**产品与技术成长:**深入学习垂类 AI 产品从技术到落地的全生命周期,构建全面的产品视角。

**社区运营实战:**与高潜力的开发者和创业者深度交流,共同探索行业前沿;并亲身体验顶级 AI 大会,拓展行业视野。

【你的职责】

Voice AI / RTE 情报官: 每日关注 Voice AI /实时互动领域的最新动态,提炼整理并分享行业洞察,定期撰写学习笔记,帮助团队和社区保持信息前沿。

社区连接者: 负责 RTE 领域开发者、初创企业等核心群体的社群运营,主动建立并深化联系,鼓励并协助他们融入社区,共同维护社区的活力与生态。

活动协作者: 深度参与 RTE Open Day、Meetup、Dev Talk 等线上线下活动的全流程运营,包括前期策划、中期执行、后期复盘,从实践中提升组织和协调能力。

行业洞察者: 协助开展 RTE 相关行业及应用场景调研、产品竞争力分析,整理相关资料,形成对业务的深入理解和独到见解。

【希望你】

1.本科及以上学历,商业、技术、产品、媒体专业或经验背景优先,具备良好英文能力;

2.对 RTE / Voice AI 有浓厚兴趣和求知欲;具备优秀的信息收集与整合能力,乐于快速学习新事物,并具备严谨的逻辑思维。

3.能保证每周至少 4 天的工作时间,持续 3 个月以上。

【薪资】

180-220 元/天

【投递方式】

实习地点北京或上海,请将简历发送至 rtedevcommunity@gmail.com ;邮件标题请注明:【社区运营实习-姓名-学校-毕业年份-到岗日期-城市】

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

写在最后:

我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

注册登录 后评论
    // 作者
    R
    @RTE_Dev_Comm
    还什么也没有写~
    • 0
    // 本帖子
    关键词
    // 相关帖子
    Coming soon...
    • 0
    灵宇宙获 2 亿新融资,要做 AI 世界操作系统;Vogent :自然语言描述生成语音智能体丨日报RTRTE_Dev_Comm