Logical 桌面智能体:学习用户操作,主动起草邮件待办;印度 AI 语音 Maya Research 开源新语音模型丨日报

图片


开发者朋友们大家好:

这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@Jerry fong,@鲍勃

01有话题的技术

1、s2.dev 推出「S3 for Streams」:将流式数据化为云存储基元
前 Etsy 和 Meta 的大规模机器学习基础设施专家 Shikhar、Stephen 和 Dwarak 联手创立的 s2.dev,推出了颠覆性的「S3 for Streams」平台。

该平台旨在为流式数据提供如同 Amazon S3 对静态文件般的云存储基元。s2.dev 提供完全无服务器的数据存储,支持无限流和灵活的数据保留策略,并允许通过简化的 REST API 实现实时追加和历史数据读取。

s2.dev 致力于大幅简化实时系统的构建,解决现有流数据基础设施面临的复杂性和高昂成本问题,特别适用于大规模事件处理和实时更新的场景,如 AI 智能体的状态管理。

  • 「S3 for Streams」核心概念: s2.dev 将流数据视为云存储的「基元」,提供类似 S3 的简洁性和可扩展性,但专注于动态、实时的事件流。

  • 完全 Serverless 的数据存储: 提供无限数量的流和可配置的数据保留策略(包括「无底洞」存储),用户无需管理任何服务器,实现开箱即用。

  • 基于 Kafka 核心抽象的简化: s2.dev 借鉴 Kafka 的核心抽象——日志(log),并赋予其 URI,通过极其简单的 REST API 在线提供,同时避免了传统 Kafka 系统的臃肿。

  • 解决传统流媒体痛点: 解决了开发者在构建实时系统时面临的复杂性、高成本和扩展性问题,特别适用于那些未曾使用 Kafka 等平台,而被迫使用 Postgres 和 Redis 等通用存储来处理流数据的构建者。

  • 高基数数据源的理想选择: 对于代码执行沙盒或 IoT 设备等高基数数据源,s2.dev 允许按需即时创建流,无需缓冲或批处理,直接将数据传输到 S2。

  • 超强读取扩展性与实时广播: 最近增强了读取扩展性以处理大规模扇出(massive fanouts),用户可以轻松地广播实时数据流(如市场数据),发布只需向流的 URL 进行 POST 操作。

  • 简化 AI 智能体状态管理: 对于构建 AI 智能体的开发者而言,s2.dev 极大地简化了后端与前端之间进度同步以及历史回放的挑战,简化了 AI 智能体的状态管理。

( @ycombinator)

2、科大讯飞发布讯飞星火 X1.5 及系列 AI 产品:更懂你的 AI
图片

科大讯飞正式发布基于全国产算力的讯飞星火 X1.5 深度推理大模型。

讯飞星火 X1.5 采用 MoE 架构,总参数 293B,激活参数 30B,单台昇腾标配服务器即可部署,推理效率相较 X1 提升 100%,端到端性能达到国际竞品效率的 93%以上。

模型在语言理解、文本生成、知识问答、逻辑推理、数学、代码六大核心能力上对标国际主流大模型,数学能力持续保持国际领先。高考数学测评中,星火 X1.5 得分 145 分,超越 GPT‑5 的 141 分和 DeepSeek V3.2‑Exp 的 140 分;在国际数学奥林匹克竞赛 IMO 2025 第三题中,星火 X1.5 给出正确答案。

教育与医疗大模型在辅助教学、辅助学习、考试评测及医疗知识问答、诊疗推荐等任务上均超过 GPT‑5 和 DeepSeek V3.2‑Exp,教育模型平均得分突破 85 分门槛。

星火 X1.5 的多语言能力升级后支持 130+种语言,整体性能达到 ChatGPT‑5 的 95%以上,拉美、东盟等 14 个重点语言效果领先;星火语音同传大模型 2.0 在 IDC 发布的《中国 AI 翻译技术评估》中 8 项核心维度评测均获行业第一。

(@科大讯飞)

3、印度语音 AI 初创 Maya Research 发布 Maya1 开源 AI 语音模型
图片

Maya Research 发布了 Maya1 模型,这是一个具备语音设计功能的开源文本转语音 AI 模型。

Maya1 采用 3B 参数的 Llama 架构,支持通过自然语言描述进行实时语音生成,具备 20 多种情感表达能力,使用场景涵盖游戏角色语音生成、播客和 audiobook 制作、AI 语音助手、视频内容创作、客户服务 AI 和辅助工具等。

模型采用 Apache 2.0 开源许可证,支持商业使用,提供完整的 vLLM 集成和自动前缀缓存功能。

今年 6 月,Maya Research 还开源过一款名为 Veena 的语音模型,支持印地语和英语。

相关链接:

https://www.mayaresearch.ai/

https://huggingface.co/maya-research/maya1

https://huggingface.co/maya-research/Veena

(@橘鸭 Juya)



02有亮点的产品

1、Iris 重塑个人助理:AI 智能体打理日程,告别多应用切换与脑力负担
由堂兄妹 Samika 和 Siddhant 共同创立的「Iris」发布,它是一款能够整合所有日历和收件箱的智能个人助理。不同于传统工具和 AI 智能体,「Iris」真正理解用户习惯和上下文,能主动处理会议日程、邮件草稿等复杂任务,旨在消除多应用切换的脑力负担,让用户专注于重要事项,从而提升日常工作和生活的效率与流畅度。

Iris 是您的智能私人助理,她能围绕真正重要的事情来组织您的一天。

  • 解决多应用切换与脑力负担: 针对用户在多个日历和收件箱之间频繁切换、传统工具和 AI 智能体要求「完美输入」导致脑力负担的痛点,「Iris」提供了一个理解用户习惯的解决方案。

  • 智能整合与上下文感知: 「Iris」连接 Gmail、Google Calendar 和 Maps,深度理解用户的「上下文」——包括会议对象、工作内容和地理位置需求,从而提供更智能的辅助。

  • 按需自动化复杂任务: 用户可以要求「Iris」实时完成多账户间的任务,例如重新安排会议、起草回复邮件或为深度工作预留时间,且所有操作均需经用户批准。

  • 「学习型」个人助理: 不同于一般 AI 智能体,「Iris」能够学习并适应用户的日常节奏和习惯,主动调整和同步日程,让用户无需手动管理琐事,专注于真正重要的工作。

( @ycombinator)

2、Logical 发布桌面端 AI 智能体:感知学习用户操作,主动提供邮件、待办建议

由 Sam 和 Anushka 共同创立的 Logical,现已正式发布其桌面端 AI 智能体。Logical 是一款主动式人工智能副驾驶工具,专为桌面系统设计。它在用户桌面上运行,能够感知并学习用户操作,主动提供诸如草拟电子邮件、跟踪待办事项、生成会议摘要等智能化建议。
  • 邮件与消息助手: 快速起草、优化并应用电子邮件和消息,现已支持 Gmail、Slack、iMessage 和 Apple Mail。

  • 自动待办事项检测: 自动识别并草拟待办事项,并及时提醒用户跟进。

  • Logical Lumos: 提供实时任务辅助,例如在 Excel 中智能建议公式、分析错误,或在高亮文档术语时提供解释。

  • 服务连接: 通过连接 Gmail 和 Calendar,实现更深度的上下文理解,支持自然语言搜索邮件和快速查询日历空闲时间。

( @ycombinator)



03有态度的观点 

1、高通 CEO:全球低估了 AI 的巨大潜力

日前,高通 CEO 安蒙(Cristiano Amon)接受彭博社采访,并表示「AI 的能力可能被全球低估了」。

采访中,安蒙将 AI 的发展与互联网的崛起进行对比,并指出互联网的规模如今远超 1999 年互联网泡沫时期的预期。其表示,「今天的互联网比人们想象的要大得多。」

彭博社援引摩根士丹利的预测,到 2028 年,各大公司将在数据中心及其他 AI 基础设施上投入 3 万亿美元(约合人民币 21.37 万亿元)。而这一这一繁荣的背后,也引发了对可能出现的市场崩溃的担忧。

彭博社指出,这种繁荣与 2000 年代初科技行业所经历的情形类似。

针对行业是否会出现 AI 过度的情况,安蒙则认为无需担心,「AI 需要更多算力。」

另外,安蒙还对 AI 硬件这件事表示乐观看待。其对「个人 AI 设备」充满信心,如 Meta 的 AI 智能眼镜 Ray-Ban Meta 等。

值得一提的是,Ray-Ban Meta 用的高通的处理器(如 AR1 Gen 1)。

(@ APPSO)

图片

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。


图片

素材来源官方媒体/网络新闻

注册登录 后评论
    // 作者
    R
    @RTE_Dev_Comm
    还什么也没有写~
    • 0
    // 本帖子
    关键词
    // 相关帖子
    Coming soon...
    • 0
    Logical 桌面智能体:学习用户操作,主动起草邮件待办;印度 AI 语音 Maya Research 开源新语音模型丨日报RTRTE_Dev_Comm