Google Translate 新增 AI 实时翻译和语言学习功能;奥特曼:手机电脑难发挥 AI 潜力,需要更先进硬件丨日报

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@子禾、@鲍勃

01 有话题的技术

1、xAI Grok Code Fast 1 多平台免费上线

xAI 正式发布其首个专为编程优化的模型 Grok Code Fast 1,内部研发代号为 「Sonic」。这是一个文本推理模型,支持 256k 上下文窗口。

该模型现已同步登陆 Windsurf、Cursor、GitHub Copilot、Roo Code、Kilo Code 及 opencode 等多个 AI 编程工具,并提供限时免费使用。(@ 橘鸭 Juya)

2、NVIDIA 发布 Jet-Nemotron 系列小模型,性能与效率双突破

NVIDIA 近日推出了全新的 Jet-Nemotron 语言模型系列,包含 Jet-Nemotron-2B 和 Jet-Nemotron-4B 两种尺寸。该系列由全华人团队开发,通过引入后神经网络架构搜索(PostNAS)和新型线性注意力模块 JetBlock,在不牺牲性能的前提下大幅提升了推理效率。

核心技术与亮点

后神经网络架构搜索 (PostNAS):不同于从零开始训练新架构,PostNAS 是一种在已预训练的 Transformer 模型基础上进行优化的高效流程。它能智能识别并优化最重要的注意力层,从而在保持高准确率的同时,显著提升长上下文推理的吞吐量。

  • JetBlock:作为一项核心技术创新,JetBlock 是一种新型的线性注意力模块。通过将动态卷积与硬件感知架构搜索相结合,JetBlock 在与 Mamba2 等先前设计相似的训练和推理速度下,实现了更高的准确率。

  • 卓越性能:在全面的基准测试中,Jet-Nemotron 系列在数学、代码、常识、检索和长上下文等多个维度上,表现优于 Qwen3、Gemma3、Llama3.2 等主流开源模型。

  • 惊人效率:得益于架构优化,Jet-Nemotron 系列模型在 NVIDIA H100 GPU 上的推理吞吐量最高可提升至 53.6 倍。特别是在长上下文处理方面,其解码吞吐量可实现数量级提升,快了 50 倍以上。

Jet-Nemotron 的发布,延续了 NVIDIA 在小模型领域的持续探索,并进一步展示了在小参数量模型上实现性能与效率兼得的巨大潜力。

相关链接:https://github.com/NVlabs/Jet-Nemotron?tab=readme-ov-file(@ GitHub、@新智元)

02 有亮点的产品

1、Google Translate 新增 AI 实时翻译和语言学习功能

Google 近期宣布,得益于其 Gemini AI 模型,Google Translate 正在进行重大升级。此次更新主要引入了两大核心功能,旨在为用户提供更自然、更高效的语言交流体验。首先是实时会话翻译,用户现在可以在应用中与他人进行双向实时语音对话,应用会即时提供语音和文本翻译。这项功能支持超过 70 种语言,并能智能识别对话中的停顿和口音,即使在嘈杂环境中也能提供高质量的翻译。目前,该功能已在美国、印度和墨西哥率先上线。

此外,为了更好地帮助用户掌握会话技能,Google Translate 还推出了定制化的语言学习功能。该功能能够根据用户的技能水平和学习目标,自动生成个性化的听力与口语练习场景。这些练习以互动形式展开,用户可以进行听译或口语练习,并获得实时提示。这一 beta 版本体验已开始向部分用户开放,首批支持英语学习者练习西班牙语和法语,以及西班牙语、法语、葡萄牙语学习者练习英语。

这些新功能的推出,标志着 Google Translate 正在从一个简单的语言翻译工具,向一个更加智能和多功能的 AI 语言伙伴转变。(@ Google blog )

2、Wayline 推出 AI 语音助手,革新物业管理模式

Wayline 公司近日推出了一款专为物业经理打造的 AI 语音与文本解决方案。该方案旨在通过全天候运行的 AI 助手,自动化处理传统上由接待员、租赁代理和维修协调员负责的所有任务,以解决物业管理行业劳动密集、利润低且沟通重复的痛点。

产品核心与技术亮点

  • 全天候自动化服务:Wayline 为物业提供一个「永不下班」的 AI 前台。它能够即时响应每一通电话和每一条短信,高效处理租户咨询、租赁线索转化和维修问题分诊。

  • 深度数据整合:该 AI 助手通过整合数百个公共及专有数据源的信息,实时解决问题并自动化后续跟进流程。对于租户和潜在客户而言,拨打电话或发送短信即是直接的交互界面,大大简化了沟通流程。

  • 行业变革时机:尽管房地产行业因其分散的平台和微薄的利润多年来对技术革新持抗拒态度,但 AI 的出现彻底改变了劳动力成本结构。Wayline 抓住这一契机,利用软件自动化实现了对物业管理行政工作的规模化运营。

Wayline 的创始人团队由 Jason Okra 和 Eric Rowell 组成,他们不仅拥有深厚的房地产行业经验(曾任职于 WeWork 和 WeLive),还兼具多次成功创业经历和企业软件开发背景(曾任职于 LinkedIn 和 Workday)。目前,他们的目标是为美国 4600 万套租赁住房单位提供 AI 运营服务。

相关链接:https://www.ycombinator.com/launches/OGH-wayline-ai-voice-and-text-for-property-managers(@ YCombinator )

3、百度正式发布 AI 搜索 APP「梯子 AI」

近期,百度在各大应用商店悄然上线了一款新 AI 应用「梯子 AI」(Tizzy AI),官方定位为 AI 智能搜索工具。该产品目前有两大功能,其一是类似 DeepSeek 等产品的 AI 问答工具,其二是整合了百度网盘的在线视频播放器。

作为问答工具 ,梯子 AI 彻底摒弃了百度搜索界面,而是根据用户提问直接提供答案,答案中会附上各种超链接,用户可以通过这些超链接访问具体的网页内容。目前梯子 AI 提供了自动模式与深度模式两种回答方式,但百度没有表明调用了哪种模型,只表示「融合了多个大模型的能力」。

此外,产品还提供了丰富的视频内容 ,分为影视、短剧、动漫三个板块,例如影视片单有 Netflix、AppleTV、Disney+等流媒体平台的热播剧。不过梯子 AI 似乎并没有获得这些视频内容的版权,因此当用户点击某个热播剧,梯子 AI 只会检索网络,提供第三方平台的播放链接,不过用户可以使用百度网盘对其加速。梯子 AI 试图通过这种方式规避版权风险。

目前梯子 AI 无广告、无会员体系,加速功能也免费提供,看起来这款产品打算模仿夸克曾经的增长方式,通过免费、快速、高质量的视频内容获取用户。(@新皮层 NewNewThing)

03 有态度的观点

1、国务院发布《关于深入实施「人工智能+」行动的意见》

8 月 26 日,国务院印发《关于深入实施「人工智能+」行动的意见》,旨在通过推动人工智能(AI)与各行各业的深度融合,加速中国经济与社会的智能化转型。

该《意见》规划了六大重点行动,包括将 AI 融入科学研究、产业发展、民生消费、社会治理和全球合作中。在产业层面,重点是培育智能原生的新模式和新业态,推动工业、农业和服务业的全面智能化升级。在民生领域,目标是创造更加智能的工作方式、提供更高效的学习模式、并打造更有品质的智能生活。

为保障这些目标的实现,文件还强调了多项基础支撑,包括提升模型能力、强化数据供给、统筹智能算力、繁荣开源生态以及健全人才培养和政策法规体系。

根据规划,到 2027 年,AI 将与六大领域广泛融合,新一代智能终端普及率将超过 70%;到 2035 年,中国将全面进入智能经济和智能社会新阶段,为现代化建设提供有力支撑。(@ 中国政府网)

2、OpenAI 教育负责人:AI 将重塑教育与职场技能需求

在《OpenAI Podcast》节目中,OpenAI 教育负责人 Leah Belsky 强调,人工智能正在深刻改变教育和就业市场。她援引数据指出,如今有 70% 的雇主更愿意雇佣掌握 AI 技能的应届毕业生,而非拥有十年经验但不懂 AI 的职场老手。这表明,AI 已经从一项加分技能转变为毕业生进入职场的必备素养。Belsky 认为,AI 将成为全球学生平等的「助推器」,为那些缺乏优质教师或家庭辅导的学生提供一个耐心、随时的学习伙伴。

Belsky 介绍,AI 的参与正使教育进入一个过渡期,教学重点从机械化任务转向更深层次的意义与目的性。她提到,未来的教育将是一种「混合模式」:由 AI 提供标准化、可随时获取的内容,而人类导师则专注于提供个性化指导,并引导学生进行批判性思维和伦理思考。在此背景下,OpenAI 推出了 Study Mode 功能,旨在将 ChatGPT 从一个简单的答题工具转变为一位以苏格拉底式方法引导学生学习的私人导师,以鼓励学生主动探索和掌握知识。

她总结道,虽然有人担忧 AI 可能导致学生「变笨」,但关键在于如何正确使用这一工具。如果学生将 AI 视为一种辅助工具而非捷径,它能极大地提升学习效率和创造力。最终,适应能力将成为 AI 时代新的就业保障,无论是学生还是职场人士都需要不断学习和拥抱新技术。(@ Z Potentials )

3、Sam Altman:手机、电脑难发挥 AI 潜力,需要更先进的硬件载体

(@极客公园)

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

写在最后:

我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

注册登录 后评论
    // 作者
    R
    @RTE_Dev_Comm
    还什么也没有写~
    • 0
    // 本帖子
    // 相关帖子
    Coming soon...
    • 0
    Google Translate 新增 AI 实时翻译和语言学习功能;奥特曼:手机电脑难发挥 AI 潜力,需要更先进硬件丨日报RTRTE_Dev_Comm