Mappa 语音 AI 招聘:声学信号分析候选人表现,ARR 300 万美元;上海银行推出首个沪语交互 AI 应用丨日报
开发者朋友们大家好:
这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的技术」、「有亮点的产品」、「有思考的文章」、「有态度的观点」、「有看点的活动」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
本期编辑:@Jerry fong,@鲍勃
01有话题的技术
1、llama.cpp 彻底进化:本地 AI 迎来多模态革命,Ollama 恐被「降维打击」
开源 AI 推理引擎 llama.cpp 正以一场史诗级更新,重新定义「本地大模型」的使用体验。曾经以极简 C++代码著称的它,如今不仅拥有了现代化 Web 界面,更一举实现多模态输入、结构化输出与并行交互三大突破,直击 Ollama 等封装型工具的功能短板。这场由社区驱动的本土化革命,正在将 llama.cpp 从开发者专属的底层引擎,推向普通用户也能轻松上手的全能 AI 工作台。
多模态全面落地:图片、音频、PDF 一键解析
本次更新最引人瞩目的,是多模态能力的原生集成。用户现在可直接拖入图片、音频文件或 PDF 文档,与文本提示混合输入,触发模型进行跨模态理解。例如,上传一份含图表的 PDF 技术白皮书,系统会自动将其转为图像输入(若模型支持视觉),避免传统 OCR 文本提取中的格式错乱与信息丢失。视频支持也已在规划中。这意味着,llama.cpp 已从纯文本推理工具,跃升为覆盖文档分析、创意辅助、教育研究等场景的本地多媒体 AI 中枢。
交互体验脱胎换骨:并行聊天、Prompt 编辑、移动端友好
全新 Web 界面基于 SvelteKit 构建,轻量、响应迅速,且完美适配手机端。用户可同时开启多个聊天窗口,一边处理图像分析,一边进行代码生成;还能对历史对话中的任意 Prompt 进行修改并重新生成,轻松探索不同回答分支。通过 llama-server 的--parallel N 或--kv-unified 参数,系统还能智能分配显存与上下文,实现资源高效利用。会话支持一键导入导出,既保障隐私,又不失云端级便利。
创新功能引爆效率:URL 直连对话 + JSON 结构化输出
两大隐藏利器更显开发者巧思:
其一,URL 参数注入——用户只需在浏览器地址栏附加文本参数(如?prompt=解释量子计算),即可自动启动对话,Chrome 用户经简单配置后甚至能一键唤起分析,极大简化重复查询流程。
其二,自定义 JSON Schema 输出——在设置中定义结构模板后,模型将严格按指定格式生成结果,无需反复提示「请用 JSON 返回」。发票信息提取、数据清洗、API 响应生成等任务,从此可实现「模板即服务」,真正迈向企业级自动化。
性能与隐私双保险,开源生态再树标杆
更新还包含多项专业优化:LaTeX 公式内联渲染、HTML/JS 代码实时预览、采样参数(Top-K、Temperature 等)精细调节,以及对 Mamba 等 State Space Models 的上下文管理改进,显著降低多任务并发时的计算开销。最关键的是,所有操作 100%本地运行,不依赖云端,无数据上传,在 AI 隐私焦虑日益加剧的当下,提供了真正可信的本地智能方案。
AIbase 认为,llama.cpp 此次升级已超越「推理引擎」范畴,正在构建一个开放、高效、安全的本地 AI 生态标准。面对 Ollama 等仅做简单封装的竞品,llama.cpp 以深度集成、灵活扩展与社区驱动的优势,展现出「降维打击」之势。随着更多开发者加入共建,这场由 C++代码点燃的本地 AI 革命,或将重塑整个大模型应用的未来格局。
(@AIBase)
02有亮点的产品
1、Moss:专为对话式 AI 设计的高性能实时语义搜索运行时
由前 Grammarly 和 Microsoft 资深专家创立的 Moss,近日发布了专为对话式 AI 设计的高性能实时语义搜索运行时。该方案通过将检索能力直接集成到智能体和应用运行时中,消除了网络延迟,实现了亚 10 毫秒的本地查询响应。
这不仅解决了传统对话式 AI 因检索滞后导致的「对话中断」问题,大幅提升了用户体验的自然流畅度,同时显著降低了基础设施和出口成本。
突破性性能: Moss 提供一个高性能运行时,用于实时「语义搜索」。它能实现亚 10 毫秒的本地查询响应,支持即时索引更新,并承诺零基础设施开销。
本地化检索优势: 平台允许用户在智能体(agent)和应用运行时中直接嵌入和索引数据(如文档、聊天历史、遥测数据),从而在云端、浏览器内或设备端实现本地检索,避免网络跳跃造成的延迟。
管理与扩展: Moss 提供托管数据层 (https://usemoss.dev),用于索引的存储、同步和分发。同时,提供 JavaScript 和 Python SDKs,简化开发者集成流程。
技术背景: 创始人 Sri Raghu Malireddi (前 Grammarly ML Lead, Microsoft) 和 Harsha Nalluru (前 Microsoft Tech Lead) 拥有在 LLM、高性能计算及大规模系统构建方面的丰富经验。
市场验证与增长: Moss 已有 6 家企业设计伙伴和 3 个付费客户。目前,其使用量和收入每周增长约 100%。
(@Moss)
2、Mappa语音 AI 招聘:声学信号分析候选人表现
Mappa 是一家由巴西企业家 Sarah Lucena 创立的语音 AI 初创公司,通过分析超过 30 种声学信号,以前所未有的准确性预测候选人的兼容性和绩效。该公司旨在解决传统招聘效率低下(近半新员工在 18 个月内离职)的痛点,为企业提供一种更智能、更人性化的行为 AI 招聘解决方案,加速人才识别与团队建设。
独家行为洞察技术:
Mappa 的核心技术基于对语言学和韵律信号(如语调、语速、用词、句式、停顿等)的深度分析,而非依赖视频数据,因为它发现「语音能揭示人们的真实面貌」,而视频中人们常「表现出他们希望被感知的样子」。
显著提升招聘效率与准确性:
平台能将实时、基于行为的数据转化为招聘信号,帮助企业在数小时内找到高度匹配的候选人,甚至实现「从首次面试到发出 Offer 在同日完成」,大大加速招聘流程并提高决策信心。
市场验证与快速增长:
Mappa 在未引入外部资本前即实现盈利,截至 2025 年,其年化收入已超过 300 万美元,服务客户逾 100 家。公司获得 Draper Associates 的投资支持,并受益于其创始人 Sarah Lucena 高效的商业模式。
从招聘到全方位人才智能体:
Mappa 近期推出了 API,将其行为评分引擎扩展至教育、医疗和信用风险评估等其他领域,正逐步发展成为一个全面的「人才智能体」(Talent Intelligence)平台,旨在赋能更广泛的以人为主导的决策过程。
(@Forbes)
3、苹果 Apple Intelligence 入华目标为 iOS 26.4
彭博社记者马克·古尔曼报道称,苹果公司的人工智能功能 Apple Intelligence 入华计划已再度延期。苹果公司原先的目标是在 iOS 26.1 或 iOS 26.2 版本中推出该功能,但这些版本已发布或即将发布,其中并未包含 Apple Intelligence。目前,苹果已将最新目标调整为 iOS 26.4 版本,并计划同步推出新一代 Siri 语音助手。根据以往 iOS 。4 版本的发布节奏推算,该版本可能在明年春季发布,但古尔曼表示,目前没有任何苹果员工能保证该功能能如期落地。
(@橘鸭 Juya)
4、Rokid 眼镜联合支付宝推「看一下支付」,全机型支持双支付方式
支付宝「看一下支付」功能近日完成重要升级,正式成为 Rokid 乐奇智能眼镜标配支付方式。此次升级覆盖安卓与 iOS 全系机型,用户在嘈杂环境下也可通过语音快速唤醒支付,并直接于眼镜屏上查看付款信息。
全面兼容多手机平台;
支持扫码与「支付宝碰一下」双支付方式;
提升语音识别精准度与界面响应速度;
新增智能金额计算功能。用户仅需说出「乐奇,支付」,看向商家二维码或感应设备,再说「确认支付」即可三步完成交易,体验更为高效流畅。
(@APPSO)
5、上海银行推出首个沪语交互 AI 应用,助力智慧养老金融服务
近日,上海财跃星辰智能科技有限公司、上海阶跃星辰智能科技有限公司与上海银行股份有限公司在上海正式签署战略合作协议,隆重推出国内首个支持完整沪语(上海方言)交互的 AI 应用。这一创新项目标志着我国在养老金融与方言智能的金融大模型体系建设方面迈出重要一步,旨在为习惯使用方言的老年群体提供更便捷、更贴心的金融服务。
新推出的 AI 应用实现了从语音唤醒、多轮对话到业务办理的全流程方言智能化服务,彻底打破了传统金融服务在语言上的障碍。
上海银行副行长胡德斌表示,该系统成功解决了沪语服务中「听得懂」「说得准」的核心难题,并已针对老年客户进行了专项优化,显著提升了用户体验,体现了对特殊群体的关怀。
该 AI 手机银行的应用理念是 「对话即服务」。客户可通过文字或语音快速完成转账、理财咨询及养老金管理等高频金融服务。
更进一步,该应用不仅限于传统的银行服务,还创新性地整合了就餐、出行、娱乐等非金融场景,推动 「生活 + 金融」一体化服务的实现,使其真正成为客户的日常生活助手。
据财跃星辰 CEO 贾宝龙介绍,此次合作的技术基石是财跃星辰基于海量金融语料训练而成的多模态财跃大模型,该模型具备卓越的图像处理与图表理解能力,为上海银行在金融领域的 AI 应用提供了强有力的技术支撑。
三方的合作通过将高质量数据与大模型能力相结合,有望推动上海银行成为全国在金融大模型应用方面的先行者。
(@AIBase)
03有态度的观点
1、AI 教父:AI 要赚钱必须替代人类劳动
据《财富》报道,「AI 教父」计算机科学家 Geoffrey Hinton 近日在一次采访中表示,科技巨头若想从巨额 AI 投资中获利,唯一可行的方式是以 AI 替代人类劳动。
Hinton 指出,除了向用户收取聊天机器人使用费外,「用更便宜的替代品取代工人」将成为企业实现盈利的主要路径。
Hinton 强调,尽管部分经济学家认为新技术往往会创造新岗位,但他并不确信 AI 会延续这一规律。
他直言:「大型公司押注 AI 将导致大规模岗位替代,因为这才是资金流向的地方。」
报道援引数据称,微软、Meta、Alphabet 和亚马逊四大「AI 超级玩家」预计在下财年将资本支出从 3600 亿美元提升至 4200 亿美元。
同时,OpenAI 近期已与英伟达、博通和甲骨文等公司签署总额达 1 万亿美元的基础设施合作协议。当被问及这些投资是否可能在不取代人类劳动的情况下收回成本时,Hinton 回答:「我认为不可能。要赚钱,就必须替代人类劳动。」他在 9 月份也曾警告,AI 将带来「大规模失业和巨额利润」,这是资本主义体系的必然结果。
此外,市场迹象显示,AI 已对就业产生冲击。自 ChatGPT 推出以来,招聘岗位数量下降约 30%,其中入门级岗位受影响最为明显。
(@APPSO)

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么
写在最后:
我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。
对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。
资料来源官方媒体/网络新闻