胡彦斌也在 AI Coding 的时代,开发语音智能体也是一句话的事情了
搭一个 Voice Agent,总共分几步?
第一步,安装 agora skills;
第二步,一句提示词:“帮我做一个语音助手”;
第三步,与 Agent 对话想做一个能实时语音对话的 AI Agent——"你说话它立刻回,还能打断"那种。
但打开编辑器之后,大概率会卡在第一步:选方案、注册、配密钥、找 Sample、调 SDK……还没写到业务逻辑,兴致已经磨掉一半。
"配环境比写代码还累"——这个体感,懂的都懂。
Agora Skills 是来解决这个问题的
它不是一个框架,也不是一个 SDK。它是一份给 AI 看的"说明书"——丢进 Claude Code、Cursor,或者任何一个编程助手里,它们就学会了怎么操作 Agora 的全套基础设施。
官方 Quick Start 只有一句话:
Install the Agora skill from https://github.com/AgoraIO/skills and use it. I want to build a voice AI agent demo. Walk me through the full setup.
然后 AI 会自己完成:
登录 Agora 控制台(没账号就自动引导注册)
创建项目,提取相关ID
克隆对应技术栈的 Conversational AI Sample
本地运行,让你直接和 Agent 对话
开发者主要负责提需求和验收。
为什么值得关注 Voice Agent?
AI 硬件在找"嘴"和"耳朵"。AI 玩具、可穿戴设备、车载助手、机器人——这些场景不需要打字界面,需要低延迟的实时语音交互。你写的 Agent 可能明天就能跑在某个硬件上。
对话体验在进化。用户要的不是"我说一句、我等三秒、你回一句"的回合制,而是打断、插话、情绪同步——这依赖真正的实时音视频传输。
开发成本在骤降。Agora Skills 这类工具的出现,把"从想法到可对话 Demo"的时间从几天压缩到十几分钟。Demo 快了,迭代就快了,MVP 验证的成本就低了。
安装方式
npx 一键装
npx skills add github:AgoraIO/skillsAgora Skills 适用于 cursor、codex、Claude code 等 AI 编程助手,或者任何可以读取基于 skill.md 的环境。
适合谁玩?
想快速验证 Voice Agent idea 的产品开发者
在做 AI 硬件(玩具、穿戴、车载、机器人)需要实时语音能力的工程师
想给现有应用加"能听会说"能力的全栈开发者
单纯好奇"AI 编程助手能做到什么程度"的技术爱好者
去试试,现在就能跑起来
GitHub 指路
https://github.com/AgoraIO/skills
现在安装,今晚就能搭个能说话的 Agent。不管是 AI 陪伴、智能客服、语音玩具,还是接进自己的硬件项目,有个能跑起来的 Demo 比什么都重要。
如果用Agora skills做了有意思的项目,欢迎来 RTE 开发者社区分享。我们很乐意帮你曝光,也期待看到你的 Demo 视频。
欢迎在评论区聊聊:
你想做一个什么样的语音Agent?

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么