胡彦斌也在 AI Coding 的时代,开发语音智能体也是一句话的事情了

图片


搭一个 Voice Agent,总共分几步?


第一步,安装 agora skills;
第二步,一句提示词:“帮我做一个语音助手”;
第三步,与 Agent 对话

想做一个能实时语音对话的 AI Agent——"你说话它立刻回,还能打断"那种。

但打开编辑器之后,大概率会卡在第一步:选方案、注册、配密钥、找 Sample、调 SDK……还没写到业务逻辑,兴致已经磨掉一半。

"配环境比写代码还累"——这个体感,懂的都懂。


Agora Skills 是来解决这个问题的


它不是一个框架,也不是一个 SDK。它是一份给 AI 看的"说明书"——丢进 Claude Code、Cursor,或者任何一个编程助手里,它们就学会了怎么操作 Agora 的全套基础设施。


官方 Quick Start 只有一句话:

Install the Agora skill from https://github.com/AgoraIO/skills and use it. I want to build a voice AI agent demo. Walk me through the full setup.


然后 AI 会自己完成:

  • 登录 Agora 控制台(没账号就自动引导注册)

  • 创建项目,提取相关ID

  • 克隆对应技术栈的 Conversational AI Sample

  • 本地运行,让你直接和 Agent 对话


开发者主要负责提需求和验收。


为什么值得关注 Voice Agent?


AI 硬件在找"嘴"和"耳朵"。AI 玩具、可穿戴设备、车载助手、机器人——这些场景不需要打字界面,需要低延迟的实时语音交互。你写的 Agent 可能明天就能跑在某个硬件上。


对话体验在进化。用户要的不是"我说一句、我等三秒、你回一句"的回合制,而是打断、插话、情绪同步——这依赖真正的实时音视频传输。


开发成本在骤降。Agora Skills 这类工具的出现,把"从想法到可对话 Demo"的时间从几天压缩到十几分钟。Demo 快了,迭代就快了,MVP 验证的成本就低了。


安装方式

npx 一键装
npx skills add github:AgoraIO/skills

Agora Skills 适用于 cursor、codex、Claude code 等 AI 编程助手,或者任何可以读取基于 skill.md 的环境。

Agora Skills 让 M5STACK 开口说话


适合谁玩?

  • 想快速验证 Voice Agent idea 的产品开发者

  • 在做 AI 硬件(玩具、穿戴、车载、机器人)需要实时语音能力的工程师

  • 想给现有应用加"能听会说"能力的全栈开发者

  • 单纯好奇"AI 编程助手能做到什么程度"的技术爱好者


去试试,现在就能跑起来


GitHub 指路 https://github.com/AgoraIO/skills


现在安装,今晚就能搭个能说话的 Agent。不管是 AI 陪伴、智能客服、语音玩具,还是接进自己的硬件项目,有个能跑起来的 Demo 比什么都重要。


如果用Agora skills做了有意思的项目,欢迎来 RTE 开发者社区分享。我们很乐意帮你曝光,也期待看到你的 Demo 视频。

欢迎在评论区聊聊:

你想做一个什么样的语音Agent?

图片

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么


图片

注册登录 后评论
    // 作者
    R
    @RTE_Dev_Comm
    还什么也没有写~
    • 0
    // 本帖子
    分类
    // 相关帖子
    Coming soon...
    • 0
    胡彦斌也在 AI Coding 的时代,开发语音智能体也是一句话的事情了RTRTE_Dev_Comm