对话式 AI 工坊丨基于 TEN Framework 的 Voice Agent 快速应用实战!丨RTE2025
在语音交互技术不断演进的时代,从语音转录、实时翻译到虚拟陪伴与数字人,我们正迈向一个充满“对话式AI”的未来。在这场变革中,开源框架 TEN Framework 正帮助全球开发者更高效地构建新一代 Voice Agent。
自开源以来,TEN Framework 已获得 8k+ GitHub Stars 的认可。今年,我们前往东京、旧金山、巴黎、北京、京都五大城市举办 Workshop,将前沿趋势与落地实践带到开发者身边,手把手帮助你从零完成一个可运行的 Voice Agent 用例,涵盖语音助手、智能客服、会议纪要等多种场景。其超低延迟的实时对话能力与灵活的多模态扩展性,让语音 AI 从概念走向生产环境。
现在,这场实战 Workshop 来到 RTE2025 大会现场:
对话式 AI 工坊:基于 TEN Framework 的 Voice Agent 快速应用实战
时间:2025年11月1日(周六)14:00-17:00
地点:北京朝阳悠唐皇冠假日酒店
这不仅是一场技术分享,更是一次边听边做、边玩边学的实战体验。无论你是刚入门语音交互,还是希望探索更实用的 AI 应用,你都将在现场亲手搭建出一个可交互、可部署的语音 Agent,深入体验语音 AI 在实际场景中的潜力。
活动日程
13:30-14:00 签到入场
14:10-15:00 技术主题分享
主题 1:TEN 开源框架及 usecase 快速上手
嘉宾:Elliot Chen,TEN 框架布道师及主创之一,推特 13K 博主,专注于提升 TEN 框架的易用性和布道对话式 AI
主题 2:TEN VAD & Turn Detection 带来更似真人的对话体验
嘉宾:Ziyi,TEN VAD 核心开发者;Darcula,TEN Turn Detection 作者
15:00-17:00 现场挑战:动手打造你的 Voice Agent!现场技术导师全程陪跑,还有茶歇补能,挑战成功即可领取开发者周边
什么是 TEN Framework?
TEN 是为构建对话式 AI 语音智能体而设计的一套开源工具集。 它让开发者能够快速实现低延迟、多模态的 Voice Agent,支持语音、文本、图像输入输出,兼容主流 STT、TTS、LLM、RTC、RAG 模型,轻松对接 Dify、Coze 等编排工具。
TEN Framework:主流对话式 AI 开源框架,用于构建具备低延迟、多模态的 Voice AI Agent
TEN VAD:低延迟,低功耗,高准确率的语音活动检测 AI 模型
TEN Turn Detection:具备情境感知能力的智能对话轮次管理模型
实战环节 · Game On!
阶段一:快速上手
任选语音转录、实时翻译或虚拟数字人 usecase,成功运行本地项目
阶段二:深度定制
根据实际需求自定义音色、大模型等参数配置和其他功能,让你的项目更贴近真实应用场景。
挑战成功可获得限量周边礼品!
活动前准备
为确保现场顺利上手,请提前准备好以下软硬件配置:
知识:需要知道科学上网的方式(https + SSH), 会用命令行,git 和 Docker
需要下载:Docker、git 和 NodeJS 18
自备电脑一台
报名审核通过后,我们会邀请你进入 Workshop 答疑群,提前搞定前序工作,现场专注探索你的实时 AI 场景!
报名须知
名额有限,为保证现场体验,将采用审核制报名。
审核通过后,我们将邀请你进入专属交流群,提前对接技术准备。
立即扫码报名,锁定席位
*本 Workshop 门票即为 标准票+工作坊 门票,购买后可以参与 RTE 大会全场
*本 Workshop 门票包含:大大会千人高峰论坛免费参与,分论坛免费参与,展区参观体验,大会资料下载,大会伴手礼,开发者专属伴手礼,当日活动下午茶
不只是体验,更要实现,一起动手把 Voice Agent 做进真实场景!11 月 1 日,北京见!

阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么