GMF-AI-Audio 组件
概述
GMF-AI-Audio 是基于 GMF 框架开发的语音交互组件,通过封装 ESP-SR,提供从语音唤醒到指令识别的完整交互逻辑。组件集成了唤醒词检测(Wake Word)、语音活动检测(VAD)、语音指令识别以及回声消除(AEC)等功能,能够在智能音箱、智能家居等设备中实现高效、自然的语音交互体验。
支持场景
方式 |
对应场景 |
|---|---|
唤醒后立即上传语音数据,在 Wakeup End 阶段停止上传 |
在云端实现 VAD 功能、RTC 场景 |
唤醒后等待 VAD 触发后开始上传,VAD 结束后停止上传 |
以往智能硬件的交互方式 |
无唤醒,等待 VAD 触发后开始上传,VAD 结束后停止上传 |
新式云端处理逻辑 |
按键后立即上传语音数据,松手后停止 |
算力有限的设备通过与云端交互实现语音功能 |
按键后等待 VAD 触发后开始上传,VAD 结束后停止上传 |
解决仅依赖 VAD 造成的数据量过大的问题 |
唤醒后检测命令词 |
默认使用逻辑 |
无唤醒,等待 VAD 触发后检测命令词 |
可应用于部分车辆系统 |
按键后检测命令词 |
玩具 |
连续命令词识别 |
家居控制 |
相关链接
详细文档:GMF AI Audio 组件
演示工程:GMF AI Audio 示例