如何实现无需记忆命令的AI语音控制
扫描二维码
随时随地手机看文章
想想看:语音控制无处不在——在智能电视、遥控器、智能家居设备中。然而,大多数人在第一次尝试后就不再使用它了。为什么?因为只有当你记住一组严格的命令时,它才有效。漏掉一个字,系统就会忽略你。
在VoxControl固件v.2中,这种体验发生了变化。这是第一次,制造商可以尝试未来的设备应该是什么样子:你自然地说话,系统对你的意思做出反应,而不仅仅是你的语言。所有这些都直接在您已经拥有的ESP32-S3上脱机运行。
为什么重要?
这不仅仅是一个板的升级。这是对未来设备将如何倾听和回应的一瞥。而不是训练你像机器一样说话,机器会适应你。没有云服务,没有互联网,没有记忆命令——只有自然的声音输入,真实的动作输出。对于教室、研讨会和演示,它使交互变得毫不费力。对于oem厂商来说,这是一个小而真实的概念验证,说明了语音控制的发展方向。
用例
基本的机器人控制。VoxControl v.2可以理解变化,而不是记忆一个严格的短语。说“前进”、“前进”或“前进”——机器人仍然向前移动。这同样适用于转弯和停车。
课堂实验。在机器人课上,孩子们经常忘记“官方”词汇。现在,一个学生可以说“向左走”,另一个说“向左转”,两者都会使机器人转弯。重点是学习,而不是记住小抄。
DIY扩展。VoxControl并不局限于机器人。连接led,风扇或小型电机,并映射“停止/停止”来关闭它,或“去”来打开它。使用固件v.2,您可以立即将自然语音控制扩展到简单的DIY项目。
界面原型。如果你好奇人们是如何自然地与设备交谈的,这个固件是一个动手探索它的方式。通过测试不同的短语,您可以看到哪些短语感觉直观,以及识别系统应该如何响应。
它是如何工作的
在引擎盖下,这是一个巧妙的技巧。麦克风接收语音,ASR模型将其转换为文本,分类器将不同的短语映射为相同的动作。“前进”、“继续”或“继续”都会触发同样的行为。看起来像理解的东西实际上是一个经过精心优化的识别管道,它被打包到ESP32-S3中,并完全在边缘运行。
自己试试
VoxControl的所有者可以请求固件v.2, flash它,并立即看到变化。用你想要的方式说出命令,董事会就会做出回应。前进、转弯、停车——当你不需要记住“正确”的短语时,一切都感觉更流畅、更自然。
请随时在Hackster上向我们发送消息或发送电子邮件至hi@grovety.com请求固件更新。
接下来是什么
这次更新仅仅是个开始。如果你们中的许多人要求相同的新单词或动作,我们将在未来的固件版本中包含它们。通过尝试VoxControl v.2,您不仅仅是升级了一个板-您正在帮助塑造未来自然语音控制的工作方式。
分享你的反馈
什么词最适合你?你希望包括哪些?您的意见将指导下一轮的更新,并使我们更接近我们所期望的倾听方式的设备。
本文编译自hackster.io





