第一个神经语音模块的制造商:tinyTTS套件
扫描二维码
随时随地手机看文章
多年来,我们通过播放MP3片段让电路板“说话”。非常适合用于演示—直到您需要新单词或实时值。少量固定的短语、大的闪光足迹和缺乏灵活性意味着每次更改都需要重复。
我们问了一个不同的问题:微控制器能在飞行中产生声音吗?云TTS几年前就证明了这个想法;我们希望在边缘上,在使用小电池的硬件上也能有同样的自由。
因此,我们将CrowPanel Advance 5.0 HMI (ESP32-S3, Arduino/LVGL)与基于Himax HX6538 (Cortex-M55 + Ethos-U55)构建的GRC TinyTTS Kit配对进行合成。变化是即时的:不再播放-设备在说话。
演示流程很简单:
•用户在PC上输入文本。
•文本通过USB发送到CrowPanel (ESP32-S3)。
•CrowPanel通过UART将文本转发到TinyTTS工具包。
•HX6538可以实时合成语音。
•音频通过模块的3.5毫米插孔播放到外部扬声器或耳机。
是的,你可以输入任何你想要的文本。甚至有几个段落会被大声朗读。
为什么它很酷
当董事会不是在假装声音,而是在创造声音时,感觉就不一样了。
•任何短语,不只是一个库。
•数字,日期,传感器值生成的需求。
•带有精确细节的动态警告。
•闪存留下干净-没有成堆的音频文件。
•离线工作-没有云,没有延迟。
这就是按下播放键和进行对话的区别。
适合的地方
我们认为TinyTTS可以在以下方面发挥作用:
•能读出有效值的传感器,
•设备会说出自己的错误,
•机器人讲述他们的行动,
•带有灵活对话的玩具或学习工具包,
•在正确的时间发出正确警报的安全系统。
但老实说,这只是我们的猜测。真正的“哇”可能来自我们想象不到的地方。
已知的限制
•最适合短至中等文本;很长的段落是可以的,但不是主要目标。
•语音质量调整为MCU内存,而不是高保真。
•有限的声音/语言(现在只有英语)。
•需要外部扬声器(通过3.5毫米插孔)。
硬件要求
•CrowPanel Advance 5.0 HMI (ESP32-S3, Arduino/LVGL)
•GRC TinyTTS套件(Himax HX6538, Cortex-M55 + Ethos-U55) -目前仅限预订-联系我们hi@grovety.com
•USB-C线(用于闪烁CrowPanel)
•UART跳线(TX/RX + GND)
•有源扬声器或耳机(3.5毫米插孔)
布线
•CrowPanel TX→TinyTTS RX
•CrowPanel RX→TinyTTS TX
•GND→GND
•音频输出:3.5毫米插孔上的TinyTTS→扬声器
•电源:USB-C (CrowPanel)和5v (TinyTTS)
将CrowPanel上的UART1-OUT开关设置为WM模式(见图)。
固件和软件
•Flash CrowPanel与提供的Arduino草图(LVGL文本输入+ UART输出)。
•GRC TinyTTS套件带有预先闪现的固件,用于设备上合成。
•源代码和示例可在GitHub。
运行Demo
•通过USB-C连接CrowPanel到您的PC并上传演示草图。
•Wire CrowPanel↔GRC TinyTTS over UART。
•将扬声器插入TinyTTS上的3.5毫米音频插孔。
•启动CrowPanel
•从python/app中运行一个应用程序,在PC上输入文本,将其发送到CrowPanel,然后按CrowPanel触摸屏上的“Say”。
•TinyTTS模块将合成并播放语音。
接下来是什么
这个设置不仅仅是一个演示——它是一个测试新想法的游乐场。使用GRC TinyTTS工具包,您可以快速原型语音功能,并看到它们在真实硬件中的感觉。一旦原型按您想要的方式工作,您就可以将GRC TinyTTS套件放入另一个环境- Arduino项目,甚至直接放入工作设备中。这样,同样的技术可以顺利地从实验转移到生产。
总结
当一块光秃秃的木板突然开始说话时,那是一种奇怪而又快乐的感觉。这让我想起了我做第一个无线电接收机的时候,打开它——它说话了。
本文编译自hackster.io





