带唤醒功能的Google Python语音识别

问题描述

我在一台覆盆子PI上使用了Google Python语音识别,它工作得真的很好。然而,它一直在倾听,我更喜欢有一个唤醒词,这样它就只在我需要的时候才倾听。

此时,它会监听,直到出现静音(或返回到任何环境背景噪音),然后将声音片段发送到API以进行语音到文本识别。我有没有办法缩短它在监听的时间?这样,它可以一次只听一个单词,并等待我设置的任何唤醒单词。


解决方案

最好是离线实现唤醒检测。看看Snowboy。他们允许你上传一些唤醒单词的录音,你可以得到一个经过训练的模型,然后你可以把它包括在你的应用程序中。

相关文章