是否有用于监听音频命令的Kotlin或Java库？（想在孩子们大喊“不给糖就捣蛋”时触发万圣节展示）_Java_Audio_Raspberry Pi_Speech Recognition_Speech To Text

是否有用于监听音频命令的Kotlin或Java库？（想在孩子们大喊“不给糖就捣蛋”时触发万圣节展示）

java audio raspberry-pi speech-recognition

是否有用于监听音频命令的Kotlin或Java库？（想在孩子们大喊“不给糖就捣蛋”时触发万圣节展示）,java,audio,raspberry-pi,speech-recognition,speech-to-text,Java,Audio,Raspberry Pi,Speech Recognition,Speech To Text,目标：在低端设备raspberry pi 3上听一组固定的音频短语命令，我的“嘿谷歌”或“嘿Siri” 这可能是一个非常有限的词汇表，少于10个命令检测到命令时触发Kotlin函数。无需使用大量CPU或大量网络带宽。 AFAIK现代边缘设备Echo、智能手机、Google Home等都有非常奇特的硬件+软件解决方案，使它们能够在不占用大量CPU的情况下连续收听关键字，也不必将所有音频发送到云服务器。我希望有同样的，但不确定是否可能-我确信他们训练了他们最小且高效的“Hey Siri”ML

目标：

在低端设备raspberry pi 3上听一组固定的音频短语命令，我的“嘿谷歌”或“嘿Siri” 这可能是一个非常有限的词汇表，少于10个命令检测到命令时触发Kotlin函数。无需使用大量CPU或大量网络带宽。 AFAIK现代边缘设备Echo、智能手机、Google Home等都有非常奇特的硬件+软件解决方案，使它们能够在不占用大量CPU的情况下连续收听关键字，也不必将所有音频发送到云服务器。我希望有同样的，但不确定是否可能-我确信他们训练了他们最小且高效的“Hey Siri”ML模型来处理各种口音、音量、节奏、年龄、背景噪音等

Java语音API JSAPI似乎。。。不确定。很多例子都很老，要么指向不受支持的libs，要么最终使用了googlecloudspeech。这不一定是Java/Kotlin库，我还可以包装一个本机命令侦听器进程。我正在查看ML工具包和Firebase ML，但没有看到音频到命令的转换。如果我能调整敏感度，戴着假面具的小孩会大叫“TWIC R TREET”或“TMURMP…”，那就最好了。。。TWEEF’或其他什么应该仍然这样做。 ... 但不是一个纯粹的音量检测器，开车经过的汽车不应该触发它。

有什么建议吗？或者要求rpi是不合理的？

是的，我建议有一个非常有用的库：

您可以使用一个离线工作的库，而不需要其他在线服务器。

有时公认的结果是相当不准确的。为了解决这个问题，我使用了一个比默认字典小得多的字典。我从未在Raspberry Pi上对其进行过全面测试，但我认为它应该可以工作。

您可以使用一个离线工作的库，而不需要其他在线服务器。

有时公认的结果是相当不准确的。为了解决这个问题，我使用了一个比默认字典小得多的字典。我从未在Raspberry Pi上完全测试过它，但我认为它应该可以工作。

最好用Python，而不是java。RPi上的Java是meh。最好用Python，而不是Java。RPi上的Java是meh。看起来很棒！我让第一步开始了。对关键词有什么建议吗？看起来很棒！我让第一步开始了。对关键词有什么建议吗？看起来很棒！我让第一步开始了。对关键词有什么建议吗？看起来很棒！我让第一步开始了。对关键词有什么建议吗？