是否有用于监听音频命令的Kotlin或Java库?(想在孩子们大喊“不给糖就捣蛋”时触发万圣节展示)
目标: 在低端设备raspberry pi 3上 听一组固定的音频短语命令,我的“嘿谷歌”或“嘿Siri” 这可能是一个非常有限的词汇表,少于10个命令 检测到命令时触发Kotlin函数。 无需使用大量CPU或大量网络带宽。 AFAIK现代边缘设备Echo、智能手机、Google Home等都有非常奇特的硬件+软件解决方案,使它们能够在不占用大量CPU的情况下连续收听关键字,也不必将所有音频发送到云服务器。我希望有同样的,但不确定是否可能-我确信他们训练了他们最小且高效的“Hey Siri”ML模型来处理各种口音、音量、节奏、年龄、背景噪音等 Java语音API JSAPI似乎。。。不确定。很多例子都很老,要么指向不受支持的libs,要么最终使用了googlecloudspeech。 这不一定是Java/Kotlin库,我还可以包装一个本机命令侦听器进程。 我正在查看ML工具包和Firebase ML,但没有看到音频到命令的转换。 如果我能调整敏感度,戴着假面具的小孩会大叫“TWIC R TREET”或“TMURMP…”,那就最好了。。。TWEEF’或其他什么应该仍然这样做。 ... 但不是一个纯粹的音量检测器,开车经过的汽车不应该触发它。是否有用于监听音频命令的Kotlin或Java库?(想在孩子们大喊“不给糖就捣蛋”时触发万圣节展示),java,audio,raspberry-pi,speech-recognition,speech-to-text,Java,Audio,Raspberry Pi,Speech Recognition,Speech To Text,目标: 在低端设备raspberry pi 3上 听一组固定的音频短语命令,我的“嘿谷歌”或“嘿Siri” 这可能是一个非常有限的词汇表,少于10个命令 检测到命令时触发Kotlin函数。 无需使用大量CPU或大量网络带宽。 AFAIK现代边缘设备Echo、智能手机、Google Home等都有非常奇特的硬件+软件解决方案,使它们能够在不占用大量CPU的情况下连续收听关键字,也不必将所有音频发送到云服务器。我希望有同样的,但不确定是否可能-我确信他们训练了他们最小且高效的“Hey Siri”ML
有什么建议吗?或者要求rpi是不合理的?是的,我建议有一个非常有用的库:是的,我建议有一个非常有用的库:您可以使用一个离线工作的库,而不需要其他在线服务器。
有时公认的结果是相当不准确的。为了解决这个问题,我使用了一个比默认字典小得多的字典。我从未在Raspberry Pi上对其进行过全面测试,但我认为它应该可以工作。您可以使用一个离线工作的库,而不需要其他在线服务器。
有时公认的结果是相当不准确的。为了解决这个问题,我使用了一个比默认字典小得多的字典。我从未在Raspberry Pi上完全测试过它,但我认为它应该可以工作。最好用Python,而不是java。RPi上的Java是meh。最好用Python,而不是Java。RPi上的Java是meh。看起来很棒!我让第一步开始了。对关键词有什么建议吗?看起来很棒!我让第一步开始了。对关键词有什么建议吗?看起来很棒!我让第一步开始了。对关键词有什么建议吗?看起来很棒!我让第一步开始了。对关键词有什么建议吗?