Nlp 如何计算使用任何方法（SR或其他方法）说出的单词数_Nlp_Speech Recognition_Speech_Counting

Nlp 如何计算使用任何方法（SR或其他方法）说出的单词数

nlp speech-recognition

Nlp 如何计算使用任何方法（SR或其他方法）说出的单词数,nlp,speech-recognition,speech,counting,Nlp,Speech Recognition,Speech,Counting,我在如何执行看似简单的任务方面遇到了一些困难：给定一个音频流，如何实时计算已说出的单词数？我不需要识别单词是什么，只需要对已经说出的单词有一个准确的计数器。柜台不必太准确，甚至可以考虑话语和其他“咕噜”像咳嗽。似乎所有的语音识别系统都依赖于预先定义的语法，然后才能分析语音中的音素，从而以一定程度的准确性转换为已知单词。但我一点也不在乎准确性，而是在乎说话的速度重要的是，这是实时运行的，并允许系统在说出一定数量的单词后提供警报。系统将鼓励视觉提示暂停，然后演讲者可以继续我看过CMU Sp

我在如何执行看似简单的任务方面遇到了一些困难：

给定一个音频流，如何实时计算已说出的单词数？

我不需要识别单词是什么，只需要对已经说出的单词有一个准确的计数器。柜台不必太准确，甚至可以考虑话语和其他“咕噜”像咳嗽。似乎所有的语音识别系统都依赖于预先定义的语法，然后才能分析语音中的音素，从而以一定程度的准确性转换为已知单词。但我一点也不在乎准确性，而是在乎说话的速度

重要的是，这是实时运行的，并允许系统在说出一定数量的单词后提供警报。系统将鼓励视觉提示暂停，然后演讲者可以继续

我看过CMU Sphinx常见问题解答，发现“单词识别”的想法还不被支持。我真的不需要对特定单词进行实时搜索，但它更接近于我要查找的内容。在波形中寻找非常小的静音似乎是一种非常粗糙的方法，可能一点也不精确，但这就是我现在所拥有的

任何关于算法、研究论文或任何其他见解的建议都将不胜感激

如果你知道你的用户应该说的话，了解这些话是很重要的。如果你这样做了，这是一项简单的任务。如果你不知道的话，这项任务并不比语音识别本身简单。事实上，最好描述你试图解决的问题，而不是你心目中的解决方案。你的解决方案可能是错误的，或者对于具体问题来说太复杂了。尼古拉，我们正在努力创造更好的公众演讲者。因此，我们正在做的是，看看在暂停之前说了多少个单词——www.takethestage.info是描述。这有助于更好地描述问题吗？鉴于你的任务，你最好通过检测音节而不是计算单词来衡量说话速度。还有更多的语速检测器。你能在下面的答案中提供一些指向开源语速检测器的指针吗？那太好了！