Nlp 如何计算使用任何方法(SR或其他方法)说出的单词数

Nlp 如何计算使用任何方法(SR或其他方法)说出的单词数,nlp,speech-recognition,speech,counting,Nlp,Speech Recognition,Speech,Counting,我在如何执行看似简单的任务方面遇到了一些困难: 给定一个音频流,如何实时计算已说出的单词数? 我不需要识别单词是什么,只需要对已经说出的单词有一个准确的计数器。柜台不必太准确,甚至可以考虑话语和其他“咕噜”像咳嗽。 似乎所有的语音识别系统都依赖于预先定义的语法,然后才能分析语音中的音素,从而以一定程度的准确性转换为已知单词。但我一点也不在乎准确性,而是在乎说话的速度 重要的是,这是实时运行的,并允许系统在说出一定数量的单词后提供警报。系统将鼓励视觉提示暂停,然后演讲者可以继续 我看过CMU Sp

我在如何执行看似简单的任务方面遇到了一些困难:

给定一个音频流,如何实时计算已说出的单词数?

我不需要识别单词是什么,只需要对已经说出的单词有一个准确的计数器。柜台不必太准确,甚至可以考虑话语和其他“咕噜”像咳嗽。 似乎所有的语音识别系统都依赖于预先定义的语法,然后才能分析语音中的音素,从而以一定程度的准确性转换为已知单词。但我一点也不在乎准确性,而是在乎说话的速度

重要的是,这是实时运行的,并允许系统在说出一定数量的单词后提供警报。系统将鼓励视觉提示暂停,然后演讲者可以继续

我看过CMU Sphinx常见问题解答,发现“单词识别”的想法还不被支持。我真的不需要对特定单词进行实时搜索,但它更接近于我要查找的内容。在波形中寻找非常小的静音似乎是一种非常粗糙的方法,可能一点也不精确,但这就是我现在所拥有的


任何关于算法、研究论文或任何其他见解的建议都将不胜感激

如果你知道你的用户应该说的话,了解这些话是很重要的。如果你这样做了,这是一项简单的任务。如果你不知道的话,这项任务并不比语音识别本身简单。事实上,最好描述你试图解决的问题,而不是你心目中的解决方案。你的解决方案可能是错误的,或者对于具体问题来说太复杂了。尼古拉,我们正在努力创造更好的公众演讲者。因此,我们正在做的是,看看在暂停之前说了多少个单词——www.takethestage.info是描述。这有助于更好地描述问题吗?鉴于你的任务,你最好通过检测音节而不是计算单词来衡量说话速度。还有更多的语速检测器。你能在下面的答案中提供一些指向开源语速检测器的指针吗?那太好了!