Java 唱歌时的连续语音识别?

Java 唱歌时的连续语音识别?,java,speech-recognition,cmusphinx,Java,Speech Recognition,Cmusphinx,作为我的应用程序的一部分,我希望添加语音识别,但不是传统意义上的。我有一大堆歌词(分为诗句)是由某人唱的,我的想法是找到目前正在唱的诗句,以便它可以显示在屏幕上 我已经使用了sphinx,并设置了一些基本的示例并开始使用,但是,虽然似乎有大量关于注册口语文本的文档,您可以等待一段时间,然后处理结果,但我找不到太多关于连续识别句子的想法。这当然是在我开始唱歌词而不是说歌词之前 有人有过这样的经验吗?如果有,有没有什么地方可以提供一个好的起点?还是我试图用斯芬克斯实现的目标过于雄心勃勃,它永远不会正

作为我的应用程序的一部分,我希望添加语音识别,但不是传统意义上的。我有一大堆歌词(分为诗句)是由某人唱的,我的想法是找到目前正在唱的诗句,以便它可以显示在屏幕上

我已经使用了sphinx,并设置了一些基本的示例并开始使用,但是,虽然似乎有大量关于注册口语文本的文档,您可以等待一段时间,然后处理结果,但我找不到太多关于连续识别句子的想法。这当然是在我开始唱歌词而不是说歌词之前


有人有过这样的经验吗?如果有,有没有什么地方可以提供一个好的起点?还是我试图用斯芬克斯实现的目标过于雄心勃勃,它永远不会正常工作?我很乐意去看其他的图书馆,但它们必须是免费的,斯芬克斯是我能找到的谈论最广泛的一个。

语音一经发音,就完全有可能在稍有延迟的情况下立即识别出来。此外,如果你或多或少了解你期望得到什么。这称为“部分结果”,可通过API在所有CMUSphinx解码器中使用。基本上,你们可以在这个过程中找回假设

如何稳定这个结果(如何提取它的稳定部分)还有一个小问题要考虑,但是这种技术被称为回溯,并且可以很容易地实现


对于唱歌来说,考虑到音乐可以被过滤掉,这也是可行的。

我想一个大问题是如何获得合适的训练集,或者从一个尺寸有限的训练集上进行引导。有人能解释一下投票失败的原因吗?当我在搜索中使用你的问题时,Ggogle无意中发现了。在寻找一个特定的库时恐怕没有什么帮助,但是如果你需要自己构建一些东西,它可能会帮助你走上正轨。也许你需要将现有的声音数据转换成易于处理的数据。我只是给出了一个模糊的想法,但有点像散列一段原始音频数据(就像你说的一首诗),然后和录音进行比较。一旦你赶上了第一节,你应该对下一节有一个提示-主要是下一节,你可以开始展示,一旦你得到下一节的一小部分,就对那一部分进行验证。希望这能有所帮助。嘿,我对你的调查结果非常感兴趣,如果你能在这里告诉我,或者给我发邮件让我知道这个项目是否成功,我会非常感激。我的电子邮件在个人资料中。谢谢