Java 唱歌时的连续语音识别？_Java_Speech Recognition_Cmusphinx

Java 唱歌时的连续语音识别？

java speech-recognition

Java 唱歌时的连续语音识别？,java,speech-recognition,cmusphinx,Java,Speech Recognition,Cmusphinx,作为我的应用程序的一部分，我希望添加语音识别，但不是传统意义上的。我有一大堆歌词（分为诗句）是由某人唱的，我的想法是找到目前正在唱的诗句，以便它可以显示在屏幕上我已经使用了sphinx，并设置了一些基本的示例并开始使用，但是，虽然似乎有大量关于注册口语文本的文档，您可以等待一段时间，然后处理结果，但我找不到太多关于连续识别句子的想法。这当然是在我开始唱歌词而不是说歌词之前有人有过这样的经验吗？如果有，有没有什么地方可以提供一个好的起点？还是我试图用斯芬克斯实现的目标过于雄心勃勃，它永远不会正

作为我的应用程序的一部分，我希望添加语音识别，但不是传统意义上的。我有一大堆歌词（分为诗句）是由某人唱的，我的想法是找到目前正在唱的诗句，以便它可以显示在屏幕上

我已经使用了sphinx，并设置了一些基本的示例并开始使用，但是，虽然似乎有大量关于注册口语文本的文档，您可以等待一段时间，然后处理结果，但我找不到太多关于连续识别句子的想法。这当然是在我开始唱歌词而不是说歌词之前

有人有过这样的经验吗？如果有，有没有什么地方可以提供一个好的起点？还是我试图用斯芬克斯实现的目标过于雄心勃勃，它永远不会正常工作？我很乐意去看其他的图书馆，但它们必须是免费的，斯芬克斯是我能找到的谈论最广泛的一个。

语音一经发音，就完全有可能在稍有延迟的情况下立即识别出来。此外，如果你或多或少了解你期望得到什么。这称为“部分结果”，可通过API在所有CMUSphinx解码器中使用。基本上，你们可以在这个过程中找回假设

如何稳定这个结果（如何提取它的稳定部分）还有一个小问题要考虑，但是这种技术被称为回溯，并且可以很容易地实现

。

对于唱歌来说，考虑到音乐可以被过滤掉，这也是可行的。

我想一个大问题是如何获得合适的训练集，或者从一个尺寸有限的训练集上进行引导。有人能解释一下投票失败的原因吗？当我在搜索中使用你的问题时，Ggogle无意中发现了。在寻找一个特定的库时恐怕没有什么帮助，但是如果你需要自己构建一些东西，它可能会帮助你走上正轨。也许你需要将现有的声音数据转换成易于处理的数据。我只是给出了一个模糊的想法，但有点像散列一段原始音频数据（就像你说的一首诗），然后和录音进行比较。一旦你赶上了第一节，你应该对下一节有一个提示-主要是下一节，你可以开始展示，一旦你得到下一节的一小部分，就对那一部分进行验证。希望这能有所帮助。嘿，我对你的调查结果非常感兴趣，如果你能在这里告诉我，或者给我发邮件让我知道这个项目是否成功，我会非常感激。我的电子邮件在个人资料中。谢谢