Cmusphinx Pocketsphinx无法解码mfc文件,而Pocketsphinx_continuous对相应的wav进行解码

Cmusphinx Pocketsphinx无法解码mfc文件,而Pocketsphinx_continuous对相应的wav进行解码,cmusphinx,pocketsphinx,Cmusphinx,Pocketsphinx,我已经和CMUsphinx合作了几个月,负责土耳其语语音到文本的转换。我成功地用100小时的声音驾驶了一列火车。我的目标是使用Sphinx3解码器生成的声学模型。但是Sphinx3解码器无法解码我的测试wav文件。然后我注意到sphinxtrain在测试模型的培训结束时运行pocketsphinx_批处理 所以,我开始研究poscketsphinx。我所处的位置是pocketsphinx batch无法解码wav文件(实际上它只生成ııı其他内容),但pocketsphinx continuou

我已经和CMUsphinx合作了几个月,负责土耳其语语音到文本的转换。我成功地用100小时的声音驾驶了一列火车。我的目标是使用Sphinx3解码器生成的声学模型。但是Sphinx3解码器无法解码我的测试wav文件。然后我注意到sphinxtrain在测试模型的培训结束时运行pocketsphinx_批处理

所以,我开始研究poscketsphinx。我所处的位置是pocketsphinx batch无法解码wav文件(实际上它只生成ııı其他内容),但pocketsphinx continuous使用相同的文件生成更有意义的输出(例如,15个字中有10个正确的字)

我想我错过了一些配置步骤。我这里有一个压缩档案 其中包括声学和语言模型,字典和我试图解码的wav文件

我请求获得帮助,以便能够将我的模型用于Sphinx3和Pocketsphinx_批次


谢谢。

幸运的是我发现了这个问题。这是由斯芬克斯菲产生的特征向量。我用默认值创建它们。在阅读make_feats.pl和sphinxtrain.cfg文件后,我创建了与声学模型兼容的特征向量。Sphinxtrain.cfg的升降机参数为22,但如果我们使用sphinx_fe的默认值,升降机为0,这意味着没有升降机。我创建了mfc和升降机值22,然后它的工作

您需要提供更多信息,确切运行哪个命令。您认为输出有什么问题?我用于pocketsphinx_批处理的命令在这个文本文件中给出。它似乎只产生了“ıı”这个词。我在pocketsphinx_continuous中使用了相同的wav文件以及相同的声学模型、语言模型和字典,输出如下:pocketsphinx_continuous将wav文件解码为“吉迪姆·卡米亚斯·本·杜库兹·塞克森德·吉德肯·格米乌森·约尔库卢萨瓦拉·巴尔卡“这不是很准确,但仍然很有价值。好的,那么pocketsphinx_的连续输出是什么?你们是如何提取mfcc文件的?我已经编辑了上面的问题。问题是mfc文件。在培训中,sphinx_fe使用了与默认值不同的参数。我使用培训中使用的参数创建了mfc文件。现在没事了。