Performance 调谐CMU斯芬克斯

Performance 调谐CMU斯芬克斯,performance,cmusphinx,sphinx4,Performance,Cmusphinx,Sphinx4,我正在尝试建立一个基于CMU Sphinx的语音识别应用程序。 我已经使用lmtool创建了自己的语言模型。 但是为了提高识别的准确性,我想调整Sphinx。 但是,对于选择absoluteBeamWidth、relativeBeamWidth、AbsoluteWordBeamWidth、languageWeight等属性,是否有任何指导原则。 我不太清楚这些属性意味着什么。此外,如果有任何指向资源的链接(不包括sphinx网站上不完整的调优链接)可以帮助我调优sphinx,我们将不胜感激 多谢

我正在尝试建立一个基于CMU Sphinx的语音识别应用程序。 我已经使用lmtool创建了自己的语言模型。 但是为了提高识别的准确性,我想调整Sphinx。 但是,对于选择absoluteBeamWidth、relativeBeamWidth、AbsoluteWordBeamWidth、languageWeight等属性,是否有任何指导原则。 我不太清楚这些属性意味着什么。此外,如果有任何指向资源的链接(不包括sphinx网站上不完整的调优链接)可以帮助我调优sphinx,我们将不胜感激

多谢各位

但是为了提高识别的准确性,我想调整Sphinx

精度不是通过调整而提高的,而是通过使用更好的模型和更先进的算法。有关详细信息,请参阅常见问题解答:


好的,那么为什么我们要使用absoluteBeamWidth、relativeBeamWidth、AbsoluteWordBeamWidth和languageWeight等属性……语音识别本质上是一种对正确结果的搜索。光束通过删除得分低于最佳的变体来限制搜索。相对波束宽度会影响路径,该路径的分数比波束宽度小。绝对光束选择每帧探索的绝对数量的路径。字波束考虑这个特定帧的词尾,而只有光束考虑所有路径。波束越小,搜索速度越慢,波束越宽。语言权重控制语言模式的效果。它通常是在实验过程中选择的。默认值通常是正确的,它们的调整不会带来任何显著的改善。