Speech recognition Sphinx4信任结果和演讲结果

Speech recognition Sphinx4信任结果和演讲结果,speech-recognition,sphinx4,Speech Recognition,Sphinx4,我试图通过这样做来获得演讲结果的自信分数 信任度结果cr=记分员。得分(结果) 其中,result是一个SpeechResult,scorer是一个ConfidenceScorer。事实证明这是不允许的。除了使用结果类型之外,还有什么方法可以解决这个问题吗?是的,您可以这样做,尽管它有点迂回。信心的结果实际上是一根香肠(不,不是开玩笑,这就是它的名称:。虽然它也被称为单词混淆网络,但由于图形的形状,它有时被称为香肠。参见图1。of。那篇文章是理解自信和语音识别的重要参考,尽管它有点长,但我强烈建

我试图通过这样做来获得演讲结果的自信分数

信任度结果cr=记分员。得分(结果)


其中,
result
是一个
SpeechResult
scorer
是一个
ConfidenceScorer
。事实证明这是不允许的。除了使用
结果
类型之外,还有什么方法可以解决这个问题吗?

是的,您可以这样做,尽管它有点迂回。信心的结果实际上是一根香肠(不,不是开玩笑,这就是它的名称:。虽然它也被称为单词混淆网络,但由于图形的形状,它有时被称为香肠。参见图1。of。那篇文章是理解自信和语音识别的重要参考,尽管它有点长,但我强烈建议阅读您阅读的部分如果您对语音方面的进一步工作感兴趣,可能会发现这一点。它描述了Pivot算法,该算法在类:)中的Sphinx 4中使用

无论如何,关键是你可以从你的演讲结果中得到一个晶格。晶格是一个图形,是识别器产生的所有假设的浓缩形式。你可以把你的晶格交给一个香肠制造者,然后调用SausageMaker.make腊肠(),这将给你一根香肠,这是一个自信的结果(注意:调用SausageMaker.score(Result-Result)只是从结果生成一个晶格,然后调用它自己的make香肠方法)。不幸的是,ASR置信值不是很清楚,如何最好地计算、处理和理解它们是一个开放的研究课题

另一种可能性是,你可以从你的演讲结果中获得WordResult的自信分数

希望有帮助