Machine learning 转换CMU Sphinx和x27时的偏差;概率的置信度得分
我正在尝试转换CMU Sphinx的识别器的输出 (即列表<假设(即短语),分数(在日志中)>通过调整测试c获得) 改为以下形式: 列表<假设(即短语),“概率”(介于0和1之间)> 我现在使用的一个简单方法如下:Machine learning 转换CMU Sphinx和x27时的偏差;概率的置信度得分,machine-learning,speech-recognition,probability,cmusphinx,sphinx4,Machine Learning,Speech Recognition,Probability,Cmusphinx,Sphinx4,我正在尝试转换CMU Sphinx的识别器的输出 (即列表通过调整测试c获得) 改为以下形式: 列表 我现在使用的一个简单方法如下: 将每个信心分数除以语言权重(例如:11) 规范化日志域中的置信度得分列表 输出概率=exp(标准化置信分数) 问题是上述方法的输出概率是有偏差的。你有什么建议,我可以用来得到概率的偏差吗 我必须实施的纠正偏差的示例方法: 向量getBias(向量短语,向量logConfidenceScores) 上述讨论的输入示例: 首先,这不是一个信心分数,而是一个分数。
A trivial method which I am using now is as follows:
Divide each confidence score by language weight (eg: 11)
Normalize the list of confidence score in log domain
Output probability = exp(normalized confidence score)