Speech recognition CMUSphinx训练声学模型精度极低

Speech recognition CMUSphinx训练声学模型精度极低,speech-recognition,speech-to-text,cmusphinx,Speech Recognition,Speech To Text,Cmusphinx,我按照教程为我的越南语训练了一个新的声学模型。简单地说,我记录了从0到9的数字进行训练,并使用这些训练数据进行测试。因此,准确度应达到预期的100%。然而,它只有大约20%(仅识别2和3)。我已经录了很多次了,但没有改变。我可以确保我完全符合所有要求,如16k采样率,16位深度 有人能给我一些解释和改进我的模型的方法吗?谢谢大家 这是我的项目:培训数据不足。根据您的需要: 1小时录音用于单个扬声器的命令和控制 为200名扬声器录制5小时的录音,用于指挥和控制许多扬声器 10个小时的录音,用于单

我按照教程为我的越南语训练了一个新的声学模型。简单地说,我记录了从0到9的数字进行训练,并使用这些训练数据进行测试。因此,准确度应达到预期的100%。然而,它只有大约20%(仅识别2和3)。我已经录了很多次了,但没有改变。我可以确保我完全符合所有要求,如16k采样率,16位深度

有人能给我一些解释和改进我的模型的方法吗?谢谢大家


这是我的项目:

培训数据不足。根据您的需要:

  • 1小时录音用于单个扬声器的命令和控制
  • 为200名扬声器录制5小时的录音,用于指挥和控制许多扬声器
  • 10个小时的录音,用于单人听写
  • 50小时录音,200名演讲者,多人听写

您可以从

获取越南语数据培训数据不足。根据您的需要:

  • 1小时录音用于单个扬声器的命令和控制
  • 为200名扬声器录制5小时的录音,用于指挥和控制许多扬声器
  • 10个小时的录音,用于单人听写
  • 50小时录音,200名演讲者,多人听写
您可以从中获取越南语数据