Speech recognition CMUSphinx训练声学模型精度极低_Speech Recognition_Speech To Text_Cmusphinx

Speech recognition CMUSphinx训练声学模型精度极低

speech-recognition

Speech recognition CMUSphinx训练声学模型精度极低,speech-recognition,speech-to-text,cmusphinx,Speech Recognition,Speech To Text,Cmusphinx,我按照教程为我的越南语训练了一个新的声学模型。简单地说，我记录了从0到9的数字进行训练，并使用这些训练数据进行测试。因此，准确度应达到预期的100%。然而，它只有大约20%（仅识别2和3）。我已经录了很多次了，但没有改变。我可以确保我完全符合所有要求，如16k采样率，16位深度有人能给我一些解释和改进我的模型的方法吗？谢谢大家这是我的项目：培训数据不足。根据您的需要： 1小时录音用于单个扬声器的命令和控制为200名扬声器录制5小时的录音，用于指挥和控制许多扬声器 10个小时的录音，用于单

我按照教程为我的越南语训练了一个新的声学模型。简单地说，我记录了从0到9的数字进行训练，并使用这些训练数据进行测试。因此，准确度应达到预期的100%。然而，它只有大约20%（仅识别2和3）。我已经录了很多次了，但没有改变。我可以确保我完全符合所有要求，如16k采样率，16位深度

有人能给我一些解释和改进我的模型的方法吗？谢谢大家

这是我的项目：

培训数据不足。根据您的需要：

1小时录音用于单个扬声器的命令和控制
为200名扬声器录制5小时的录音，用于指挥和控制许多扬声器
10个小时的录音，用于单人听写
50小时录音，200名演讲者，多人听写

您可以从

获取越南语数据培训数据不足。根据您的需要：

1小时录音用于单个扬声器的命令和控制
为200名扬声器录制5小时的录音，用于指挥和控制许多扬声器
10个小时的录音，用于单人听写
50小时录音，200名演讲者，多人听写

您可以从中获取越南语数据