Nlp 我必须为我的语音识别模型提供哪些标签?

Nlp 我必须为我的语音识别模型提供哪些标签?,nlp,conv-neural-network,speech-recognition,recurrent-neural-network,Nlp,Conv Neural Network,Speech Recognition,Recurrent Neural Network,我是NLP的新手。我正在尝试实现一个基于通用语音数据集的语音识别引擎。我已经将MP3文件转换为WAV格式,并从每个音频文件中提取MFCC。我使用python_speech_功能库执行MFCC提取。 我有一些大问题: 我怎样才能喂饱我的模特?我是否必须在25毫秒的窗口内对每个MFCC图像进行切片,并在每次迭代时给出一个切片?或者我可以给出整个MFCC图像吗 我必须使用哪些标签?我认为标记化转录(单词标记中的话语)可以实现单词地图 如果我必须切片图像,我必须使用什么标签?文字地图仍然适合我的目的,还

我是NLP的新手。我正在尝试实现一个基于通用语音数据集的语音识别引擎。我已经将MP3文件转换为WAV格式,并从每个音频文件中提取MFCC。我使用python_speech_功能库执行MFCC提取。 我有一些大问题:

  • 我怎样才能喂饱我的模特?我是否必须在25毫秒的窗口内对每个MFCC图像进行切片,并在每次迭代时给出一个切片?或者我可以给出整个MFCC图像吗
  • 我必须使用哪些标签?我认为标记化转录(单词标记中的话语)可以实现单词地图
  • 如果我必须切片图像,我必须使用什么标签?文字地图仍然适合我的目的,还是我必须改变
  • 非常感谢你,我将感谢你的每一个回答。这几天我学习了很多,但现在我真的需要一只外手