C++ 如何在视频文件中使用语音识别?
如何对语音识别引擎(使用Microsoft speech SDK)进行编码,以“收听”视频文件并将检测结果保存到文件中?这与非常相似,答案也非常相似。您需要分离音频部分,将其转换为WAV格式,并将其发送到inproc识别器 但是,它存在与我之前描述的相同的问题(需要培训,假设只有一个声音,并且假设麦克风靠近扬声器)。如果是这样,那么你可能会得到相当好的结果。如果情况并非如此(例如,你正在试图转录一个电视节目,或者更糟糕的是,某种摄像机音频),那么结果可能会不令人满意C++ 如何在视频文件中使用语音识别?,c++,video,speech-recognition,C++,Video,Speech Recognition,如何对语音识别引擎(使用Microsoft speech SDK)进行编码,以“收听”视频文件并将检测结果保存到文件中?这与非常相似,答案也非常相似。您需要分离音频部分,将其转换为WAV格式,并将其发送到inproc识别器 但是,它存在与我之前描述的相同的问题(需要培训,假设只有一个声音,并且假设麦克风靠近扬声器)。如果是这样,那么你可能会得到相当好的结果。如果情况并非如此(例如,你正在试图转录一个电视节目,或者更糟糕的是,某种摄像机音频),那么结果可能会不令人满意