C++ 如何在视频文件中使用语音识别？_C++_Video_Speech Recognition

C++ 如何在视频文件中使用语音识别？

c++ video speech-recognition

C++ 如何在视频文件中使用语音识别？,c++,video,speech-recognition,C++,Video,Speech Recognition,如何对语音识别引擎（使用Microsoft speech SDK）进行编码，以“收听”视频文件并将检测结果保存到文件中？这与非常相似，答案也非常相似。您需要分离音频部分，将其转换为WAV格式，并将其发送到inproc识别器但是，它存在与我之前描述的相同的问题（需要培训，假设只有一个声音，并且假设麦克风靠近扬声器）。如果是这样，那么你可能会得到相当好的结果。如果情况并非如此（例如，你正在试图转录一个电视节目，或者更糟糕的是，某种摄像机音频），那么结果可能会不令人满意

如何对语音识别引擎（使用Microsoft speech SDK）进行编码，以“收听”视频文件并将检测结果保存到文件中？

这与非常相似，答案也非常相似。您需要分离音频部分，将其转换为WAV格式，并将其发送到inproc识别器

但是，它存在与我之前描述的相同的问题（需要培训，假设只有一个声音，并且假设麦克风靠近扬声器）。如果是这样，那么你可能会得到相当好的结果。如果情况并非如此（例如，你正在试图转录一个电视节目，或者更糟糕的是，某种摄像机音频），那么结果可能会不令人满意