Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/jsf/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Speech recognition 视频语音识别中的噪声抑制_Speech Recognition_Cmusphinx - Fatal编程技术网

Speech recognition 视频语音识别中的噪声抑制

Speech recognition 视频语音识别中的噪声抑制,speech-recognition,cmusphinx,Speech Recognition,Cmusphinx,我正在寻找视频中的自动语音识别。我不是在寻找一个准确的“抄本”,而是一个能够准确识别某些特定关键词的系统 我似乎面临的问题是非言语视频(例如常规电视录音)中存在一些背景噪音(人群欢呼声、掌声等)或音乐。是否有任何我认为应该是“提取”人类声音然后把它传递给像狮身人面像这样的语音识别器的方法?我知道这可能是一个非常开放的问题,但我不是在这里寻找一个超高精度,至少从一开始。 我看到一些商业系统在这方面做得不错。我正在寻找我应该开始寻找的地方 我是这个领域的新手,所以任何帮助都会很好

我正在寻找视频中的自动语音识别。我不是在寻找一个准确的“抄本”,而是一个能够准确识别某些特定关键词的系统

我似乎面临的问题是非言语视频(例如常规电视录音)中存在一些背景噪音(人群欢呼声、掌声等)或音乐。是否有任何我认为应该是“提取”人类声音然后把它传递给像狮身人面像这样的语音识别器的方法?我知道这可能是一个非常开放的问题,但我不是在这里寻找一个超高精度,至少从一开始。 我看到一些商业系统在这方面做得不错。我正在寻找我应该开始寻找的地方

我是这个领域的新手,所以任何帮助都会很好