android语音输入识别器中的音频预处理
我正在做一些基本的命令识别,并为此使用谷歌搜索输入API。然而,我想自己捕获音频,预处理音频(去噪、增强振幅等),将修改后的音频发送到识别器并获得结果。可能吗 我知道您可以使用android语音输入识别器中的音频预处理,android,speech-recognition,audio-processing,Android,Speech Recognition,Audio Processing,我正在做一些基本的命令识别,并为此使用谷歌搜索输入API。然而,我想自己捕获音频,预处理音频(去噪、增强振幅等),将修改后的音频发送到识别器并获得结果。可能吗 我知道您可以使用SpeechRecognizer和RecognitionListener使用onBufferReceived方法获取音频。但是我想做预处理而不是后处理。是否有任何解决方法/黑客向谷歌识别器提供经过处理的数据 对音频进行预处理(去噪、增强振幅等),将修改后的音频发送到识别器并获得结果 通常,语音识别系统会受到这种影响。不正确
SpeechRecognizer
和RecognitionListener
使用onBufferReceived
方法获取音频。但是我想做预处理而不是后处理。是否有任何解决方法/黑客向谷歌识别器提供经过处理的数据
对音频进行预处理(去噪、增强振幅等),将修改后的音频发送到识别器并获得结果
通常,语音识别系统会受到这种影响。不正确地去噪会降低语音识别的准确性,因为它会以不可预测的方式破坏频谱。振幅提升没有帮助,因为振幅在语音识别的一开始就被标准化了。你的预处理只会带来伤害
如果你还想试试,试试口袋狮身人面像
Thx关于去噪陷阱的提示。我已经测试过sphinx,但它在提供的应用程序中运行得很差,这就是我想使用谷歌识别器的原因。反向工程android识别器活动是进行预处理的唯一方法吗?