Speech recognition google语音api和获取有效的语音上下文
我已经用Python设置了一个同步识别脚本,该脚本按照预期工作,返回我发送到Google语音API的各种音频文件的转录本。然而,我似乎无法获得语音上下文提示(Python中的speech_上下文;“Google文档中的短语提示/speechContext”)来做任何有用的事情。我有一个音频文件,其中说话者清楚地说出了“健康”一词,但每次都被转录为“房子”,尽管明确告诉它要查找下面代码中的“健康”一词,但它没有找到它。要使此功能有效,有什么建议吗Speech recognition google语音api和获取有效的语音上下文,speech-recognition,google-speech-api,google-cloud-python,Speech Recognition,Google Speech Api,Google Cloud Python,我已经用Python设置了一个同步识别脚本,该脚本按照预期工作,返回我发送到Google语音API的各种音频文件的转录本。然而,我似乎无法获得语音上下文提示(Python中的speech_上下文;“Google文档中的短语提示/speechContext”)来做任何有用的事情。我有一个音频文件,其中说话者清楚地说出了“健康”一词,但每次都被转录为“房子”,尽管明确告诉它要查找下面代码中的“健康”一词,但它没有找到它。要使此功能有效,有什么建议吗 config = types.Recognitio
config = types.RecognitionConfig(
encoding=enums.RecognitionConfig.AudioEncoding.LINEAR16,
language_code='en-US',
speech_contexts=[speech.types.SpeechContext(
phrases=['health'])]
)
谢谢 尝试添加完整的短语,而不仅仅是一个单词。谢谢,我确实试过了,并最终使它与单词匹配,但是为了匹配,我必须从音频文件中再匹配三个前面的单词。不幸的是,我不会奢侈地在生产中寻找这么长时间的一个短语——只有我能强迫它总是选择“健康”这个词,在这个例子中,如果有一个合理的机会,这个词可能是“健康”。这就是它的工作方式。通常,如果单词不被识别,正确的修复方法是使用正确的声学模型,而不是试图用提示来修复它。