Google cloud platform 如何加速谷歌云语音

Google cloud platform 如何加速谷歌云语音,google-cloud-platform,streaming,audio-streaming,google-speech-api,Google Cloud Platform,Streaming,Audio Streaming,Google Speech Api,我使用的麦克风通过浏览器录制声音,将其转换成文件并将文件发送到java服务器。然后,我的java服务器将文件发送到云语音api,并给我转录。问题是转录的时间很长(对话2秒大约3.7秒) 所以我想加快转录速度。首先要做的是流式传输数据(如果我在记录的开头开始转录。问题是我不太了解api。例如,如果我想从源(浏览器/麦克风)转录音频流,我需要使用某种JS api,但我找不到任何可以在浏览器中使用的东西(我们不能像这样使用节点,对吗?) 否则,我需要将我的数据从我的js流到我的java(不知道如何在不

我使用的麦克风通过浏览器录制声音,将其转换成文件并将文件发送到java服务器。然后,我的java服务器将文件发送到云语音api,并给我转录。问题是转录的时间很长(对话2秒大约3.7秒)

所以我想加快转录速度。首先要做的是流式传输数据(如果我在记录的开头开始转录。问题是我不太了解api。例如,如果我想从源(浏览器/麦克风)转录音频流,我需要使用某种JS api,但我找不到任何可以在浏览器中使用的东西(我们不能像这样使用节点,对吗?)

否则,我需要将我的数据从我的js流到我的java(不知道如何在不破坏数据的情况下完成…),然后将其推送到StreamingRecognitizeFile:

但是它需要一个文件作为输入,那么我应该如何使用它呢?我真的不能告诉系统我是否完成了记录…它如何理解这是转录的结束

我想在我的web浏览器中创建一些东西,就像那里的google演示:

我想关于流式api的使用方法,有一些基本的东西我还不了解。如果有人能解释一下我应该如何处理这个问题,那就太好了

谢谢。

谷歌“语音到文本通常比实时处理音频更快,平均在15秒内处理30秒的音频”。你可以使用谷歌API浏览器准确测试每个请求需要多长时间

为了加快转录速度,您可以尝试将识别元数据添加到请求中。如果您知道语音的上下文,您可以提供短语提示。或者使用增强模型来使用一组特殊的机器学习模型。所有这些建议都将提高准确性,并可能会影响转录速度

使用流媒体识别时,在配置中,您可以将
singleutrance
选项设置为
True
。这将检测用户是否暂停讲话并停止识别。如果没有,流媒体请求将继续,直到内容限制,即流媒体请求的音频长度为1分钟。

查看此Node.js client代表谷歌云演讲。