Google cloud platform 如何加速谷歌云语音_Google Cloud Platform_Streaming_Audio Streaming_Google Speech Api

Google cloud platform 如何加速谷歌云语音

google-cloud-platform streaming

Google cloud platform 如何加速谷歌云语音,google-cloud-platform,streaming,audio-streaming,google-speech-api,Google Cloud Platform,Streaming,Audio Streaming,Google Speech Api,我使用的麦克风通过浏览器录制声音，将其转换成文件并将文件发送到java服务器。然后，我的java服务器将文件发送到云语音api，并给我转录。问题是转录的时间很长（对话2秒大约3.7秒）所以我想加快转录速度。首先要做的是流式传输数据（如果我在记录的开头开始转录。问题是我不太了解api。例如，如果我想从源（浏览器/麦克风）转录音频流，我需要使用某种JS api，但我找不到任何可以在浏览器中使用的东西（我们不能像这样使用节点，对吗？）否则，我需要将我的数据从我的js流到我的java（不知道如何在不

我使用的麦克风通过浏览器录制声音，将其转换成文件并将文件发送到java服务器。然后，我的java服务器将文件发送到云语音api，并给我转录。问题是转录的时间很长（对话2秒大约3.7秒）

所以我想加快转录速度。首先要做的是流式传输数据（如果我在记录的开头开始转录。问题是我不太了解api。例如，如果我想从源（浏览器/麦克风）转录音频流，我需要使用某种JS api，但我找不到任何可以在浏览器中使用的东西（我们不能像这样使用节点，对吗？）

否则，我需要将我的数据从我的js流到我的java（不知道如何在不破坏数据的情况下完成…），然后将其推送到StreamingRecognitizeFile：

但是它需要一个文件作为输入，那么我应该如何使用它呢？我真的不能告诉系统我是否完成了记录…它如何理解这是转录的结束

我想在我的web浏览器中创建一些东西，就像那里的google演示：

我想关于流式api的使用方法，有一些基本的东西我还不了解。如果有人能解释一下我应该如何处理这个问题，那就太好了

谢谢。

谷歌“语音到文本通常比实时处理音频更快，平均在15秒内处理30秒的音频”。你可以使用谷歌API浏览器准确测试每个请求需要多长时间

为了加快转录速度，您可以尝试将识别元数据添加到请求中。如果您知道语音的上下文，您可以提供短语提示。或者使用增强模型来使用一组特殊的机器学习模型。所有这些建议都将提高准确性，并可能会影响转录速度

使用流媒体识别时，在配置中，您可以将

singleutrance

选项设置为

True

。这将检测用户是否暂停讲话并停止识别。如果没有，流媒体请求将继续，直到内容限制，即流媒体请求的音频长度为1分钟。

查看此Node.js client代表谷歌云演讲。