Audio 谷歌云演讲:单词开始时间

Audio 谷歌云演讲:单词开始时间,audio,speech-to-text,google-speech-api,google-cloud-speech,Audio,Speech To Text,Google Speech Api,Google Cloud Speech,我正在考虑使用Google Cloud Speech转换长格式的旁白音频文件,我需要知道音频文件中每个短语的开始时间。有没有办法用谷歌云语音来做到这一点? 我目前正在使用transcribe\u async.py。 谢谢。这在谷歌云演讲中是不可能的。如果这些信息对您很重要,您可能需要查看其他ASR系统。我知道离线、非托管的ASR系统喜欢并将向您提供此信息。我不知道是否或哪个承载的ASR系统可以提供这些信息。通过将enableWordTimeOffsets选项设置为True,您可以获得每个单词的(

我正在考虑使用Google Cloud Speech转换长格式的旁白音频文件,我需要知道音频文件中每个短语的开始时间。有没有办法用谷歌云语音来做到这一点? 我目前正在使用
transcribe\u async.py

谢谢。

这在谷歌云演讲中是不可能的。如果这些信息对您很重要,您可能需要查看其他ASR系统。我知道离线、非托管的ASR系统喜欢并将向您提供此信息。我不知道是否或哪个承载的ASR系统可以提供这些信息。

通过将enableWordTimeOffsets选项设置为True,您可以获得每个单词的(近似)开始和结束时间(从音频曲目的开始)


请注意,抄本中第一个单词的开始时间始终为0,而且据我所知,每个单词的开始时间都对应于前一个单词的结束时间(如果有暂停)。

谢谢您的帮助!有没有办法找出第一个元素的实际起始值?