Google cloud platform 谷歌云扬声器日记对某些文件不起作用_Google Cloud Platform_Speech To Text

Google cloud platform 谷歌云扬声器日记对某些文件不起作用

google-cloud-platform

Google cloud platform 谷歌云扬声器日记对某些文件不起作用,google-cloud-platform,speech-to-text,Google Cloud Platform,Speech To Text,我正在运行google cloud speech to text API，并启用了Dialization，请参见下面链接中的示例：此外，请注意，我正在使用此函数调用API： def transcribe_audio(uri): print(f'transcribing {uri}...') client = speech.SpeechClient() audio = speech.types.RecognitionAudio(uri=uri) config =

我正在运行google cloud speech to text API，并启用了Dialization，请参见下面链接中的示例：

此外，请注意，我正在使用此函数调用API：

def transcribe_audio(uri):
    print(f'transcribing {uri}...')
    client = speech.SpeechClient()
    audio = speech.types.RecognitionAudio(uri=uri)
    config = speech.types.RecognitionConfig(
        encoding=speech.enums.RecognitionConfig.AudioEncoding.FLAC,
        language_code='en-US',
        enable_speaker_diarization=True,
        diarization_speaker_count=2)
    response = client.long_running_recognize(config, audio)
    return list(response.result().results)

解析输出时，说话人标签应该出现在结果列表的最后一个元素中。我已经用一个音频文件确认了这一点，但当我尝试用其他音频文件运行它时，结果中没有扬声器标签。事实上，当我用其他文件尝试API时，结果列表中的最后一个结果并不包含整个文件的转录本，而只是一个片段我的问题是为什么会发生这种情况，我如何纠正它？

请注意，我的文件是大的（~1GB）flac文件，包含几个小时的音频。还需要注意的是，它们都是使用相同的预处理脚本编写的，并且不清楚它们在何种方式上可能会有足够的不同，从而从API中获得不同的结果（即，有些人获得了扬声器标签，而另一些人没有）。

您在这方面运气好吗？我也遇到了同样的问题，演讲者日记的来去取决于视频。嘿，杰克，不幸的是，我没有。如果你能弄明白的话，我很高兴收到你的来信！谢谢。因为这是一个测试版功能，所以请确保您正在像这样导入测试版库：const speech=require（“@google cloud/speech”）.v1p1beta1；