Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/google-cloud-platform/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Google cloud platform 谷歌云扬声器日记对某些文件不起作用_Google Cloud Platform_Speech To Text - Fatal编程技术网

Google cloud platform 谷歌云扬声器日记对某些文件不起作用

Google cloud platform 谷歌云扬声器日记对某些文件不起作用,google-cloud-platform,speech-to-text,Google Cloud Platform,Speech To Text,我正在运行google cloud speech to text API,并启用了Dialization,请参见下面链接中的示例: 此外,请注意,我正在使用此函数调用API: def transcribe_audio(uri): print(f'transcribing {uri}...') client = speech.SpeechClient() audio = speech.types.RecognitionAudio(uri=uri) config =

我正在运行google cloud speech to text API,并启用了Dialization,请参见下面链接中的示例:

此外,请注意,我正在使用此函数调用API:

def transcribe_audio(uri):
    print(f'transcribing {uri}...')
    client = speech.SpeechClient()
    audio = speech.types.RecognitionAudio(uri=uri)
    config = speech.types.RecognitionConfig(
        encoding=speech.enums.RecognitionConfig.AudioEncoding.FLAC,
        language_code='en-US',
        enable_speaker_diarization=True,
        diarization_speaker_count=2)
    response = client.long_running_recognize(config, audio)
    return list(response.result().results)
解析输出时,说话人标签应该出现在结果列表的最后一个元素中。我已经用一个音频文件确认了这一点,但当我尝试用其他音频文件运行它时,结果中没有扬声器标签。事实上,当我用其他文件尝试API时,结果列表中的最后一个结果并不包含整个文件的转录本,而只是一个片段我的问题是为什么会发生这种情况,我如何纠正它?


请注意,我的文件是大的(~1GB)flac文件,包含几个小时的音频。还需要注意的是,它们都是使用相同的预处理脚本编写的,并且不清楚它们在何种方式上可能会有足够的不同,从而从API中获得不同的结果(即,有些人获得了扬声器标签,而另一些人没有)。

您在这方面运气好吗?我也遇到了同样的问题,演讲者日记的来去取决于视频。嘿,杰克,不幸的是,我没有。如果你能弄明白的话,我很高兴收到你的来信!谢谢。因为这是一个测试版功能,所以请确保您正在像这样导入测试版库:const speech=require(“@google cloud/speech”).v1p1beta1;