Google cloud platform 谷歌云扬声器日记对某些文件不起作用
我正在运行google cloud speech to text API,并启用了Dialization,请参见下面链接中的示例: 此外,请注意,我正在使用此函数调用API:Google cloud platform 谷歌云扬声器日记对某些文件不起作用,google-cloud-platform,speech-to-text,Google Cloud Platform,Speech To Text,我正在运行google cloud speech to text API,并启用了Dialization,请参见下面链接中的示例: 此外,请注意,我正在使用此函数调用API: def transcribe_audio(uri): print(f'transcribing {uri}...') client = speech.SpeechClient() audio = speech.types.RecognitionAudio(uri=uri) config =
def transcribe_audio(uri):
print(f'transcribing {uri}...')
client = speech.SpeechClient()
audio = speech.types.RecognitionAudio(uri=uri)
config = speech.types.RecognitionConfig(
encoding=speech.enums.RecognitionConfig.AudioEncoding.FLAC,
language_code='en-US',
enable_speaker_diarization=True,
diarization_speaker_count=2)
response = client.long_running_recognize(config, audio)
return list(response.result().results)
解析输出时,说话人标签应该出现在结果列表的最后一个元素中。我已经用一个音频文件确认了这一点,但当我尝试用其他音频文件运行它时,结果中没有扬声器标签。事实上,当我用其他文件尝试API时,结果列表中的最后一个结果并不包含整个文件的转录本,而只是一个片段我的问题是为什么会发生这种情况,我如何纠正它?
请注意,我的文件是大的(~1GB)flac文件,包含几个小时的音频。还需要注意的是,它们都是使用相同的预处理脚本编写的,并且不清楚它们在何种方式上可能会有足够的不同,从而从API中获得不同的结果(即,有些人获得了扬声器标签,而另一些人没有)。您在这方面运气好吗?我也遇到了同样的问题,演讲者日记的来去取决于视频。嘿,杰克,不幸的是,我没有。如果你能弄明白的话,我很高兴收到你的来信!谢谢。因为这是一个测试版功能,所以请确保您正在像这样导入测试版库:const speech=require(“@google cloud/speech”).v1p1beta1;