从Azure语音到文本Rest API创建语音服务

从Azure语音到文本Rest API创建语音服务,azure,speech-to-text,microsoft-cognitive,Azure,Speech To Text,Microsoft Cognitive,我可以在Microsoft文档链接中看到用于语音到文本的RESTAPI端点有两个版本 及 一个端点是[https://.api.cognitive.microsoft.com/sts/v1.0/issueToken]参考版本1.0,另一个版本是[api/speechtotext/v2.0/transcriptions],参考版本2.0。如何在Azure Portal中为后者创建语音到文本服务 每当我在不同地区创建服务时,它总是为语音到文本v1.0创建服务 有什么建议吗 PS:我有一个Visual

我可以在Microsoft文档链接中看到用于语音到文本的RESTAPI端点有两个版本

一个端点是[https://.api.cognitive.microsoft.com/sts/v1.0/issueToken]参考版本1.0,另一个版本是[api/speechtotext/v2.0/transcriptions],参考版本2.0。如何在Azure Portal中为后者创建语音到文本服务

每当我在不同地区创建服务时,它总是为语音到文本v1.0创建服务

有什么建议吗

PS:我有一个Visual Studio企业帐户,每月有津贴,我正在创建订阅s0付费服务,而不是免费试用f0服务

谢谢,
Ozgur

理解您的困惑,因为MS文档对此不明确。根据我的研究,让我澄清如下:存在两种类型的语音到文本服务,v1和v2

当您创建v1时,可以在认知服务结构下找到它:

根据下列文件中的陈述:

在使用speech to text REST API之前,请了解:

使用RESTAPI并直接传输音频的请求只能 包含最多60秒的音频。 语音到文本RESTAPI只返回最终结果。部分的 没有提供结果。

如果发送较长的音频是对应用程序的要求,请考虑使用语音SDK或基于文件的REST API,比如批处理 抄写

所以v1对文件格式或音频大小有一些限制。如果您有更多的要求,请导航到v2 api-Zoom Media托管的批量转录。如果您从ZM阅读此内容,您可以找到答案。您可以在Azure Marketplace中创建该语音Api:

这是它的创建页面:

另外,您可以在上面页面的底部查看API文档,它是

最后提示:

v1的端点类似于:

v2的端点类似于:

在Azure Portal中创建的所有官方Microsoft语音资源都对Microsoft Speech 2.0有效

我知道令牌url中的v1.0令人惊讶,但这个令牌API不是语音API的一部分

因此,转到Azure门户,创建一个语音资源,就完成了

如果您想确定,请转到您创建的资源,复制您的密钥。这就是您将在名为Ocp Apim Subscription Key header的头中用于授权的内容,如前所述

演示:

获取所创建资源的密钥 转到https://[REGION].cris.ai/swagger/ui/index REGION是您创建语音资源的区域 单击“授权”:您将看到两种形式的授权 将您的密钥粘贴到第一个订阅密钥中,验证 关上这个窗户 通过转到/api/speechtotext/v2.0/endpoints上的GET操作,测试其中一个端点,例如列出语音端点的端点 点击“试试看”,你会得到一个200 OK的回复!
有用的反馈:1人称代词I是大写;通过>设备的2个报价块用于报价,不是一般的荧光灯;3如希望有帮助或希望这是明确的闲聊材料被视为绒毛,将被删除。这是仁慈的编辑,而不是添加它放在首位。杰伊,实际上我是在寻找微软语音API,而不是缩放媒体API。所以你的答案没有帮助。嗨,我的答案对你有帮助吗?