从Azure语音到文本Rest API创建语音服务_Azure_Speech To Text_Microsoft Cognitive

从Azure语音到文本Rest API创建语音服务

azure

从Azure语音到文本Rest API创建语音服务,azure,speech-to-text,microsoft-cognitive,Azure,Speech To Text,Microsoft Cognitive,我可以在Microsoft文档链接中看到用于语音到文本的RESTAPI端点有两个版本及一个端点是[https://.api.cognitive.microsoft.com/sts/v1.0/issueToken]参考版本1.0，另一个版本是[api/speechtotext/v2.0/transcriptions]，参考版本2.0。如何在Azure Portal中为后者创建语音到文本服务每当我在不同地区创建服务时，它总是为语音到文本v1.0创建服务有什么建议吗 PS：我有一个Visual

我可以在Microsoft文档链接中看到用于语音到文本的RESTAPI端点有两个版本

及

一个端点是[https://.api.cognitive.microsoft.com/sts/v1.0/issueToken]参考版本1.0，另一个版本是[api/speechtotext/v2.0/transcriptions]，参考版本2.0。如何在Azure Portal中为后者创建语音到文本服务

每当我在不同地区创建服务时，它总是为语音到文本v1.0创建服务

有什么建议吗

PS：我有一个Visual Studio企业帐户，每月有津贴，我正在创建订阅s0付费服务，而不是免费试用f0服务

谢谢，

Ozgur

理解您的困惑，因为MS文档对此不明确。根据我的研究，让我澄清如下：存在两种类型的语音到文本服务，v1和v2

当您创建v1时，可以在认知服务结构下找到它：

根据下列文件中的陈述：

在使用speech to text REST API之前，请了解：

使用RESTAPI并直接传输音频的请求只能包含最多60秒的音频。语音到文本RESTAPI只返回最终结果。部分的没有提供结果。

如果发送较长的音频是对应用程序的要求，请考虑使用语音SDK或基于文件的REST API，比如批处理抄写

所以v1对文件格式或音频大小有一些限制。如果您有更多的要求，请导航到v2 api-Zoom Media托管的批量转录。如果您从ZM阅读此内容，您可以找到答案。您可以在Azure Marketplace中创建该语音Api：

这是它的创建页面：

另外，您可以在上面页面的底部查看API文档，它是

最后提示：

v1的端点类似于：

v2的端点类似于：

在Azure Portal中创建的所有官方Microsoft语音资源都对Microsoft Speech 2.0有效

我知道令牌url中的v1.0令人惊讶，但这个令牌API不是语音API的一部分

因此，转到Azure门户，创建一个语音资源，就完成了

如果您想确定，请转到您创建的资源，复制您的密钥。这就是您将在名为Ocp Apim Subscription Key header的头中用于授权的内容，如前所述

演示：

获取所创建资源的密钥转到https://[REGION].cris.ai/swagger/ui/index REGION是您创建语音资源的区域单击“授权”：您将看到两种形式的授权将您的密钥粘贴到第一个订阅密钥中，验证关上这个窗户通过转到/api/speechtotext/v2.0/endpoints上的GET操作，测试其中一个端点，例如列出语音端点的端点点击“试试看”，你会得到一个200 OK的回复！

有用的反馈：1人称代词I是大写；通过>设备的2个报价块用于报价，不是一般的荧光灯；3如希望有帮助或希望这是明确的闲聊材料被视为绒毛，将被删除。这是仁慈的编辑，而不是添加它放在首位。杰伊，实际上我是在寻找微软语音API，而不是缩放媒体API。所以你的答案没有帮助。嗨，我的答案对你有帮助吗？