如何实现语音&x27；标识'；在Javascript（或Flask WebApp）中？_Javascript_Python_Speech Recognition_Azure Cognitive Services

如何实现语音&x27；标识'；在Javascript（或Flask WebApp）中？

javascript python speech-recognition

如何实现语音&x27；标识'；在Javascript（或Flask WebApp）中？,javascript,python,speech-recognition,azure-cognitive-services,Javascript,Python,Speech Recognition,Azure Cognitive Services,我需要实现语音“识别”，即通过匹配他/她的声音来猜测试图登录的人是否真的是他/她。要考虑的情况下，应用程序不承认的人，但用户自己试图登录，那么他可以绕过它与PIN，设置在初始设置。< /P> 我正在使用Python和Flask构建webapp，并在问题中包含javascript，以便了解其中可能的方法。到目前为止，我从一些来源了解到了这一点，但我无法找到一个可能的解决方案，关于堆栈溢出，以及“很少”的博客文章我能找到的最好的“可能”解决方案是微软的认知语音服务- 我还想过使用Record

我需要实现语音“识别”，即通过匹配他/她的声音来猜测试图登录的人是否真的是他/她。要考虑的情况下，应用程序不承认的人，但用户自己试图登录，那么他可以绕过它与PIN，设置在初始设置。< /P> 我正在使用Python和Flask构建webapp，并在问题中包含javascript，以便了解其中可能的方法。到目前为止，我从一些来源了解到了这一点，但我无法找到一个可能的解决方案，关于堆栈溢出，以及“很少”的博客文章

我能找到的最好的“可能”解决方案是微软的认知语音服务-

我还想过使用Recorder.js录制语音，并在服务器端进行分析，但无法实现

因此，我想要一种在web应用程序上实现它的方法，哪怕是一个简单的要点和一点关于使用ms认知服务的代码（我确实阅读了文档的页面，但没有多大帮助），或者用python来实现也会很有帮助。

上的文档会很有帮助。请注意，有指向API参考的点击链接。它解释了高级流程（使用“注册”进行培训）

我们有，这是区分谁是从一组已知的声音，你训练。您需要提供带标签的数据（表示已知说话人讲话的示例）：请参阅

或请遵循以下链接语音SDK示例。

您可以使用批转录api并启用重分类。

正如@Ram所指出的，我们可以使用Microsoft认知服务，我们使用了同样的方法来实现它

首先，我们需要一个来自微软的用于认知语音服务的API密钥（他们提供2个密钥，一个端点免费试用7天，没有任何卡，另一个免费版本可能一年，有卡的详细信息）在此处获取API密钥：

然后，我查阅了微软的文档，但没有得到任何帮助。有帮助的是：

我浏览了所有文件，“需要”的部分主要是speech-recognition-api-demo-core.js和demo.html 首先了解它真正在做什么，然后只有你才能在你的页面上实现它。这实际上就是答案，因为这就是如何使用Javascript实现它的。

额外--我们只使用了Robin posbo的代码中所需的部分（您不能只是复制粘贴，首先要理解它），并实现了它，您可以在templates/verification.html

中看到这一点，谢谢您的回答，这就是我在html中实现它所做的。请注意，在客户端进行身份验证是不安全的。除了源数据（如语音、密码等）和从未处理过的数据（如登录成功），切勿信任来自客户端的任何内容。如果您正在使用API进行身份验证，请从服务器端使用它。