如何实现语音&x27;标识';在Javascript(或Flask WebApp)中?

如何实现语音&x27;标识';在Javascript(或Flask WebApp)中?,javascript,python,speech-recognition,azure-cognitive-services,Javascript,Python,Speech Recognition,Azure Cognitive Services,我需要实现语音“识别”,即通过匹配他/她的声音来猜测试图登录的人是否真的是他/她。 要考虑的情况下,应用程序不承认的人,但用户自己试图登录,那么他可以绕过它与PIN,设置在初始设置。< /P> 我正在使用Python和Flask构建webapp,并在问题中包含javascript,以便了解其中可能的方法。 到目前为止,我从一些来源了解到了这一点,但我无法找到一个可能的解决方案,关于堆栈溢出,以及“很少”的博客文章 我能找到的最好的“可能”解决方案是微软的认知语音服务- 我还想过使用Record

我需要实现语音“识别”,即通过匹配他/她的声音来猜测试图登录的人是否真的是他/她。 要考虑的情况下,应用程序不承认的人,但用户自己试图登录,那么他可以绕过它与PIN,设置在初始设置。< /P> 我正在使用Python和Flask构建webapp,并在问题中包含javascript,以便了解其中可能的方法。 到目前为止,我从一些来源了解到了这一点,但我无法找到一个可能的解决方案,关于堆栈溢出,以及“很少”的博客文章

我能找到的最好的“可能”解决方案是微软的认知语音服务-

我还想过使用Recorder.js录制语音,并在服务器端进行分析,但无法实现

因此,我想要一种在web应用程序上实现它的方法,哪怕是一个简单的要点和一点关于使用ms认知服务的代码(我确实阅读了文档的页面,但没有多大帮助),或者用python来实现也会很有帮助。

上的文档会很有帮助。请注意,有指向API参考的点击链接。它解释了高级流程(使用“注册”进行培训)

我们有,这是区分谁是从一组已知的声音,你训练。您需要提供带标签的数据(表示已知说话人讲话的示例):请参阅

或 请遵循以下链接语音SDK示例。

您可以使用批转录api并启用重分类。

正如@Ram所指出的,我们可以使用Microsoft认知服务,我们使用了同样的方法来实现它

首先,我们需要一个来自微软的用于认知语音服务的API密钥(他们提供2个密钥,一个端点免费试用7天,没有任何卡,另一个免费版本可能一年,有卡的详细信息) 在此处获取API密钥:

然后,我查阅了微软的文档,但没有得到任何帮助。 有帮助的是:

我浏览了所有文件,“需要”的部分主要是speech-recognition-api-demo-core.js和demo.html 首先了解它真正在做什么,然后只有你才能在你的页面上实现它。 这实际上就是答案,因为这就是如何使用Javascript实现它的。
额外--我们只使用了Robin posbo的代码中所需的部分(您不能只是复制粘贴,首先要理解它),并实现了它,您可以在templates/verification.html

中看到这一点,谢谢您的回答,这就是我在html中实现它所做的。请注意,在客户端进行身份验证是不安全的。除了源数据(如语音、密码等)和从未处理过的数据(如登录成功),切勿信任来自客户端的任何内容。如果您正在使用API进行身份验证,请从服务器端使用它。