Javascript 音频/语音比较和getUserMedia

Javascript 音频/语音比较和getUserMedia,javascript,audio,voice,getusermedia,audio-comparison,Javascript,Audio,Voice,Getusermedia,Audio Comparison,我正在构建一个需要语音激活命令的web应用程序。我正在使用getUserMedia进行音频输入 对于语音激活命令,过程是用户需要通过记录其语音来“校准”命令。例如,对于“停止”命令,用户将说“停止”,然后应用程序将保存音频片段。然后用户发出“停止”命令,他/她会说“停止”这个词 现在的问题是,是否有任何方法可以比较/识别用户从先前“校准”/“录制”的预录制音频命令发出的命令(音频输入)?换句话说,比较来自另一个音频(文件)的音频流。希望任何人都能给我指出正确的方向,因为我已经为此做了很长时间的研

我正在构建一个需要语音激活命令的web应用程序。我正在使用getUserMedia进行音频输入

对于语音激活命令,过程是用户需要通过记录其语音来“校准”命令。例如,对于“停止”命令,用户将说“停止”,然后应用程序将保存音频片段。然后用户发出“停止”命令,他/她会说“停止”这个词

现在的问题是,是否有任何方法可以比较/识别用户从先前“校准”/“录制”的预录制音频命令发出的命令(音频输入)?换句话说,比较来自另一个音频(文件)的音频流。希望任何人都能给我指出正确的方向,因为我已经为此做了很长时间的研究

提前谢谢


注意:我并不像SoundHound那样比较/识别音乐。另外,我认为我不需要语音识别,这对于我所需要的机制来说太复杂和不必要了。显然,如果没有语音识别,这即使不是不可能,也是很难做到的。有谁能推荐一个语音识别库/API(希望是javascript)供我试用吗?

没有语音识别是无法做到这一点的,因为一个人生成两个相同音频文件的几率远远小于0.00000000000000000000000000000021%

您可能能够识别语音音调,并将其与校准音频进行相当准确的比较,但要基于非来自机器的简单音频比较来捕获语音-决不,绝对不可能


你可以根据音高的变化、音节之间的停顿长度、共振峰等对某些单词/命令进行分类。。。但这些仍然是语音识别的第一步。

您指出了一个非常有效的问题。你能推荐我可以试用的语音识别库/API(希望是javascript)吗?谢谢不客气!嗯,我从来没有与他们中的任何人合作过,而且他们中有很多人(只是做了一次搜索)。。。但是,首先,最好从HTML5语音识别API()开始,因为它可能刚好满足您想要实现的目标。