Javascript Webkit语音识别API:单音节

Javascript Webkit语音识别API:单音节,javascript,speech-recognition,webkitspeechrecognition,Javascript,Speech Recognition,Webkitspeechrecognition,我正在尝试使用Webkit语音识别API来识别单个音节,而不是完整的单词或句子。 由于此API需要“语法”定义,我想知道是否有方法实现单音节识别。像“啊”或“比”之类的东西 谢谢不幸的是,这在Web语音API中是不可能的。尽管您可以创建自定义语法(单词的集合),但不能定义自定义词典或词汇表(单词本身)。在您的情况下,您需要定义一个自定义词汇表,其中包括单个音素作为单词,然后将语法限制为仅从自定义词汇表中选择单词。有一些基于云计算的付费服务可以让你做到这一点 例如,使用IBM Watson,您可以

我正在尝试使用Webkit语音识别API来识别单个音节,而不是完整的单词或句子。 由于此API需要“语法”定义,我想知道是否有方法实现单音节识别。像“啊”或“比”之类的东西


谢谢

不幸的是,这在Web语音API中是不可能的。尽管您可以创建自定义语法(单词的集合),但不能定义自定义词典或词汇表(单词本身)。在您的情况下,您需要定义一个自定义词汇表,其中包括单个音素作为单词,然后将语法限制为仅从自定义词汇表中选择单词。有一些基于云计算的付费服务可以让你做到这一点

例如,使用IBM Watson,您可以,然后(在您的例子中,每个音素都是一个“单词”)。通常,自定义语言模型与通用语言模型混合使用,但您不希望这样,因此您可以将其更改为1.0(这意味着它将只使用您的自定义语言模型)


你也可以用其他方法来解决这个问题,但我怀疑你是否能找到一个不涉及付费服务的纯网络解决方案。如果您能够移动到本机平台(或在服务器上创建自己的基于web的服务),那么您还有一些选择。例如,CMUSphinx允许您在服务器上使用Sphinx4或在移动设备上使用PocketSphinx。虽然CMUSphinx不是用于大型词汇表应用程序的最精确的系统,但您的自定义词汇表会很小,因此CMUSphinx的性能会很好。

有一种方法可以在
语音识别中设置
语法
,但您需要音节。。。音节有很多。。。也许你可以用这个来创建你自己的语法。谢谢David的详细回答。因此,据我所知,我必须创建自己的web服务(可能托管在某个云上),并通过web浏览器发送语音音节的简短录音。是吗?@Forecik如果你需要上网(不是本机手机或桌面),那么是的,你需要在服务器上进行语音识别(无论是你自己的还是云服务)。我会在服务器上设置Sphinx4,然后使用WebSocket将音频数据实时传输到服务器。然后,您可以通过相同的套接字发送识别响应。