Javascript Webkit语音识别API：单音节_Javascript_Speech Recognition_Webkitspeechrecognition

Javascript Webkit语音识别API：单音节

javascript speech-recognition

Javascript Webkit语音识别API：单音节,javascript,speech-recognition,webkitspeechrecognition,Javascript,Speech Recognition,Webkitspeechrecognition,我正在尝试使用Webkit语音识别API来识别单个音节，而不是完整的单词或句子。由于此API需要“语法”定义，我想知道是否有方法实现单音节识别。像“啊”或“比”之类的东西谢谢不幸的是，这在Web语音API中是不可能的。尽管您可以创建自定义语法（单词的集合），但不能定义自定义词典或词汇表（单词本身）。在您的情况下，您需要定义一个自定义词汇表，其中包括单个音素作为单词，然后将语法限制为仅从自定义词汇表中选择单词。有一些基于云计算的付费服务可以让你做到这一点例如，使用IBM Watson，您可以

我正在尝试使用Webkit语音识别API来识别单个音节，而不是完整的单词或句子。由于此API需要“语法”定义，我想知道是否有方法实现单音节识别。像“啊”或“比”之类的东西

谢谢

不幸的是，这在Web语音API中是不可能的。尽管您可以创建自定义语法（单词的集合），但不能定义自定义词典或词汇表（单词本身）。在您的情况下，您需要定义一个自定义词汇表，其中包括单个音素作为单词，然后将语法限制为仅从自定义词汇表中选择单词。有一些基于云计算的付费服务可以让你做到这一点

例如，使用IBM Watson，您可以，然后（在您的例子中，每个音素都是一个“单词”）。通常，自定义语言模型与通用语言模型混合使用，但您不希望这样，因此您可以将其更改为1.0（这意味着它将只使用您的自定义语言模型）

你也可以用其他方法来解决这个问题，但我怀疑你是否能找到一个不涉及付费服务的纯网络解决方案。如果您能够移动到本机平台（或在服务器上创建自己的基于web的服务），那么您还有一些选择。例如，CMUSphinx允许您在服务器上使用Sphinx4或在移动设备上使用PocketSphinx。虽然CMUSphinx不是用于大型词汇表应用程序的最精确的系统，但您的自定义词汇表会很小，因此CMUSphinx的性能会很好。

有一种方法可以在

语音识别中设置语法
，但您需要音节。。。音节有很多。。。也许你可以用这个来创建你自己的语法。谢谢David的详细回答。因此，据我所知，我必须创建自己的web服务（可能托管在某个云上），并通过web浏览器发送语音音节的简短录音。是吗？@Forecik如果你需要上网（不是本机手机或桌面），那么是的，你需要在服务器上进行语音识别（无论是你自己的还是云服务）。我会在服务器上设置Sphinx4，然后使用WebSocket将音频数据实时传输到服务器。然后，您可以通过相同的套接字发送识别响应。