Speech recognition 在有大量单词的情况下,如何有效地创建用于语音识别的语法文件?

Speech recognition 在有大量单词的情况下,如何有效地创建用于语音识别的语法文件?,speech-recognition,Speech Recognition,只需50个单词就可以编写语音识别的语法文件,因为您可以手动完成。如果你有10000或100000个单词,最简单、最有效的方法是什么 示例: 假设我们有“RC可乐”和“百事可乐”。我们的语法文件由两条规则组成: 饮料:(可乐名?[可乐苏打] 可乐名:[rc百事可乐] 它将识别“RC”、“RC可口可乐”、“RC可乐”、“RC苏打”、“百事可乐”、“百事可乐”、“百事可乐”和“百事苏打” 编辑: 我说的是语音识别的语法。语音识别系统需要一个附带的语法文件,以便知道识别什么(gsl、grxml)。事实上

只需50个单词就可以编写语音识别的语法文件,因为您可以手动完成。如果你有10000或100000个单词,最简单、最有效的方法是什么

示例:
假设我们有“RC可乐”和“百事可乐”。我们的语法文件由两条规则组成:
饮料:(可乐名?[可乐苏打]
可乐名:[rc百事可乐]
它将识别“RC”、“RC可口可乐”、“RC可乐”、“RC苏打”、“百事可乐”、“百事可乐”、“百事可乐”和“百事苏打”

编辑:
我说的是语音识别的语法。语音识别系统需要一个附带的语法文件,以便知道识别什么(gsl、grxml)。事实上,我也在考虑不只是任何单词,而是一些你无法分类的名字。

完全随机/我脑海中的想法:

-您可以尝试将单词分类(名词、动词等),然后根据单词的类别为整个语句/句子形成可能正确的形式。然后,您可以尝试根据单词及其使用顺序将新测试数据拟合到先前定义的模型中


-我也很好奇使用某种机器学习算法来学习基于某种训练数据或文献的单词的正确用法。一旦您训练了一些算法,您就可以尝试根据以前的结果对新传入的数据进行分类

我脑子里完全是胡思乱想的想法:

-您可以尝试将单词分类(名词、动词等),然后根据单词的类别为整个语句/句子形成可能正确的形式。然后,您可以尝试根据单词及其使用顺序将新测试数据拟合到先前定义的模型中


-我也很好奇使用某种机器学习算法来学习基于某种训练数据或文献的单词的正确用法。一旦您训练了一些算法,您就可以尝试根据以前的结果对新传入的数据进行分类

我想你指的是词性标注;最快的方法是使用自动标记器并手动验证(和纠正)结果。
即使标记器的命中率低至60-70%,它仍然会显著减少工作量。

我猜你指的是词性标记;最快的方法是使用自动标记器并手动验证(和纠正)结果。
即使tagger的命中率低至60-70%,它仍然会显著减少工作量。

现在我明白了。你是说语法。您指定的语法格式是上下文无关语法的近亲。关于上下文无关语法的自动学习存在一个研究领域。是这个领域的核心。
请参阅关于学习PCFGs的,和。这是一个活跃的研究领域,自从这些论文发表以来已经发生了变化。他是这个领域多产的研究人员。

现在我明白了。你是说语法。您指定的语法格式是上下文无关语法的近亲。关于上下文无关语法的自动学习存在一个研究领域。是这个领域的核心。
请参阅关于学习PCFGs的,和。这是一个活跃的研究领域,自从这些论文发表以来已经发生了变化。他是这一领域多产的研究人员。

我没有一个能解决我问题的答案,但尤瓦尔的答案清楚地表明,这是一个仍在发展中的课题,还不够成熟。我知道现在可能没有简单的语法修正(至少在研究实验室之外)。现在做一个好语法的唯一解决方案可能是不断学习用户输入和语法文件的灵活重构。

我没有一个答案可以解决我的问题,但Yuval的答案清楚地表明这是一个仍在开发中的主题,它还不够成熟。我知道现在可能没有简单的语法修正(至少在研究实验室之外)。现在做一个好语法的唯一解决方案可能是不断地学习用户输入和灵活地重构语法文件。

对于一个5-10万单词的词典,你几乎可以肯定最好建立一个听写语法,而不是试图建立一个上下文无关的语法。微软有他们的免费软件;我没有使用过它,所以我无法评论它的可用性。

对于一个5-10万单词的词典,你几乎可以肯定最好建立一个听写语法,而不是试图建立一个上下文无关的语法。微软有他们的免费软件;我没有使用过它,所以我不能评论它的可用性。

你能举个例子吗?你能举个例子吗?我知道。我很抱歉。我说的更多的是言语记录,我知道。我很抱歉。我说的更多的是语音记录。你应该发现,对于一小部分单词来说,目前的研究将非常有效。目前尚未解决的一个研究问题是机器转录,以及改进的大词语音识别。(抄写是指在讲座中打开笔记本电脑,然后在没有任何培训的情况下,它会自动为您抄写讲座-而仅仅是语音识别往往需要培训,并且演讲者必须注意确保他们的语音良好)。你应该发现,对于一组非常小的单词,目前的研究将非常有效。目前尚未解决的研究问题是机器转录,以及对大词的语音识别的改进。(抄写是指你在演讲中打开笔记本电脑,然后在没有任何培训的情况下,它会自动为你抄写演讲——而仅仅是语音识别往往需要培训,演讲者必须接受培训