Speech recognition 语音识别算法如何识别同音词?

Speech recognition 语音识别算法如何识别同音词?,speech-recognition,voice-recognition,Speech Recognition,Voice Recognition,我刚才在考虑这个问题。现代算法(特别是那些将语音转换为文本的算法)使用什么线索来确定说的是哪一个同音词(例如to,to,to或two?) 他们使用上下文线索吗?句子结构?也许每个单词的发音方式都有细微的差别(例如,我通常把o音分成两个音比把o音分成两个音长)。前两者的结合似乎最为合理 他们使用上下文线索吗 是的,ASR系统使用跨词上下文。例如,如果前一个单词是“going”,那么下一个单词很可能是“to”,而不是“two”。ASR系统考虑概率并选择最佳可能解码变量 句子结构 是的,ASR系统还使

我刚才在考虑这个问题。现代算法(特别是那些将语音转换为文本的算法)使用什么线索来确定说的是哪一个同音词(例如to,to,to或two?)

他们使用上下文线索吗?句子结构?也许每个单词的发音方式都有细微的差别(例如,我通常把o音分成两个音比把o音分成两个音长)。前两者的结合似乎最为合理

他们使用上下文线索吗

是的,ASR系统使用跨词上下文。例如,如果前一个单词是“going”,那么下一个单词很可能是“to”,而不是“two”。ASR系统考虑概率并选择最佳可能解码变量

句子结构

是的,ASR系统还使用更高级的语言模型来预测给定上下文的可能单词

也许每个单词的发音方式都有细微的差别(例如,我通常把o音分成两个音比把o音分成两个音长)

那也是。实际上,“too”和“to”的发音完全不同。“to”通常被简化为shwa

若你们对语音识别算法感兴趣,那个么读一读ASR的书或者查阅在线课程是有意义的。有关详细信息,请参阅

他们使用上下文线索吗

是的,ASR系统使用跨词上下文。例如,如果前一个单词是“going”,那么下一个单词很可能是“to”,而不是“two”。ASR系统考虑概率并选择最佳可能解码变量

句子结构

是的,ASR系统还使用更高级的语言模型来预测给定上下文的可能单词

也许每个单词的发音方式都有细微的差别(例如,我通常把o音分成两个音比把o音分成两个音长)

那也是。实际上,“too”和“to”的发音完全不同。“to”通常被简化为shwa

若你们对语音识别算法感兴趣,那个么读一读ASR的书或者查阅在线课程是有意义的。有关详细信息,请参阅


你能在这方面帮助我吗?你希望得到什么样的帮助?你能在这方面帮助我吗?你希望得到什么样的帮助?