Nlp 给定100000个单词到音素的映射，如何在音素边界上拆分原始单词？_Nlp_Artificial Intelligence_Hidden Markov Models_Markov Chains_Speech Synthesis

Nlp 给定100000个单词到音素的映射，如何在音素边界上拆分原始单词？

nlp artificial-intelligence

Nlp 给定100000个单词到音素的映射，如何在音素边界上拆分原始单词？,nlp,artificial-intelligence,hidden-markov-models,markov-chains,speech-synthesis,Nlp,Artificial Intelligence,Hidden Markov Models,Markov Chains,Speech Synthesis,我将100000多个单词映射到它们的音素（），如：我想把原始单词的字母分成与音素数量相等的若干组，即e.x ABANDONED => [ 'A', 'B', 'A', 'N', 'D', 'O', 'N', 'ED' ] 我没有音素到字形的映射，但似乎我应该能够计算音素到字形的统计模型，然后用它来决定每个单词的拆分位置。（如果该模型还可以用于将新词转换为可能的音素，那就太好了）我该怎么做？我在想一个隐马尔可夫模型听起来可能是适用的，但除了这个预感，我不知道。要收集统计数据，首先通过匹

我将100000多个单词映射到它们的音素（），如：

我想把原始单词的字母分成与音素数量相等的若干组，即e.x

ABANDONED => [ 'A', 'B', 'A', 'N', 'D', 'O', 'N', 'ED' ]

我没有音素到字形的映射，但似乎我应该能够计算音素到字形的统计模型，然后用它来决定每个单词的拆分位置。（如果该模型还可以用于将新词转换为可能的音素，那就太好了）

我该怎么做？我在想一个隐马尔可夫模型听起来可能是适用的，但除了这个预感，我不知道。

要收集统计数据，首先通过匹配相同的字母和音素（如

和

）将单词与其语音表示对齐。您可以使用动态规划获得最佳匹配。然后，您可以将单词的剩余字符映射到剩余的音素

一旦计算出频率，就可以使用噪声信道模型将新词转换为音素。

这似乎是一个相关的问题：

ABANDONED => [ 'A', 'B', 'A', 'N', 'D', 'O', 'N', 'ED' ]