Nlp Elman SRN的单词/音素语料库(英语)

Nlp Elman SRN的单词/音素语料库(英语),nlp,neural-network,phoneme,Nlp,Neural Network,Phoneme,我在写一个简单的Elman循环网络。我想给它一系列单词,每个单词都是一系列音素,我需要大量的训练和测试数据 所以,我需要的是一个英语单词的语料库,连同它们组成的音素,以类似ARPAbet或SAMPA的形式书写。英国英语会很好,但只要我知道我在处理什么,它就不是必需的。有什么建议吗 我目前没有时间或倾向于编码从口语或书面数据中派生出一个单词的音素的东西,所以请不要建议这样做 注意:我知道,但它声称它只是基于ARPABet符号集-有人知道是否有任何差异,如果有,它们是什么?(如果没有的话,我可以用它

我在写一个简单的Elman循环网络。我想给它一系列单词,每个单词都是一系列音素,我需要大量的训练和测试数据

所以,我需要的是一个英语单词的语料库,连同它们组成的音素,以类似ARPAbet或SAMPA的形式书写。英国英语会很好,但只要我知道我在处理什么,它就不是必需的。有什么建议吗

我目前没有时间或倾向于编码从口语或书面数据中派生出一个单词的音素的东西,所以请不要建议这样做

注意:我知道,但它声称它只是基于ARPABet符号集-有人知道是否有任何差异,如果有,它们是什么?(如果没有的话,我可以用它…)

编辑:CMUPD 0.7a-元音可能有词汇重音,并且有变体(ARPABET标准符号)表明了这一点。

cmudit应该可以。“Arpabet符号集”只是指Arpabet。如果存在任何细微差异,应在CMUdict文档中解释

如果你需要更接近现实生活的数据,而不是将单个单词的字典发音串在一起,那么可以寻找语音转录语料库,例如TIMIT。

cmudit应该可以。“Arpabet符号集”只是指Arpabet。如果存在任何细微差异,应在CMUdict文档中解释


如果你需要更接近现实生活的数据,而不是将单个单词的字典发音串在一起,那么可以寻找语音转录语料库,例如TIMIT。

CMUPD ARPABet和什么之间的差异?常规arpabet?是的,CMUPD arpabet和常规arpabet。CMUPD arpabet和什么的区别?常规arpabet?是的,CMUPD arpabet和常规arpabet。我的主要问题不是该短语的“符号集”部分,而是“基于”部分。结合我在问题中链接到的页面上的描述来看,唯一的区别似乎是他们添加了表示词汇重音的变体。另外,感谢您提到语音转录语料库——这是一个很好的方向,一旦我掌握了单个单词的基本知识,我就可以查看。我的主要问题不是该短语的“符号集”部分,而是“基于”部分。结合我在问题中链接到的页面上的描述来看,唯一的区别似乎是他们添加了表示词汇重音的变体。另外,感谢您提到语音转录语料库-这是一个很好的方向,让我看看,一旦我有了个人的单词工作良好的基础。