Python CMU字典中未包含的反向音素

Python CMU字典中未包含的反向音素,python,cmusphinx,Python,Cmusphinx,卡内基梅隆大学发音词典允许从单词中提取音素。我在互联网上做了一些研究,似乎有一些扩展作为LOGIOS Lexicon工具,它为原始CMU字典()中可能未包含的任意单词派生音素。通过使用神经网络模型()也可以得到同样的结果,因此基本上每个单词都可以得到相应的音素 但这个过程对每个词都是可逆的吗?显然,对于已经包含在CMU字典中的单词,不需要反转,因为单词附加在相应的音素上。但是我怎样才能从任意的音素中得到这个词呢?这是一个工具(可能在Python中)还是我应该自己实现相反的功能?可能需要查看源代码

卡内基梅隆大学发音词典允许从单词中提取音素。我在互联网上做了一些研究,似乎有一些扩展作为LOGIOS Lexicon工具,它为原始CMU字典()中可能未包含的任意单词派生音素。通过使用神经网络模型()也可以得到同样的结果,因此基本上每个单词都可以得到相应的音素


但这个过程对每个词都是可逆的吗?显然,对于已经包含在CMU字典中的单词,不需要反转,因为单词附加在相应的音素上。但是我怎样才能从任意的音素中得到这个词呢?这是一个工具(可能在Python中)还是我应该自己实现相反的功能?可能需要查看源代码,执行单词到音素的解析并尝试将其还原(如果可能)?

最自然的方法是训练一些seq2seq神经网络模型来执行音素到字形的转换


g2p-seq2seq用于支持从音素到字形的模式,请参见github,但该功能在最近的升级中丢失。把它带回来会很好。

你说的“任意音素”是什么意思?你可以使用g2p工具用新词及其音素序列扩展CMUDIT,然后反向搜索音素。我指的是我可以提供的一般音素,它们不一定对应一个有意义的词。例如,当我取音素序列H AA EH HH D EH T T R时,它给出了相应的关联词。基本上我想要反函数。您的方法是正确的,但只有在您事先知道的情况下才能获取相关单词,对吗?关闭灯,深呼吸,然后三次思考您的问题,如果您单击任何内容,请告知我们。谢谢您的好意。很高兴知道,在这个世界的某个地方,有一个人对你的问题做出了如此详尽的回答,并以如此巨大的耐心让你明白自己哪里出了错!真的很有帮助,谢谢!祝你度过愉快的一天。你基本上需要一个音素到字形的转换工具。要么寻找一个可用的工具,要么写你自己的。谢谢!是的,如果能把它拿回来就太好了。