Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/linq/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/string/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Speech 有没有办法对一个单词的发音难度进行排序?_Speech - Fatal编程技术网

Speech 有没有办法对一个单词的发音难度进行排序?

Speech 有没有办法对一个单词的发音难度进行排序?,speech,Speech,我正在努力收集难发音的英语单词 我想知道是否有某种算法或理论可以用来显示单词的发音有多困难 你觉得这是可以计算的吗 由于这似乎是一件非常主观的事情,让我把它说得更客观一些,让我们说一下通过文本到语音技术最难发音的单词。在某种程度上 例如,语音程序使用语音系统来尝试和发音单词 例如,“抓取”可分为: Gr-A-Sp 但是,对于外来词(或不遵循此模式的词),必须保留例外列表,例如Yacht一种方法是建立一个包含每个词两个版本的列表。一个是正确的拼写,另一个是使用最简单的拼音拼写的单词。对两个单词应用

我正在努力收集难发音的英语单词

我想知道是否有某种算法或理论可以用来显示单词的发音有多困难

你觉得这是可以计算的吗

由于这似乎是一件非常主观的事情,让我把它说得更客观一些,让我们说一下通过文本到语音技术最难发音的单词。

在某种程度上

例如,语音程序使用语音系统来尝试和发音单词

例如,“抓取”可分为:

Gr-A-Sp


但是,对于外来词(或不遵循此模式的词),必须保留例外列表,例如Yacht

一种方法是建立一个包含每个词两个版本的列表。一个是正确的拼写,另一个是使用最简单的拼音拼写的单词。对两个单词应用距离函数(如Levenshtein距离)。两个词之间的距离越远,这个词就越难发音。

真是个大问题!在我的脑海中,你可以创建一个系统,其中包含来自拼音字母表的所有字母,并根据难度在每个组合之间连接权重(非常具体,因此可能需要多人测试和取平均值等)然后将英语词典中的所有单词列表存储在磁盘上,并调用一个脚本,该脚本循环遍历每个条目,并在维基百科上执行语音拼写的网页抓取,并对其难度进行排序。这可以考虑单词的长度以及拼音之间的难度,然后根据难度对列表进行排序


这就是我想尝试做的:建议

幸运的是,发音作为一个过程取决于两个因素,其中包括

  • 构成单词和元音及半元音位置的电话,即
  • /a/,/ae/,/e/,/i/,/o/,/u/,/w/,/j/

  • 单词的长度 第一个是关于手机声音产生的机制,因为需要改变软膜、面颊和舌头,以产生与单个手机相关的各种声音,如鼻音等。这使得一些单词更难发音,因为所需的动作可能很多。参考有关语音学的书籍,找出每个电话的发音位置

    算法

    a weighted spanning tree with weight being the difficulty of pronouncing two consecutive phones i.e l and r or /sh/ and /s/
    

    祝你好运

    对谁来说更难?许多单词对Lisp程序员来说很难发音。虽然这将是一个非常有趣的问题需要解决,但事实上英语中包含了很多视觉单词。。。由于英语中有大量的单词,有大量的词源,因此必须有很多“硬编码”的期望,我认为这几乎是不可能计算的。考虑“节奏”与“伍斯特郡”,甚至“FuthStutoWow”。最后一个发音为“范肖”。还有“segue”,发音为“segway”。发音简单,拼写不明显。贿赂你当地的语言治疗师给你一张清单。我相信他或她会做得比任何算法都好。好的一点,大多数文本到语音软件都有什么样的单词发音困难?这非常聪明,我的朋友!