有没有一个工具可以在PHP中获取一个单词的所有派生词?

有没有一个工具可以在PHP中获取一个单词的所有派生词?,php,word,porter-stemmer,Php,Word,Porter Stemmer,我需要输入“face”并获得“face、faces、faces、faces、facer、Facesable”等 我遇到过一些效果相反的无效程序,比如SNOWBALL和一些Porter生成的PHP脚本,它们似乎不起作用 我开始认为我可能必须写这个脚本,但是,我想我应该检查一下是否有人已经在那里/做了那件事。很难简单地找到一种算法来找到一个单词可以这样写的不同方式 你可以使用一个已经有了所有可用单词的字典来代替它最好的方法是使用一个字典。波特词干分析器算法可以帮助你将复杂的单词减少到它们的基本词干(

我需要输入“face”并获得“face、faces、faces、faces、facer、Facesable”等

我遇到过一些效果相反的无效程序,比如SNOWBALL和一些Porter生成的PHP脚本,它们似乎不起作用


我开始认为我可能必须写这个脚本,但是,我想我应该检查一下是否有人已经在那里/做了那件事。

很难简单地找到一种算法来找到一个单词可以这样写的不同方式


你可以使用一个已经有了所有可用单词的字典来代替它

最好的方法是使用一个字典。波特词干分析器算法可以帮助你将复杂的单词减少到它们的基本词干(例如从“face”到“face”),但我不知道如何基于此扩展到派生词。我想你需要一个相当大的词汇数据库。可能的重复在“相关”问题列表的右边,这个问题有一个精确的重复。这也会在你写问题的时候出现。所以,显然是不存在的!是时候开始工作了。相反,可以通过一个庞大的词典数据库和一个包含词典编纂规则、前缀、结尾等的广泛库来实现。很酷,我不太了解dic WebVC的机制,但它看起来很有前景。遗憾的是,没有一个词典Web服务似乎具有“派生形式”作为一个功能-我发现最接近的是一个常规网站
http://www.wordwebonline.com
底部包含“派生形式”。但它不包括副词或其他形式。我找到了一个解决方案——你可以将你的单词列表放在Excel中,在我的例子中是14000个单词。使用筛选/包含、不包含等对列表进行排序。将单词分隔为列,查找/替换“es”、“s”和“ed”等。然后编写脚本,对照大型词典检查所有单词,并仅保留存在的单词。