Php 试图创建一个';趋势词/短语';引擎,但需要过滤掉常用词

Php 试图创建一个';趋势词/短语';引擎,但需要过滤掉常用词,php,mysql,Php,Mysql,我想解析进入系统的字符串,并在单独的表中保存每个单词的字数。问题是许多常见的词,如“the”、“at”等,都会被包含在不应该包含的范围内。我不想手工编字典。有谁知道一本像样的常用词词典,我可以与之匹敌而不包括在内?谢谢。您特别提到的是“停止语”列表 你可以在这里找到 这可能是一个好的开始:

我想解析进入系统的字符串,并在单独的表中保存每个单词的字数。问题是许多常见的词,如“the”、“at”等,都会被包含在不应该包含的范围内。我不想手工编字典。有谁知道一本像样的常用词词典,我可以与之匹敌而不包括在内?谢谢。

您特别提到的是“停止语”列表

你可以在这里找到

这可能是一个好的开始: