PHP从文本生成随机短语

PHP从文本生成随机短语,php,string,Php,String,我试图从文本中构建独特的随机短语,以检测剽窃行为。其想法是,作者将提交一篇文章,然后php将从文本中构建短语,用于剽窃检测 考虑以下句子: 这是一篇很长很无聊的文章,这篇文章是剽窃的 根据上述文本,系统将确定将生成多少短语,即20个单词的长文章将包含3个短语。生成的最大短语长度至少为两个单词,最多为3个单词。返回的输出如下所示 很长 这篇文章是剽窃的 我编写了以下代码 $words = str_word_count($text, 1); $total_phrases_required = cou

我试图从文本中构建独特的随机短语,以检测剽窃行为。其想法是,作者将提交一篇文章,然后php将从文本中构建短语,用于剽窃检测

考虑以下句子:

这是一篇很长很无聊的文章,这篇文章是剽窃的

根据上述文本,系统将确定将生成多少短语,即20个单词的长文章将包含3个短语。生成的最大短语长度至少为两个单词,最多为3个单词。返回的输出如下所示

很长 这篇文章是剽窃的 我编写了以下代码

$words = str_word_count($text, 1);
$total_phrases_required = count($words) /2;
//build phrases

我需要提示如何完成该部分的其余部分。

您可以将文本分成两个句子数组,然后使用类似函数的函数递归检查类似字符串


另一个想法是,找到彻底的贫困。你可以把课文再分解成句子。然后将其放入数据库并运行一个查询,该查询选择索引列的计数和按句子列分组。如果返回的结果大于1,则需要与该句子完全匹配。

如果要自动创建短语,可以搜索,则需要一个包含常用词(如a、is和…)的数据库。。。并从文本中过滤这些内容。剩下的词将是要搜索的流行词。当然,可以对其进行优化以获得小句子,但这需要更多的逻辑。