集团>;70%使用PHP的类似MySQL文本字段数据

集团>;70%使用PHP的类似MySQL文本字段数据,php,mysql,grouping,analytics,Php,Mysql,Grouping,Analytics,我在MySQL表中有一个文本文件。它有一个句子 范例 Hello AAAA, where is your dog BBBB Hello PPPP, where is your dog QQQQ Hello XXXX, where is your dog YYYY I am fine. thanks I am fine. thanks where are you going? Thank you very much 这里 前3个句子有7个单词中的5个相同。因此,(5/7)*100=72%相似 第

我在MySQL表中有一个文本文件。它有一个句子

范例

Hello AAAA, where is your dog BBBB
Hello PPPP, where is your dog QQQQ
Hello XXXX, where is your dog YYYY
I am fine. thanks
I am fine. thanks
where are you going?
Thank you very much
这里 前3个句子有7个单词中的5个相同。因此,(5/7)*100=72%相似

第四名和第五名100%相似

我的问题是。 使用php,我想在这样一个表中分组

sample_sentence_group                              count
Hello AAAA, where is your dog BBBB                 3
I am fine. thanks                                  2
where are you going?                               1
Thank you very much                                1
我怎么做? 该表有超过10万条记录


谢谢

我没有试过,但我想这样做1)逐条阅读2)与previos Group比较谢谢你古怪的回复。比较两个句子%的最佳方法是什么?你可以试着一个字一个字地切掉你的句子(用空格作为分隔符)。之后,您将有2个单词数组。然后可以检索联合(
数组_intersect
),并将联合数组的长度与初始长度进行比较。这会给你一些可以转化成百分比的东西