Php 从facebook和twitter好友中查找相似性分数的算法?

Php 从facebook和twitter好友中查找相似性分数的算法?,php,algorithm,facebook-graph-api,twitter,similarity,Php,Algorithm,Facebook Graph Api,Twitter,Similarity,我使用PHP从facebook和twitter获取好友列表,并将每个列表存储在关联数组中。我有他们的名字和位置。我想根据fb和twitter的朋友的姓名和位置,对他们进行比较,并提供相似性分数 比如我想设定一个0.7左右的阈值,如果分数大于一个人的分数,那么这意味着他们代表同一个实体。我使用过php函数类似于_text,但它太基本了,几乎每个朋友都有50-60%的匹配度,因为它只是基于名字中的单词 有什么建议吗 > P>你可能要考虑向量空间模型:在高维空间中将每个名称和位置作为维度来表示。将tw

我使用PHP从facebook和twitter获取好友列表,并将每个列表存储在关联数组中。我有他们的名字和位置。我想根据fb和twitter的朋友的姓名和位置,对他们进行比较,并提供相似性分数

比如我想设定一个0.7左右的阈值,如果分数大于一个人的分数,那么这意味着他们代表同一个实体。我使用过php函数类似于_text,但它太基本了,几乎每个朋友都有50-60%的匹配度,因为它只是基于名字中的单词


有什么建议吗

> P>你可能要考虑向量空间模型:在高维空间中将每个名称和位置作为维度来表示。将twitter表示为一个载体,将facebook表示为另一个载体。例如,如果我在facebook和twitter上都有一个叫Mike的朋友,“Mike”维度在两个向量中都有一个非零值。通过比较这两个向量之间的角度,我可以计算出相似性分数。角度越小,表示相似度越高。一个简单的例子:

我的推特朋友们: 艾达 艾伦 贝丝 达纳 乔恩

我的facebook朋友: 安妮 贝丝 达纳 乔恩

空间包含维度:

推特向量: t=<1,1,0,1,1,1>

Facebook矢量: f=<0,0,1,1,1,1>

它们之间的角度等于ArcCos([fdott]/[strong>f.*t.])


你可能要考虑向量空间模型:在高维空间中把每个名称和位置作为维度来表示。将twitter表示为一个载体,将facebook表示为另一个载体。例如,如果我在facebook和twitter上都有一个叫Mike的朋友,“Mike”维度在两个向量中都有一个非零值。通过比较这两个向量之间的角度,我可以计算出相似性分数。角度越小,表示相似度越高。一个简单的例子:

我的推特朋友们: 艾达 艾伦 贝丝 达纳 乔恩

我的facebook朋友: 安妮 贝丝 达纳 乔恩

空间包含维度:

推特向量: t=<1,1,0,1,1,1>

Facebook矢量: f=<0,0,1,1,1,1>

它们之间的角度等于ArcCos([fdott]/[strong>f.*t.])


请参见

这是一个基于名称计算相似度的好主意,我有一个问题,我如何合并位置?就像我有两套Ada Alan Beth Dana Jon,一套住在洛杉矶,另一套住在纽约。这是一个基于姓名计算相似度的好主意,我有一个问题,我如何将位置也纳入其中?就像我有两套艾达·艾伦·贝思·达纳·乔恩,一套住在洛杉矶,另一套住在纽约。