Nlp 使用word2vec计算用户之间的相似度

Nlp 使用word2vec计算用户之间的相似度,nlp,recommendation-engine,mahout-recommender,word2vec,Nlp,Recommendation Engine,Mahout Recommender,Word2vec,我最近开始了解这个叫做word2vec的工具。对于我目前的工作,我需要找出与给定用户相似的用户。单个用户具有与之相关的实体,如年龄、资格、机构/组织、已知语言和特定标签列表。如果我们将这些实体/列中的每一个看作用户的随机块,那么我们可以相应地计算该用户的向量值,并使用这些值来推断用户之间的相似性。wiki培训向量能帮助我们获得有意义的结果吗?还有其他方法吗?您需要的是一个简单的无监督(或半监督)聚类算法。word2vec及其预先训练的向量可能没有多大帮助,因为机构等不太可能在其中 此外,用户的“

我最近开始了解这个叫做word2vec的工具。对于我目前的工作,我需要找出与给定用户相似的用户。单个用户具有与之相关的实体,如年龄、资格、机构/组织、已知语言和特定标签列表。如果我们将这些实体/列中的每一个看作用户的随机块,那么我们可以相应地计算该用户的向量值,并使用这些值来推断用户之间的相似性。wiki培训向量能帮助我们获得有意义的结果吗?还有其他方法吗?

您需要的是一个简单的无监督(或半监督)聚类算法。word2vec及其预先训练的向量可能没有多大帮助,因为机构等不太可能在其中

此外,用户的“方面”数量似乎很小,因此您可以简单地在向量表示上使用聚类算法,其中向量空间的每个维度都是这些方面之一(年龄、资格、组织等)

如果您希望用户的相似性反映这些方面的相似性(而不是完全相等),像word2vec这样的连续空间模型可能会有所帮助

例如,如果您希望将“Python专家”的资格评定为与“脚本专家”相近的级别,那么选择word2vec。但是,如果要在有限的预定义方面中寻找精确的匹配,请使用简单的聚类算法

关于这一主题的更多详细问答,请参见