Nlp 使用word2vec计算用户之间的相似度_Nlp_Recommendation Engine_Mahout Recommender_Word2vec

Nlp 使用word2vec计算用户之间的相似度

nlp

Nlp 使用word2vec计算用户之间的相似度,nlp,recommendation-engine,mahout-recommender,word2vec,Nlp,Recommendation Engine,Mahout Recommender,Word2vec,我最近开始了解这个叫做word2vec的工具。对于我目前的工作，我需要找出与给定用户相似的用户。单个用户具有与之相关的实体，如年龄、资格、机构/组织、已知语言和特定标签列表。如果我们将这些实体/列中的每一个看作用户的随机块，那么我们可以相应地计算该用户的向量值，并使用这些值来推断用户之间的相似性。wiki培训向量能帮助我们获得有意义的结果吗？还有其他方法吗？您需要的是一个简单的无监督（或半监督）聚类算法。word2vec及其预先训练的向量可能没有多大帮助，因为机构等不太可能在其中此外，用户的“

我最近开始了解这个叫做word2vec的工具。对于我目前的工作，我需要找出与给定用户相似的用户。单个用户具有与之相关的实体，如年龄、资格、机构/组织、已知语言和特定标签列表。如果我们将这些实体/列中的每一个看作用户的随机块，那么我们可以相应地计算该用户的向量值，并使用这些值来推断用户之间的相似性。wiki培训向量能帮助我们获得有意义的结果吗？还有其他方法吗？

您需要的是一个简单的无监督（或半监督）聚类算法。word2vec及其预先训练的向量可能没有多大帮助，因为机构等不太可能在其中

此外，用户的“方面”数量似乎很小，因此您可以简单地在向量表示上使用聚类算法，其中向量空间的每个维度都是这些方面之一（年龄、资格、组织等）

如果您希望用户的相似性反映这些方面的相似性（而不是完全相等），像word2vec这样的连续空间模型可能会有所帮助

例如，如果您希望将“Python专家”的资格评定为与“脚本专家”相近的级别，那么选择word2vec。但是，如果要在有限的预定义方面中寻找精确的匹配，请使用简单的聚类算法

关于这一主题的更多详细问答，请参见