Algorithm 发现';相关性';在两个单词列表之间

Algorithm 发现';相关性';在两个单词列表之间,algorithm,similarity,information-retrieval,Algorithm,Similarity,Information Retrieval,我有一个L1单词列表,还有B1、B2、Bn等候选单词列表。所有列表的长度都相同。但它们没有相同的元素。列表不包含重复的元素。L1与B1、B2…Bn中的一种最为相似。我可以应用什么样的算法来查找与L1最相关的列表 一些潜在的算法有编辑距离、排名相关性(在两个列表中应该有相同的元素,这在我的列表中不是这样)、骰子和jaccard。我也不确定这里的“相关性”这个词在这种情况下有效吗 编辑:我有一套文档和两个主题建模算法A1和A2。通过将A1应用于文档集,我得到了10个主题,而将A2应用于另外10个主题

我有一个L1单词列表,还有B1、B2、Bn等候选单词列表。所有列表的长度都相同。但它们没有相同的元素。列表不包含重复的元素。L1与B1、B2…Bn中的一种最为相似。我可以应用什么样的算法来查找与L1最相关的列表

一些潜在的算法有编辑距离、排名相关性(在两个列表中应该有相同的元素,这在我的列表中不是这样)、骰子和jaccard。我也不确定这里的“相关性”这个词在这种情况下有效吗


编辑:我有一套文档和两个主题建模算法A1和A2。通过将A1应用于文档集,我得到了10个主题,而将A2应用于另外10个主题。因此,上面的列表定义了这些主题中的单词。现在我想找到由这两个算法A1和A2创建的类似主题

也许你可以试着从

开始抱歉。。我误解了你的问题,读得太快了。。试着列出要比较的单词的示例,以便更好地理解。您想确定B1、B2、…Bn中哪一个与L1最相似?你必须首先定义你所说的相似是什么意思。这是否意味着比较B1[0]和L1[0],然后比较B2[0]和L1[0],等等?或者,您是否将B1[0]与L1中的所有元素进行比较,将B1[1]与所有元素进行比较,等等。在我们提出计算方法之前,您必须提供更多关于列表相似意味着什么的信息。我已经更新了问题。编辑是非常有用的。你能给我们一些样本数据,比如算法A1和A2确定的主题列表吗?你的期望是什么?你期望你的相似性算法能够分辨出“木雕”和“削削”是密切相关的,“基本权利”和“原教旨主义仪式”是完全不相关的吗?我用骰子和Jaccard解决了这个问题。非常感谢你试图帮助我!嗨,比尔,这正是我要找的。是否愿意就您的解决方案提供更多提示或资源?