Statistics 比较两个有序列表的相似性

Statistics 比较两个有序列表的相似性,statistics,information-theory,Statistics,Information Theory,假设我有两个列表: L1: [1,2,3,4] L2: [1,3,2,4,5] 如何计算这两个列表之间的相似性 如果这两个列表的长度相同,斯皮尔曼和肯德尔似乎是答案,但这一原则是否也可以扩展到长度不同的列表?生物信息学和语言分析领域也有类似的问题。您可以使用各种序列内核(例如,参见Corinna Cortes的论文),并且。生物信息学和语言分析领域也有类似的问题。您可以使用各种序列核(例如,请参阅Corinna Cortes的论文)和。衡量列表相似性的一个很有前途的算法似乎是使用Spearma

假设我有两个列表:

L1: [1,2,3,4]
L2: [1,3,2,4,5]
如何计算这两个列表之间的相似性


如果这两个列表的长度相同,斯皮尔曼和肯德尔似乎是答案,但这一原则是否也可以扩展到长度不同的列表?

生物信息学和语言分析领域也有类似的问题。您可以使用各种序列内核(例如,参见Corinna Cortes的论文),并且。

生物信息学和语言分析领域也有类似的问题。您可以使用各种序列核(例如,请参阅Corinna Cortes的论文)和。

衡量列表相似性的一个很有前途的算法似乎是使用Spearman足迹距离,或者更复杂的方法,并考虑顺序、折扣累积增益(DCG)

关于这个主题的一个很好的资源是


衡量列表相似性的一个很有前途的算法似乎是使用斯皮尔曼足迹距离,或更复杂的距离,并考虑顺序、折扣累积增益(DCG)

关于这个主题的一个很好的资源是


他们总是排名吗?或者它们是任意列表?它们是数字列表?不,它们是字符串。但是我可以执行SimHash来获得一个数字,也可以使用函数I(string)-->来确定它们是否总是排名?或者它们是任意列表?它们是数字列表?不,它们是字符串。但是我可以执行SimHash来获得一个数字,或者使函数I(string)-->int