Php 求数组中的序列相似性
我有一个任务,其中我有三个数组a、B、C。所有数组都包含相同的数据。为了简单起见,让我们假设数据是数字1到5。数据将处于不同的混乱序列中。我想在B&C中找出哪个阵列的数据与A最相似Php 求数组中的序列相似性,php,c,arrays,sorting,sequences,Php,C,Arrays,Sorting,Sequences,我有一个任务,其中我有三个数组a、B、C。所有数组都包含相同的数据。为了简单起见,让我们假设数据是数字1到5。数据将处于不同的混乱序列中。我想在B&C中找出哪个阵列的数据与A最相似 Eg: A = 1,2,3,4,5 B = 1,2,3,5,4 C = 4,1,2,3,5 在这种情况下,很容易从视觉上理解B与A更相似。但对于真正混乱的序列,它变得更复杂 Eg: A = 1,2,3,4,5 B = 5,3,1,4,2 C = 4,1,2,3,5 在这种情况下,我假设C更接近A。我认为这个假
Eg:
A = 1,2,3,4,5
B = 1,2,3,5,4
C = 4,1,2,3,5
在这种情况下,很容易从视觉上理解B与A更相似。但对于真正混乱的序列,它变得更复杂
Eg:
A = 1,2,3,4,5
B = 5,3,1,4,2
C = 4,1,2,3,5
在这种情况下,我假设C更接近A。我认为这个假设可以量化为:两个数组中有多少个元素具有相同的序列?在上面的示例中,[1,2,3]的子序列在两个数组中是相同的。第二个问题是相似子序列之间的偏移量差异是什么?在本例中,它是1,因为子序列从A的索引0和C的索引1开始
所以匹配序列中元素的数量和它们的偏移量是我想使用的。我计划给这两个实体添加一个权重(匹配序列中元素的数量,以及它们出现时的差异)
这有意义吗?我只需要一个粗略的相似性近似值,结果不需要精确。有没有解决这个问题的正式数学或数据结构模型
顺便说一句,我需要用PHP实现这个项目。它是否有任何内置函数,如用于字符串差异的levenstein模型
欢迎提出任何建议 我想你可以想出自己的算法(例如,生成所有后缀,然后搜索它们,然后定义评分过程),或者你可以使用像
用于局部对齐或全局对齐。这些算法的优点是它们被很好地理解,并为您提供所有可能的对齐方式(并且您可以根据您的情况选择最佳的)
以A为参考,您可以尝试找出每个元素相对于其位置的位移情况。总位移最小的那个应该是你的答案。那有用吗?谢谢你提供的信息!太棒了!我想这正是我想要的。