Algorithm 从大型数据集中查找相似数据模式的有效方法
我在数据库中有数百万条记录的大型数据集,简化示例如下: 6,1,3,5,2,3,4,5,6,7,9,3,1,3,5,4,6,3,4,6,4,5,7,4,5,0,8,... 百万唱片 这里每个数字代表一行的键值 我需要找到所有出现的1,3,5。直接的方法是迭代整个数据集,并在每次迭代中检查三个连续的行Algorithm 从大型数据集中查找相似数据模式的有效方法,algorithm,large-data,Algorithm,Large Data,我在数据库中有数百万条记录的大型数据集,简化示例如下: 6,1,3,5,2,3,4,5,6,7,9,3,1,3,5,4,6,3,4,6,4,5,7,4,5,0,8,... 百万唱片 这里每个数字代表一行的键值 我需要找到所有出现的1,3,5。直接的方法是迭代整个数据集,并在每次迭代中检查三个连续的行 有没有更有效的算法来实现这一点?如果只需要找到3个元素的子序列,最有效的方法是迭代整个数据 很容易证明:您必须检查整个阵列的所有插入算法 在这个算法中,最多执行3次。这是您可以获得的最佳复杂性。对于
有没有更有效的算法来实现这一点?如果只需要找到3个元素的子序列,最有效的方法是迭代整个数据 很容易证明:您必须检查整个阵列的所有插入算法
在这个算法中,最多执行3次。这是您可以获得的最佳复杂性。对于较大的搜索字符串,KMP可能会提高搜索性能。我不确定这是否适用于三个要素。如果多次搜索相同或类似的数据库,则可以保存以前搜索的结果。在未排序的集合中查找某个对象的所有匹配项时,ON是您所能得到的最好结果。每次迭代意味着什么?数据库中应该只有一次迭代。