使用python识别单列中的重复记录,并在同一列中使用大容量

使用python识别单列中的重复记录,并在同一列中使用大容量,python,database,duplicates,Python,Database,Duplicates,我们在单个列中有大量数据,需要使用python识别重复项/可能的重复项 拉斯维加斯大道S 拉斯维加斯大道3745号 拉斯维加斯大道南3745号,拉斯维加斯大道 拉斯维加斯马球塔的雨树-拉斯维加斯 雨树旁的马球塔 钻石度假村马球塔酒店 拉斯维加斯波罗塔钻石度假村 我需要在我的数据库中识别像上面这样的实例。任何人都可以在python上提供帮助,提前谢谢。你可以用“,”来分割字符串,然后用夹板分割后输出的每个元素来搜索表格,如下所示: SELECT @variable = top(1), colu

我们在单个列中有大量数据,需要使用python识别重复项/可能的重复项

拉斯维加斯大道S

拉斯维加斯大道3745号

拉斯维加斯大道南3745号,拉斯维加斯大道


拉斯维加斯马球塔的雨树-拉斯维加斯

雨树旁的马球塔


钻石度假村马球塔酒店

拉斯维加斯波罗塔钻石度假村


我需要在我的数据库中识别像上面这样的实例。任何人都可以在python上提供帮助,提前谢谢。

你可以用“,”来分割字符串,然后用夹板分割后输出的每个元素来搜索表格,如下所示:

SELECT @variable = top(1), columnname from yourtable

SELECT * from youtable WHERE Split(@variable) LIKE '%"+columname+"%'
  • 您需要使用逗号或任何其他分隔符来拆分函数
  • 您必须对表中的每个元素进行迭代,在我的示例中,我只使用了第一个元素(顶部(1))

  • 谢谢你的回复,但我在寻找更有效的,因为我有大量的数据量。