Python 当个人有多个地址时,如何制作重复数据消除地名录?

Python 当个人有多个地址时,如何制作重复数据消除地名录?,python,duplicates,python-dedupe,Python,Duplicates,Python Dedupe,根据DataMake重复数据消除,地名索引似乎需要干净、清晰的个人级别数据 如果此人多次搬家、换工作等,你会怎么做?每个人都要包含多个观察结果,并智能地填写空格?如果你知道一个人有多个地址,我会创建这样一个“地名录” Address Name Person_ID 123 Main St. John Doe 1 100 High St. John Doe 1 1600 Pennsylvania Ave John

根据DataMake重复数据消除,地名索引似乎需要干净、清晰的个人级别数据


如果此人多次搬家、换工作等,你会怎么做?每个人都要包含多个观察结果,并智能地填写空格?

如果你知道一个人有多个地址,我会创建这样一个“地名录”

Address                Name      Person_ID
123 Main St.           John Doe  1
100 High St.           John Doe  1
1600 Pennsylvania Ave  John Doe  1

当您与此匹配时,您将有第二个解析步骤,在该步骤中,您通过“地名录”合并Person\u ID

,您的意思是“词典”?不,地名录是已经清理和重复数据的数据,混乱的数据可以与之链接。