Python 当个人有多个地址时,如何制作重复数据消除地名录?
根据DataMake重复数据消除,地名索引似乎需要干净、清晰的个人级别数据Python 当个人有多个地址时,如何制作重复数据消除地名录?,python,duplicates,python-dedupe,Python,Duplicates,Python Dedupe,根据DataMake重复数据消除,地名索引似乎需要干净、清晰的个人级别数据 如果此人多次搬家、换工作等,你会怎么做?每个人都要包含多个观察结果,并智能地填写空格?如果你知道一个人有多个地址,我会创建这样一个“地名录” Address Name Person_ID 123 Main St. John Doe 1 100 High St. John Doe 1 1600 Pennsylvania Ave John
如果此人多次搬家、换工作等,你会怎么做?每个人都要包含多个观察结果,并智能地填写空格?如果你知道一个人有多个地址,我会创建这样一个“地名录”
Address Name Person_ID
123 Main St. John Doe 1
100 High St. John Doe 1
1600 Pennsylvania Ave John Doe 1
当您与此匹配时,您将有第二个解析步骤,在该步骤中,您通过“地名录”合并Person\u ID,您的意思是“词典”?不,地名录是已经清理和重复数据的数据,混乱的数据可以与之链接。