Python 标记重复项时忽略表中的空值
我一直在尝试使用下面的代码突出显示df中的重复值Python 标记重复项时忽略表中的空值,python,pandas,Python,Pandas,我一直在尝试使用下面的代码突出显示df中的重复值 ncns['D-Account'] = ncns.duplicated('Account Number') 虽然它正确地标记了副本,但它也将空白值标记为重复值。 请提供一些建议,以便忽略空白值 如果空白值为缺失值,则通过和对按位和的测试非误码值进行链掩码,并使用: 如果空白为空字符串,则通过以下方式比较非': 非常圆滑的回答 ncns['D-Account'] = ncns.duplicated('Account Number') &
ncns['D-Account'] = ncns.duplicated('Account Number')
虽然它正确地标记了副本,但它也将空白值标记为重复值。
请提供一些建议,以便忽略空白值 如果空白值为缺失值,则通过
和对按位和的测试非误码值进行链掩码,并使用:
如果空白为空字符串,则通过以下方式比较非'
:
非常圆滑的回答
ncns['D-Account'] = ncns.duplicated('Account Number') & ncns['Account Number'].notna()
ncns['D-Account'] = ncns.duplicated('Account Number') & ncns['Account Number'].ne('')