Python 熊猫保留值的原始位置
我正在使用以下方法从数据帧中删除行中的重复数据:Python 熊猫保留值的原始位置,python,pandas,dataframe,duplicates,Python,Pandas,Dataframe,Duplicates,我正在使用以下方法从数据帧中删除行中的重复数据: df = pd.DataFrame(list(map(pd.unique, df.values))) 然而,这会改变我的数据与原始列名的位置,在读取数据时,由于数据被移动,我读取错误。有一种方法可以代替删除数据,将一个值放在其中,例如“none”,以便于过滤 数据帧: T1583.005 T1583.006 Resource Development Resource Development T1583.001 T1583
df = pd.DataFrame(list(map(pd.unique, df.values)))
然而,这会改变我的数据与原始列名的位置,在读取数据时,由于数据被移动,我读取错误。有一种方法可以代替删除数据,将一个值放在其中,例如“none”,以便于过滤
数据帧:
T1583.005 T1583.006 Resource Development Resource Development T1583.001 T1583.002
T1584.005 T1584.006 Resource Development Resource Development T1584.005 T1584.002
目前:
T1583.005 T1583.006 Resource Development T1583.001 T1583.002
T1584.005 T1584.006 Resource Development T1584.002
预期:
T1583.005 T1583.006 Resource Development None T1583.001 T1583.002
T1584.005 T1584.006 Resource Development None None T1584.002
这样,数据将保持在原始位置,并且更易于读取。这里有一种方法,通过屏蔽每行重复的
值:
df.mask([df.loc[idx].duplicated().tolist() for idx in df.index])
您能否将原始数据框作为CSV或Python字典提供以进行复制粘贴?此外,副本是否会出现在任意随机列中,或者源列和目标列是否已修复?
0 1 2 3 4 5
0 T1583.005 T1583.006 Resource Development NaN T1583.001 T1583.002
1 T1584.005 T1584.006 Resource Development NaN NaN T1584.002