Python 如果dataframe中包含逗号分隔的字符串条目,请更改为唯一的逗号分隔条目
我有一个熊猫数据框:Python 如果dataframe中包含逗号分隔的字符串条目,请更改为唯一的逗号分隔条目,python,pandas,pandas-groupby,Python,Pandas,Pandas Groupby,我有一个熊猫数据框: import pandas as pd data = [["a,a,a", "b,b", "c,c,c"], ["d,d","e","fd"],["g,h,i", "g", "fg,h,a"]] df = pd.DataFrame(data, columns = ["ColA","ColB","ColC"]) df ColA ColB ColC 0 a,a,a b,b c,c,c 1 d,d e fd 2
import pandas as pd
data = [["a,a,a", "b,b", "c,c,c"], ["d,d","e","fd"],["g,h,i", "g", "fg,h,a"]]
df = pd.DataFrame(data, columns = ["ColA","ColB","ColC"])
df
ColA ColB ColC
0 a,a,a b,b c,c,c
1 d,d e fd
2 g,h,i g fg,h,a
我想将此表的格式改为:
colA colB colC
0 a b c
1 d e fd
2 g,h,i g fg,h,a
因此,字符串按逗号分隔的值拆分每个条目后,每个条目都是唯一的
df.applymap(lambda elements: ','.join(set(elements.split(','))))
applymap()
将函数应用于数据帧的所有元素(单元格)。这里的lambda函数首先按,
拆分数据,然后创建一个所有元素的集合,并使用.join()
方法将它们连接回来。非常好地使用了applymap