Python 如何从Pandas中的一列A中删除另一列B中存在的公共元素?
如何删除一列中的常见内容(str、int、float),而我在另一列中也可以找到这些内容 假设我在数据帧中有:Python 如何从Pandas中的一列A中删除另一列B中存在的公共元素?,python,pandas,Python,Pandas,如何删除一列中的常见内容(str、int、float),而我在另一列中也可以找到这些内容 假设我在数据帧中有: colA colBB eat a nice icecream icecream I love to walk a lot walk , to the city Paris is super
colA colBB
eat a nice icecream icecream
I love to walk a lot walk , to
the city Paris is super Paris, super
.
.
.
我希望得到以下结果:
colA colBB
eat a nice icecream
I love a lot walk , to
the city is Paris, super
.
.
.
这适用于大熊猫Df中的每一行
我确实降低了文本并标记了句子,但之后我的应用程序被阻止了
谢谢试试这个
生成df的代码:
df=pd.DataFrame({
“可乐”:[“吃一个美味的冰淇淋”,“我很喜欢散步”,“巴黎是个超级城市”],
“colB”:[“冰淇淋”,“步行,去”,“巴黎,超级”]]
获取预期输出的代码:
df.apply(lambda x:''.join([y.strip()表示x[0]中的y)。如果y.strip()不在x[1]中,则拆分('')。拆分(''),轴=1)
尝试类似于df['ColA']=df.apply(lambda row:[x代表x在row['ColA']中,如果x不在row['colBB'],axis=1)
(假设ColA中的项目已经是字符串列表)同样,您可以通过删除字符串中的第一个标点来修改此设置
colA colB
0 eat a nice icecream icecream
1 I love to walk a lot walk , to
2 the city Paris is super Paris, super