Python 由于特殊符号,无法合并数据帧

Python 由于特殊符号,无法合并数据帧,python,pandas,data-science,Python,Pandas,Data Science,我有两个这样的数据帧: 在下面的数据框中,有297行和5列。在这里,EAN和Class的许多值都是空的 Item name category EAN Class Manufacturer Soya Chunks Vegetable 12 XY Priate ltd Amul Butter Dairy AB Private ltd 在第二个数据帧中,只有156行和2列 Item name

我有两个这样的数据帧:

在下面的数据框中,有297行和5列。在这里,EAN和Class的许多值都是空的

Item name     category     EAN    Class   Manufacturer
Soya Chunks   Vegetable     12            XY Priate ltd
Amul Butter   Dairy                       AB Private ltd
在第二个数据帧中,只有156行和2列

Item name     category     
Rich Refined    Oil       
Soya-chunks    Vegetables
我想合并这两个数据帧,这样如果dataframe1中有某个项不在 dataframe2,则它将包含在合并的dataframe中,并且如果dataframe2中有某个项目不在 dataframe1,则它也将包含在合并的dataframe中。如果来自datafraeme2的某些项包含在合并的dataframe中,则其EAN和类可以保留空白

因此,我只是尝试了pd.merge(df1,df2,on='item name'),但结果完全不正确

它无法识别特殊符号,如“大豆块”和“大豆块”。也因此
dataframe1中缺少一些列值,这也会在合并dataframes时产生问题。

您已经回答了自己的问题。如果您尚未对数据执行DQ/标准化,您不能也不应该期望数据操作神奇地解决基本DQ问题您已经回答了自己的问题。如果您尚未对数据执行DQ/标准化,您不能也不应该期望对数据的操作神奇地解决基本DQ问题