Python 由于特殊符号,无法合并数据帧
我有两个这样的数据帧: 在下面的数据框中,有297行和5列。在这里,EAN和Class的许多值都是空的Python 由于特殊符号,无法合并数据帧,python,pandas,data-science,Python,Pandas,Data Science,我有两个这样的数据帧: 在下面的数据框中,有297行和5列。在这里,EAN和Class的许多值都是空的 Item name category EAN Class Manufacturer Soya Chunks Vegetable 12 XY Priate ltd Amul Butter Dairy AB Private ltd 在第二个数据帧中,只有156行和2列 Item name
Item name category EAN Class Manufacturer
Soya Chunks Vegetable 12 XY Priate ltd
Amul Butter Dairy AB Private ltd
在第二个数据帧中,只有156行和2列
Item name category
Rich Refined Oil
Soya-chunks Vegetables
我想合并这两个数据帧,这样如果dataframe1中有某个项不在
dataframe2,则它将包含在合并的dataframe中,并且如果dataframe2中有某个项目不在
dataframe1,则它也将包含在合并的dataframe中。如果来自datafraeme2的某些项包含在合并的dataframe中,则其EAN和类可以保留空白
因此,我只是尝试了pd.merge(df1,df2,on='item name'),但结果完全不正确
它无法识别特殊符号,如“大豆块”和“大豆块”。也因此
dataframe1中缺少一些列值,这也会在合并dataframes时产生问题。您已经回答了自己的问题。如果您尚未对数据执行DQ/标准化,您不能也不应该期望数据操作神奇地解决基本DQ问题您已经回答了自己的问题。如果您尚未对数据执行DQ/标准化,您不能也不应该期望对数据的操作神奇地解决基本DQ问题