Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/297.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 与熊猫这样的合并可能吗_Python_Csv_Pandas_Merge - Fatal编程技术网

Python 与熊猫这样的合并可能吗

Python 与熊猫这样的合并可能吗,python,csv,pandas,merge,Python,Csv,Pandas,Merge,这样的合并有可能与熊猫合并吗?成分在一列中的另一个csv文件中,杂货店也在一列中的另一个csv文件中,我想将这些列合并在一起,我尝试了不同的方法,效果很好,但需求一夜之间不断变化。有没有办法只用熊猫来合并这些数据 我尝试了两种不同的方法 第一个是这个 检查字符串是否包含忽略大写字母的IngName 但是这得到了子字符串,文件变大了。我尝试的第二种方法是拆分成分,并将结果放入列中,然后基于列合并到其他文件中 df_ing1 = pd.DataFrame(ingredient_tokenized)

这样的合并有可能与熊猫合并吗?成分在一列中的另一个csv文件中,杂货店也在一列中的另一个csv文件中,我想将这些列合并在一起,我尝试了不同的方法,效果很好,但需求一夜之间不断变化。有没有办法只用熊猫来合并这些数据

我尝试了两种不同的方法 第一个是这个

检查字符串是否包含忽略大写字母的IngName 但是这得到了子字符串,文件变大了。我尝试的第二种方法是拆分成分,并将结果放入列中,然后基于列合并到其他文件中

df_ing1 = pd.DataFrame(ingredient_tokenized)
df_ing1 = df_ing1.add_suffix('_IngredientName')
result_ingredient = pd.concat([df_ingredient, df_ing1], axis=1)
FinalDF = pd.merge(result_ingredient, result_grocery, how='inner', left_on = ['IngredientName'], right_on = ['Sub_Seg_Sub_Cat'])
我也尝试过类似的方法,但它当然是空的,因为值不一样

pd.merge(df_ingredient, df_grocery, left_on='IngredientName', right_on='Sub_Seg_Sub_Cat', how='inner')
效率也不是很高。我对python真的很陌生,所以任何帮助都将不胜感激

基本上,我想要这样的东西

复制
有。如果你发布了一些你尝试过的代码,以及结果与你想要的(或你得到的错误)有什么不同,这里会有人提供答案。嘿@MaxPower我刚刚做了,谢谢你Hi Abifoluwa,这是一个很大的改进,但仍然不是一个可复制的示例。请添加一些示例数据和所需结果。对于您的问题,这意味着创建两个数据帧,每个数据帧大约有5行,发布它们以及您希望合并结果的外观。hey@MaxPower我更新了这个问题。谢谢你想要什么结果?当我输入df_C时,它会给我一个错误。所以我还是看不出你想要的结果是什么样子
pd.merge(df_ingredient, df_grocery, left_on='IngredientName', right_on='Sub_Seg_Sub_Cat', how='inner')
df_A = pd.DataFrame.from_items([('A', ['Peanut Butter', 'Enhanced Water', 'Teriyaki Sauce'])])

df_B = pd.DataFrame.from_items([('B', ['Butter', 'Water', 'Sauce', 'Peanut Butter', 'Peanut Butter Fruit'])])

df_C = pd.DataFrame.from_items([('A', ['Peanut Butter', 'Enhanced Water', 'Teriyaki Sauce', 'Peanut Butter', 'Nan']), ('B', ['Butter', 'Water', 'Sauce', 'Peanut Butter', 'Peanut Butter Fruit'])])