Python 查找三个单独的数据帧重叠的位置并创建一个新的数据帧

Python 查找三个单独的数据帧重叠的位置并创建一个新的数据帧,python,pandas,dataframe,pandas-groupby,data-science,Python,Pandas,Dataframe,Pandas Groupby,Data Science,我有三个独立的数据帧。每个数据帧都有相同的列-['Email','Rating']。电子邮件列的所有三个数据帧中都有重复的行值。我试图找到那些出现在所有三个数据框中的电子邮件,然后根据这些行创建一个新的数据框。到目前为止,我已经将所有三个数据帧保存到一个类似于dfs=[df1,df2,df3]的列表中,然后使用df=pd.concatdfs将它们连接在一起。我尝试从这里使用groupby,但没有用。非常感谢您提供的任何帮助您可以尝试使用熊猫的.isin,例如: df[df['Email'].is

我有三个独立的数据帧。每个数据帧都有相同的列-['Email','Rating']。电子邮件列的所有三个数据帧中都有重复的行值。我试图找到那些出现在所有三个数据框中的电子邮件,然后根据这些行创建一个新的数据框。到目前为止,我已经将所有三个数据帧保存到一个类似于dfs=[df1,df2,df3]的列表中,然后使用df=pd.concatdfs将它们连接在一起。我尝试从这里使用groupby,但没有用。非常感谢您提供的任何帮助

您可以尝试使用熊猫的.isin,例如:

df[df['Email'].isin(df2['Email'])]
这将检索两个数据帧中列email的值相同的行条目

另一个想法是尝试内部合并


祝你好运,下次发代码。

你想合并。与sql中的join类似,您可以进行内部合并,并将电子邮件视为外键。以下是文件: 它看起来像这样:

in_common = pd.merge(df1, df2, on=['Email'], how='inner')


你能给我们看一个代码吗?它是一个2列,每个数据帧大约50行的数据帧。数据帧是使用pandas.read_csv创建的。我不能显示实际的数据帧,因为它包含实际的人的电子邮件。