Python 查找三个单独的数据帧重叠的位置并创建一个新的数据帧_Python_Pandas_Dataframe_Pandas Groupby_Data Science

Python 查找三个单独的数据帧重叠的位置并创建一个新的数据帧

python pandas dataframe

Python 查找三个单独的数据帧重叠的位置并创建一个新的数据帧,python,pandas,dataframe,pandas-groupby,data-science,Python,Pandas,Dataframe,Pandas Groupby,Data Science,我有三个独立的数据帧。每个数据帧都有相同的列-['Email'，'Rating']。电子邮件列的所有三个数据帧中都有重复的行值。我试图找到那些出现在所有三个数据框中的电子邮件，然后根据这些行创建一个新的数据框。到目前为止，我已经将所有三个数据帧保存到一个类似于dfs=[df1，df2，df3]的列表中，然后使用df=pd.concatdfs将它们连接在一起。我尝试从这里使用groupby，但没有用。非常感谢您提供的任何帮助您可以尝试使用熊猫的.isin，例如： df[df['Email'].is

我有三个独立的数据帧。每个数据帧都有相同的列-['Email'，'Rating']。电子邮件列的所有三个数据帧中都有重复的行值。我试图找到那些出现在所有三个数据框中的电子邮件，然后根据这些行创建一个新的数据框。到目前为止，我已经将所有三个数据帧保存到一个类似于dfs=[df1，df2，df3]的列表中，然后使用df=pd.concatdfs将它们连接在一起。我尝试从这里使用groupby，但没有用。非常感谢您提供的任何帮助

您可以尝试使用熊猫的.isin，例如：

df[df['Email'].isin(df2['Email'])]

这将检索两个数据帧中列email的值相同的行条目

另一个想法是尝试内部合并

祝你好运，下次发代码。

你想合并。与sql中的join类似，您可以进行内部合并，并将电子邮件视为外键。以下是文件：它看起来像这样：

in_common = pd.merge(df1, df2, on=['Email'], how='inner')

你能给我们看一个代码吗？它是一个2列，每个数据帧大约50行的数据帧。数据帧是使用pandas.read_csv创建的。我不能显示实际的数据帧，因为它包含实际的人的电子邮件。