Python pandas的Merge函数生成的行数大于这两个数据帧行的总和
我有一个dataframe、dt1和dt2,公共列是名为id的列。 我想要这两个数据帧的内部连接。 我正在使用以下代码: dt2中的行数为4347,dt1中的行数为4480Python pandas的Merge函数生成的行数大于这两个数据帧行的总和,python,pandas,Python,Pandas,我有一个dataframe、dt1和dt2,公共列是名为id的列。 我想要这两个数据帧的内部连接。 我正在使用以下代码: dt2中的行数为4347,dt1中的行数为4480 merger=pd.merge(dt2,dt1,on=['id'],how='inner') 合并中的行数为10349。 我不明白的问题是什么您在一个或两个数据帧中有重复的“id”,创建了笛卡尔连接。我在每个数据帧中有一个id列。如果你是这个意思one@Sht他表示id值不是唯一的,列中存在重复项。在任一数据帧中,每个id
merger=pd.merge(dt2,dt1,on=['id'],how='inner')
合并中的行数为10349。
我不明白的问题是什么您在一个或两个数据帧中有重复的“id”,创建了笛卡尔连接。我在每个数据帧中有一个id列。如果你是这个意思one@Sht他表示
id
值不是唯一的,列中存在重复项。在任一数据帧中,每个id
只能有一行,否则您将在输出中获得比开始时更多的行。谢谢,它可以工作,存在重复值