Python 合并2个数据帧可减少数据集长度

Python 合并2个数据帧可减少数据集长度,python,pandas,merge,dataframe,Python,Pandas,Merge,Dataframe,我想合并以下数据源:第一个和第二个 >>> len(first_df) 813 >>> len(second_df) 813 要合并它,我正在使用: third_df = pd.merge(first_df, second_df, left_index=True, right_index=True) 但第三个_df的大小不同: >>> len(third_df) 788 为什么第三个df的大小不一样?默认合并类型为“内部”,这意味着在

我想合并以下数据源:第一个和第二个

>>> len(first_df)
813

>>> len(second_df)
813
要合并它,我正在使用:

third_df = pd.merge(first_df, second_df, left_index=True, right_index=True)
但第三个_df的大小不同:

>>> len(third_df)
788

为什么第三个df的大小不一样?

默认合并类型为“内部”,这意味着在您的情况下,索引值存在于两个df中,如果您希望所有索引值的并集,则可以传递param How='outer',或左或右查看文档:您应该能够通过执行first_df.index==second_df.index来判断索引是否匹配,它可能会返回False,您必须决定如何处理不匹配的索引值