Python 将多个数据帧合并为一个数据帧并填充缺失的信息

Python 将多个数据帧合并为一个数据帧并填充缺失的信息,python,pandas,dataframe,Python,Pandas,Dataframe,我有一个数据框,里面有一些项目的信息,比如状态、受让人、优先级等。。。我有一堆这样的数据框架,每一个都代表一年中不同周的项目 我想计算每个状态在每个数据帧中出现的次数。我可以使用df.groupby(“status”).size()to_frame()来实现这一点,但这会在单独的数据帧中一次获取一帧的信息 如何将这些数据帧组合在一起以获得一个大数据帧?(每一行看起来像:Date、Status、Count)此外,如果某个状态出现在其中一个子集中,而不是其他子集中,我需要将该状态添加到所有其他子集中

我有一个数据框,里面有一些项目的信息,比如状态、受让人、优先级等。。。我有一堆这样的数据框架,每一个都代表一年中不同周的项目

我想计算每个状态在每个数据帧中出现的次数。我可以使用
df.groupby(“status”).size()to_frame()
来实现这一点,但这会在单独的数据帧中一次获取一帧的信息


如何将这些数据帧组合在一起以获得一个大数据帧?(每一行看起来像:Date、Status、Count)此外,如果某个状态出现在其中一个子集中,而不是其他子集中,我需要将该状态添加到所有其他子集中,计数为0。这可能吗?我无法找到另一个答案或一组答案来解释这一点。

我不确定我是否完全理解了您想要做的事情,但要将两个框架df和df2结合起来,比如说,您可以使用

df2.set_index(pd.Series([i for i in range(len(df),len(df)+len(df2))]), inplace=True)
df_concat = pd.concat([df, df2])
然后获取组合数据帧的计数:

df_concat.groupby(df_concat.columns.tolist()).size().reset_index().rename(columns={0:'counts'})

考虑添加数据文件示例和预期输出。您可能需要查看问题的第一部分,我不确定在第一行中使用的是什么,StIX索引操作的要点是什么?我认为这很接近,但仍然存在一个问题,即并非所有日期都表示所有可能的列值。(例如:如果一个连接的数据帧的值为“Closed”,但另一个数据帧的值为“Closed”,则最终数据帧需要有一个日期行,该日期行的“Closed”计数为0状态。set_index操作只是为了确保索引列不会在连接中的第二个数据帧的0处重新启动。我是否正确地理解了所有数据帧都具有相同的列结构?我同意@Poojan的观点,如果您发布了一个输入加上所需输出的示例,这会有所帮助。