Python 如何连接两个长度不同的单列数据帧,以便更新日期时间索引?
我有两个不同长度的单列数据帧,我希望使用类似于以下内容的方式逐列连接它们:Python 如何连接两个长度不同的单列数据帧,以便更新日期时间索引?,python,pandas,dataframe,concat,Python,Pandas,Dataframe,Concat,我有两个不同长度的单列数据帧,我希望使用类似于以下内容的方式逐列连接它们: df = pd.concat([df, df_add], axis = 1, join = 'outer') 我想更新df,这样它就有了来自df的第一列和它旁边来自df_add的列。并非所有日期时间索引都匹配(两个数据帧中的几行都已删除) 我的数据帧是: df: 并加上: col 2 TimeStamp 2012-0
df = pd.concat([df, df_add], axis = 1, join = 'outer')
我想更新df,这样它就有了来自df的第一列和它旁边来自df_add的列。并非所有日期时间索引都匹配(两个数据帧中的几行都已删除)
我的数据帧是:
df:
并加上:
col 2
TimeStamp
2012-09-20 00:00:00 -12.037120
2012-09-20 00:10:00 -12.575330
2012-09-20 00:20:00 -12.821350
2012-09-20 00:30:00 -11.959330
2012-09-20 00:40:00 -12.103370
...
2019-05-31 23:20:00 1876.394043
2019-05-31 23:30:00 1783.564941
2019-05-31 23:40:00 1554.718994
2019-05-31 23:50:00 1558.073975
2019-06-01 00:00:00 1597.640991
[343128 rows x 1 columns]
我想得到这样的结果,用NaN填充与索引不匹配的单元格
不幸的是,当我尝试上述代码行时,出现以下错误:
Shape of passed values is (952153, 2), indices imply (355645, 2)
我将非常感谢任何帮助!
问候 你在寻找——我想说的是,你没有尝试过
df_added = df.join(df_add, how='outer')
会给你想要的 我试过这个。不幸的是,它将整个数据帧弄乱,几乎使行数增加了一倍。它没有正确地放大时间戳索引的大小。我不确定为什么会出现这种情况-在您给出的示例中,您的时间戳索引看起来很好。很抱歉,我无法提供更多帮助。因此,此问题的问题是我没有检查此数据集中是否存在任何重复行
df.drop\u duplicates(keep='first',inplace=True)
在这里是个好主意。
df_added = df.join(df_add, how='outer')