Python 合并具有相同索引的数据和删除不具有相同索引的数据
数据帧1:Python 合并具有相同索引的数据和删除不具有相同索引的数据,python,pandas,merge,Python,Pandas,Merge,数据帧1: index col1 03-05-2018 12:00:00 3 03-05-2018 13:00:00 4 03-05-2018 14:00:00 3 03-05-2018 15:00:00 3 ....... .. 数据框架2 index col2 03-05-
index col1
03-05-2018 12:00:00 3
03-05-2018 13:00:00 4
03-05-2018 14:00:00 3
03-05-2018 15:00:00 3
....... ..
数据框架2
index col2
03-05-2018 12:00:00 1
03-05-2018 13:00:00 3
03-05-2018 13:30:00 4
03-05-2018 14:30:00 2
03-05-2018 15:00:00 3
..... ..
我想合并这些数据帧并删除索引不匹配的值:
数据帧3:
index col1 col2
03-05-2018 12:00:00 3 1
03-05-2018 13:00:00 4 3
03-05-2018 15:00:00 3 3
......... .. ..
有没有像pd.merge这样的函数来实现这一点?(这是一个数据帧,索引是DateTime对象)
谢谢
编辑:我使用了pd.merge(dataFrame1,dataFrame2,how='internal',on='index',left_index=True,right_index=True),我得到了错误“无法将类型'Timestamp'与类型'int'进行比较”。我确信这两个索引都是时间戳我只需执行一个
内部
。内部
连接基本上是在上的值匹配时执行连接,否则is会删除它(出于本问题的目的删除它)
输出:
index col1 col2
0 A 3 1
1 C 4 3
2 G 3 3
您的数据帧是pandas、pyspark还是其他什么?pd.merge(df_1,df_2,how='inner')
我尝试了您的方法,它确实有效,但是我得到了更多的值(预期值约为55000,但我得到了523916715)否决票是否可以提供关于为什么这没有帮助/有用的见解?这是一个相当有争议的话题,因此对于那些明显重复或总体质量较低的问题的答案是否应该被否决。当然,他们不应该被否决,但人们可以为所欲为。请参阅:。我通常会将这样的一行回答作为评论发布,以避免出现这个问题”\_(ツ)_/''哦,好吧,我想至少我们现在处理的是熊猫数据帧。谢谢你的回答。谢谢你的评论,但现在我得到了一个错误:“无法比较类型‘Timestamp’和类型‘int’”,但我的两个索引都是时间戳…你能编辑你的问题,以匹配你在这里评论的信息吗?
index col1 col2
0 A 3 1
1 C 4 3
2 G 3 3