Python 从两个数据帧中提取一个数据帧,这两个数据帧匹配一列的相同值?
我有两个不同长度的数据帧。我想提取出两个数据帧中“key1”的值相同的数据Python 从两个数据帧中提取一个数据帧,这两个数据帧匹配一列的相同值?,python,pandas,Python,Pandas,我有两个不同长度的数据帧。我想提取出两个数据帧中“key1”的值相同的数据 In [6]: data1['key1'][5:10] Out[6]: 5 3701061.280649 6 3702854.401078 7 3706447.681452 8 3710048.323744 9 3713648.507167 Name: key1, dtype: float64 In [7]: data2['key1'][10:15] Out[7]: 10 373
In [6]: data1['key1'][5:10]
Out[6]:
5 3701061.280649
6 3702854.401078
7 3706447.681452
8 3710048.323744
9 3713648.507167
Name: key1, dtype: float64
In [7]: data2['key1'][10:15]
Out[7]:
10 3735249.951436
11 3738850.242555
12 3742450.472855
13 3746051.017456
14 3749651.185752
Name: key1, dtype: float64
我基本上希望从每个data1和data2得到两个数据帧,这样我就可以为“key2”(y轴)和“key1”(x轴)绘制出差异
如何实现这一点?您可以使用
isin
,这将过滤掉其他df中列值中的列值,然后以另一种方式重复:
In [4]:
df = pd.DataFrame({'a':arange(10), 'b':randn(10)})
df1 = pd.DataFrame({'a':arange(2,12), 'b':randn(10)})
print(df)
print(df1)
a b
0 0 -0.255545
1 1 -1.550302
2 2 -0.825056
3 3 1.475839
4 4 0.059035
5 5 2.295766
6 6 1.604147
7 7 -1.877267
8 8 -0.462598
9 9 -1.347194
a b
0 2 -1.462567
1 3 -0.277680
2 4 -0.461539
3 5 1.094466
4 6 -1.086069
5 7 0.249207
6 8 2.613443
7 9 1.036450
8 10 -0.562149
9 11 -0.679488
In [6]:
df[df.a.isin(df1.a)]
Out[6]:
a b
2 2 -0.825056
3 3 1.475839
4 4 0.059035
5 5 2.295766
6 6 1.604147
7 7 -1.877267
8 8 -0.462598
9 9 -1.347194
In [7]:
df1[df1.a.isin(df.a)]
Out[7]:
a b
0 2 -1.462567
1 3 -0.277680
2 4 -0.461539
3 5 1.094466
4 6 -1.086069
5 7 0.249207
6 8 2.613443
7 9 1.036450
其他列具有类似的命名“键”,因此我实际上希望维护两个独立的数据帧,以便绘制差异。因此,您需要类似于
data1[data.key1==data2.key1]
的内容,反之亦然?是的,没错,但我的len(data1)和len(data2)不一样。确定更新了我的答案,您可以使用isin
过滤掉df行,我已经将虚拟数据添加到illustrateThanks!工作起来很有魅力。