Python 使用一系列数组的内容扩展dataframe
我有一个pandas数据帧Python 使用一系列数组的内容扩展dataframe,python,pandas,numpy,Python,Pandas,Numpy,我有一个pandas数据帧bb和一系列pandas numpy数组,aa,行数相同 >>> bb A B 0 0.049315 0.362793 1 0.853909 0.590942 2 0.854748 0.247608 3 0.084967 0.293541 4 0.053430 0.922705 5 0.571357 0.404485 6 0.363018 0.070912 7 0.784807 0.6
bb
和一系列pandas numpy数组,aa
,行数相同
>>> bb
A B
0 0.049315 0.362793
1 0.853909 0.590942
2 0.854748 0.247608
3 0.084967 0.293541
4 0.053430 0.922705
5 0.571357 0.404485
6 0.363018 0.070912
7 0.784807 0.641253
>>> aa
0 [0.4648, 0.8575, 0.5008]
1 [0.3056, 0.2737, 0.0137]
2 [0.8038, 0.0858, 0.345]
3 [0.4135, 0.7571, 0.3686]
4 [0.7482, 0.8063, 0.7976]
5 [0.9359, 0.5873, 0.2319]
6 [0.8838, 0.7109, 0.712]
7 [0.6493, 0.1516, 0.5401]
dtype: object
我需要在包含aa
元素的数据框bb
中添加三列。预期结果如下:
A B v0 v1 v2
0 0.049315 0.362793 0.4648 0.8575 0.5008
1 0.853909 0.590942 0.3056 0.2737 0.0137
2 0.854748 0.247608 0.8038 0.0858 0.3450
3 0.084967 0.293541 0.4135 0.7571 0.3686
4 0.053430 0.922705 0.7482 0.8063 0.7976
5 0.571357 0.404485 0.9359 0.5873 0.2319
6 0.363018 0.070912 0.8838 0.7109 0.7120
7 0.784807 0.641253 0.6493 0.1516 0.5401
我可以通过以下代码实现这一点:
rows, cols = 8, 3
ixs = ["v" + str(i) for i in range(cols)]
bb[ixs] = pd.DataFrame(np.zeros((8, 3)))
for i in range(rows):
for j in range(cols):
bb[ixs[j]][i] = aa[i][j]
然而,在我拥有的较大数据帧上,这是非常慢的。在pandas/numpy中,有没有一种更惯用的方法可以更快地实现这一点?通过构造函数创建
DataFrame
,通过更改列名称并通过或添加到原始列:
或:
这似乎更快和紧凑的一个@迪瓦卡-非常感谢!
df = bb.join(pd.DataFrame(aa.values.tolist()).add_prefix('v'))
df = pd.concat([bb, pd.DataFrame(aa.values.tolist()).add_prefix('v')], axis=1)