Arrays Python:在所有单元格中选择数组中的第一个元素
我试图做的是选择每个单元格的第一个元素,而不管列数或行数(它们可能会根据用户定义的条件而改变),并从数据中创建一个新的数据帧。我的实际数据结构与下面列出的类似Arrays Python:在所有单元格中选择数组中的第一个元素,arrays,python-3.x,pandas,dataframe,Arrays,Python 3.x,Pandas,Dataframe,我试图做的是选择每个单元格的第一个元素,而不管列数或行数(它们可能会根据用户定义的条件而改变),并从数据中创建一个新的数据帧。我的实际数据结构与下面列出的类似 0 1 2 0 [1, 2] [2, 3] [3, 6] 1 [4, 2] [1, 4] [4, 6] 2 [1, 2] [2, 3] [3, 6] 3 [4, 2] [1, 4] [4, 6] 我希望新的数据帧看起来像: 0 1 2 0 1
0 1 2
0 [1, 2] [2, 3] [3, 6]
1 [4, 2] [1, 4] [4, 6]
2 [1, 2] [2, 3] [3, 6]
3 [4, 2] [1, 4] [4, 6]
我希望新的数据帧看起来像:
0 1 2
0 1 2 3
1 4 1 4
2 1 2 3
3 4 1 4
下面的代码生成了一个类似于我的数据集,并尝试在代码中执行我想执行的操作,但没有成功(d),并且成功地模仿了我在类似问题中看到的操作(c;但是,只有一列)。类似但不同问题的链接如下:
您可以使用
apply
和选择列表的第一个值使用:
另一个解决方案包括和:
我将使用
applymap
,它将相同的函数应用于数据帧中的每个单元格
df.applymap(lambda x: x[0])
0 1 2
0 1 2 3
1 4 1 4
2 1 2 3
3 4 1 4
我非常喜欢
stack
+unstack
然而,@jezrael已经记下了答案。。。所以+1来自我 也就是说,这里有一个更快的方法。通过切片一个numpy数组
pd.DataFrame(
np.array(zz.values.tolist())[:, :, 0],
zz.index, zz.columns
)
0 1 2
0 1 2 3
1 4 1 4
2 1 2 3
3 4 1 4
定时
谢谢!!!我将尝试这两种方法,看看哪种方法运行得最快。感谢您提供的计时信息和新方法..+1
print (zz.stack().str[0].unstack())
0 1 2
0 1 2 3
1 4 1 4
2 1 2 3
3 4 1 4
df.applymap(lambda x: x[0])
0 1 2
0 1 2 3
1 4 1 4
2 1 2 3
3 4 1 4
pd.DataFrame(
np.array(zz.values.tolist())[:, :, 0],
zz.index, zz.columns
)
0 1 2
0 1 2 3
1 4 1 4
2 1 2 3
3 4 1 4