Python apply与operator.itemgetter v.s.applymap operator.itemgetter的行为不一致

Python apply与operator.itemgetter v.s.applymap operator.itemgetter的行为不一致,python,pandas,Python,Pandas,在实际情况下,这可能不是排列数据的最佳方式,但它提供了一个很好的示例: In [16]: import operator In [17]: DF=pd.DataFrame({'Val1':[[2013, 37722.322],[1998, 32323.232]], 'Val2':[[2013, 37722.322],[1998, 32323.232]]}) In [18]: print DF Val1

在实际情况下,这可能不是排列数据的最佳方式,但它提供了一个很好的示例:

In [16]:
import operator
In [17]:
DF=pd.DataFrame({'Val1':[[2013, 37722.322],[1998, 32323.232]],
                 'Val2':[[2013, 37722.322],[1998, 32323.232]]})
In [18]:
print DF
                Val1               Val2
0  [2013, 37722.322]  [2013, 37722.322]
1  [1998, 32323.232]  [1998, 32323.232]

[2 rows x 2 columns]
apply
给出错误的结果

In [19]:
print DF.apply(operator.itemgetter(-1), axis=1)
   Val1       Val2
0  2013  37722.322
1  1998  32323.232

[2 rows x 2 columns]
但是
applymap
给出了正确的结果

In [20]:
print DF.applymap(operator.itemgetter(-1))
        Val1       Val2
0  37722.322  37722.322
1  32323.232  32323.232

[2 rows x 2 columns]

为什么会发生这种情况?

如果使用

df = pd.DataFrame({'Val1':[[1, 2],[3, 4]],
                 'Val2':[[5, 6],[7, 8]]})

     Val1    Val2
0  [1, 2]  [5, 6]
1  [3, 4]  [7, 8]
df.apply(operator.itemgetter(-1),axis=1)
对每行调用
operator.itemgetter(-1)

例如,在第一行,
operator.itemgetter(-1)
返回最后一项,即
[5,6]
。 由于该值是可编辑的,因此其值随后被分配到两列
Val1
Val2
。所以结果是

In [149]: df.apply(operator.itemgetter(-1), axis=1)
Out[149]: 
   Val1  Val2
0     5     6
1     7     8
相反,
applymap
分别对数据帧中的每个单元格进行操作,因此
operator.itemgetter(-1)
返回每个单元格中的最后一项

In [150]: df.applymap(operator.itemgetter(-1))
Out[150]: 
   Val1  Val2
0     2     6
1     4     8

为了补充@unutbu和@jeff所说的内容,如果有3个列作为开头:

In [26]:

print DF
                Val1               Val2               Val3
0  [2013, 37722.322]  [2014, 37722.322]  [2015, 37722.322]
1  [1997, 32323.232]  [1998, 32323.232]  [1999, 32323.232]

[2 rows x 3 columns]
In [27]:

print DF.apply(operator.itemgetter(-1), axis=1)
0    [2015, 37722.322]
1    [1999, 32323.232]
dtype: object

结果列表(长度为2)不能强制为长度为3的系列,现在结果是一系列列表。

apply将被传递一整行,该行是一系列由2个元素组成的列表;最后一个列表返回并强制为一个系列。作为元素的嵌入式列表通常不是一个好主意。我同意,在现实生活中,它不是存储数据的好方法。特别有趣的是,第一个元素被分配到
Val1
。现在我明白了,谢谢!