Python 如何使用数据帧中的两个参数,从应用lambda的结果中合成具有返回列的数据帧
我有一个包含3列a、b和c的数据框,还有一个接受3个参数的函数,例如一个小示例:Python 如何使用数据帧中的两个参数,从应用lambda的结果中合成具有返回列的数据帧,python,pandas,Python,Pandas,我有一个包含3列a、b和c的数据框,还有一个接受3个参数的函数,例如一个小示例: data_test = [[1,11,101],[2,12,102],[3,13,103],[4,14,104],[5,15,105],[6,16,106]] df_test = pd.DataFrame(data_test,columns=['a','b','c'],dtype=float) a b c 0 1.0 11.0 101.0 1 2.0
data_test = [[1,11,101],[2,12,102],[3,13,103],[4,14,104],[5,15,105],[6,16,106]]
df_test = pd.DataFrame(data_test,columns=['a','b','c'],dtype=float)
a b c
0 1.0 11.0 101.0
1 2.0 12.0 102.0
2 3.0 13.0 103.0
3 4.0 14.0 104.0
4 5.0 15.0 105.0
5 6.0 16.0 106.0
def my_function(a,b,c):
#changes a b and c and returns
x = a*10
y = b-20
z = a*b -7
return [x,y,z]
对于每一行,我希望应用函数并在新的数据帧中返回值a、b、c、x、y、z
我做到了:
df_wanted = pd.DataFrame( df_test.apply(lambda row: my_function(row['a'], row['b'], row['c']), axis=1) )
它正在返回:
0
0 [10.0, -9.0, 4.0]
1 [20.0, -8.0, 17.0]
2 [30.0, -7.0, 32.0]
3 [40.0, -6.0, 49.0]
4 [50.0, -5.0, 68.0]
5 [60.0, -4.0, 89.0]
如何获得如下结果,而不是每行的数组:
a b c x y z
0 1.0 11.0 101.0 10.0 -9.0 4.0
1 2.0 12.0 102.0 20.0 -8.0 17.0
2 3.0 13.0 103.0 30.0 -7.0 32.0
3 4.0 14.0 104.0 40.0 -6.0 49.0
4 5.0 15.0 105.0 50.0 -5.0 68.0
5 6.0 16.0 106.0 60.0 -4.0 89.0
您可以返回熊猫系列而不是数组:
def my_function2(a,b,c):
#changes a b and c and returns
x = a*10
y = b-20
z = a*b -7
return pd.Series({
'x': x,
'y': y,
'z': z
})
df_wanted = pd.concat([
df_test,
df_test.apply(lambda row: my_function2(row['a'], row['b'], row['c']), axis=1)
], axis=1)
我知道您示例中的函数可能很简单,但请尝试使用向量化函数对列而不是逐行进行操作。它的效率要高得多。修复您的代码
df=df_test.join( pd.DataFrame( df_test.apply(lambda row: my_function(row['a'], row['b'], row['c']), axis=1).tolist() ,columns=list('xyz')))
这回答了你的问题吗?