Python 如何通过自定义函数对数据帧进行分组
有一个表单的数据框架Python 如何通过自定义函数对数据帧进行分组,python,pandas,Python,Pandas,有一个表单的数据框架 col1 sum 801 1 802 2 391 3 701 5 我想按col1的初始值分组,应用平均值 基本上结果应该是 col1 sum 8 1.5 3 3 7 5 我试过的是 def group_condition(col1): col1 = str(col1) if col1.startswith('8'): return 'y' else:
col1 sum
801 1
802 2
391 3
701 5
我想按col1的初始值分组,应用平均值
基本上结果应该是
col1 sum
8 1.5
3 3
7 5
我试过的是
def group_condition(col1):
col1 = str(col1)
if col1.startswith('8'):
return 'y'
else:
return 'n'
augmented_error_table[[sum]].groupby(augmented_error_table[col1].groupby(group_condition).groups).mean()
但是它不起作用,给我空的df我想问题是,
groupby
实际上需要一个序列,而不是一个函数作为输入,类似这样的东西
table.groupby(group_condition(table[col1]))
在groupby like中使用astype(str)
df.groupby(df['col1'].astype(str).str[0])['sum'].mean()
乌普图特:
sum
col1
3 3.0
7 5.0
8 1.5
什么是
abs\u error
和loc\u-zip
?@BrenBarn抱歉,复制错误一个被低估的答案!
sum
col1
3 3.0
7 5.0
8 1.5