Python 关于pandas中日志的派生/元数据
要做到这一点,必须有一个精简的方法: 数据帧Python 关于pandas中日志的派生/元数据,python,pandas,Python,Pandas,要做到这一点,必须有一个精简的方法: 数据帧 t, ID 700, 1 900, 1 1000, 1 1100, 1 300, 2 100, 3 200, 3 预期结果: elapsed, visits, 1/f, ID 400, 4, 100, 1 0, 1, 0, 2 100, 2, 50, 3 是否使用了groupby重新采样?我应该做一个ID索引吗?什么是1/f列?@korem访问之间的平均时间,即已用/访问f只是频率你必须编辑你的问题,目前它非常不清楚,而且在这一阶段的猜测工作中不
t, ID
700, 1
900, 1
1000, 1
1100, 1
300, 2
100, 3
200, 3
预期结果:
elapsed, visits, 1/f, ID
400, 4, 100, 1
0, 1, 0, 2
100, 2, 50, 3
是否使用了
groupby
<代码>重新采样?我应该做一个ID索引吗?什么是1/f
列?@korem访问之间的平均时间,即已用/访问f
只是频率你必须编辑你的问题,目前它非常不清楚,而且在这一阶段的猜测工作中不会很快得到回答1/f
列是什么?@korem访问之间的平均时间,即,经过/访问f
只是频率你必须编辑你的问题,目前它非常不清楚,而且在这一阶段的猜测工作中不会很快得到回答1/f
列是什么?@korem访问之间的平均时间,即,经过/访问f
只是频率你必须编辑你的问题,目前它非常不清楚,而且在这一阶段的猜测工作中不会很快得到回答1/f
列是什么?@korem访问之间的平均时间,即,经过/访问f
只是频率你必须编辑你的问题,目前它非常不清楚,而且在这一阶段的猜测工作中,不会很快得到回答。这是一个非常快速和超高质量的猜测!这是疯狂的快速和超高质量的猜测!这是疯狂的快速和超高质量的猜测!这是疯狂的快速和超高质量的猜测!
In [88]: result = df.groupby(['ID'])['t'].agg(['min', 'max', 'count'])
In [89]: result['elapsed'] = result['max']-result['min']
In [90]: result['1/f'] = result['elapsed']/result['count']
In [91]: result = result[['elapsed','count', '1/f']].rename(columns={'count':'visits'})
In [92]: result = result.reset_index()
In [93]: result
Out[93]:
ID elapsed visits 1/f
0 1 400 4 100
1 2 0 1 0
2 3 100 2 50