Python 如何从由两个字段';时间戳';和';用户id';?
我将下表包含在以下数据框中:Python 如何从由两个字段';时间戳';和';用户id';?,python,pandas,Python,Pandas,我将下表包含在以下数据框中: cost cost cost val1 val1 val1 user_id 1 2 3 1 2 3 timestamp 01/01/2011 1 100 3 5 01/02/2011 20 8
cost cost cost val1 val1 val1
user_id 1 2 3 1 2 3
timestamp
01/01/2011 1 100 3 5
01/02/2011 20 8
01/07/2012 19 57
01/11/2012 3100 49
21/12/2012 240 30
14/09/2013 21 63
01/12/2013 3200 51
我想知道如何获得另一个数据帧,该数据帧仅包含所有用户id的所有相同字段的总和(例如,用户1、2和3的字段“成本”的总和)
用于获取上表的代码为:
import pandas as pd
newnames = ['timestamp','user_id', 'cost', 'val1','val2', 'val3','code']
df = pd.read_csv('mytest.csv', names = newnames, header = False, parse_dates=True, dayfirst=True)
df['timestamp'] = pd.to_datetime(df['timestamp'], dayfirst=True)
pivoted = df.pivot('timestamp', 'user_id')
提前感谢您的帮助。没有原始数据帧(
df
)进行测试,因此我不能确定,但我会在df
上使用goupby,而不是操纵您的数据帧,旋转的
:
df.groupby('user_id')[['cost', 'val1','val2', 'val3']].sum()
谢谢。我会按时间戳订购的。