Python 熊猫：与时间石斑鱼群_Python_Pandas

Python 熊猫：与时间石斑鱼群

python pandas

Python 熊猫：与时间石斑鱼群,python,pandas,Python,Pandas,我有数据 i,ID,url,used_at,active_seconds,domain,search_term 322015,0120bc30e78ba5582617a9f3d6dfd8ca,vk.com/antoninaribina,2015-12-31 09:16:05,35,vk.com,None 838267,0120bc30e78ba5582617a9f3d6dfd8ca,vk.com/feed,2015-12-31 09:16:38,54,vk.com,None 83

我有数据

i,ID,url,used_at,active_seconds,domain,search_term  
322015,0120bc30e78ba5582617a9f3d6dfd8ca,vk.com/antoninaribina,2015-12-31 09:16:05,35,vk.com,None    
838267,0120bc30e78ba5582617a9f3d6dfd8ca,vk.com/feed,2015-12-31 09:16:38,54,vk.com,None  
838271,0120bc30e78ba5582617a9f3d6dfd8ca,vk.com/feed?section=photos,2015-12-31 09:17:32,34,vk.com,None   
322026,0120bc30e78ba5582617a9f3d6dfd8ca,vk.com/feed?section=photos&z=photo143297356_397216312%2Ffeed1_143297356_1451504298,2015-12-31 09:18:06,4,vk.com,None    
838275,0120bc30e78ba5582617a9f3d6dfd8ca,vk.com/feed?section=photos,2015-12-31 09:18:10,4,vk.com,None    
322028,0120bc30e78ba5582617a9f3d6dfd8ca,vk.com/feed?section=comments,2015-12-31 09:18:14,8,vk.com,None  
322029,0120bc30e78ba5582617a9f3d6dfd8ca,megarand.ru/contest/121070,2015-12-31 09:18:22,16,megarand.ru,None  
1870917,0120bc30e78ba5582617a9f3d6dfd8ca,vk.com/feed?section=comments,2015-12-31 09:18:38,6,vk.com,None 
1354612,0120bc30e78ba5582617a9f3d6dfd8ca,vk.com/antoninaribina,2015-12-31 09:18:44,56,vk.com,None

我需要按

ID

分组，然后按

使用的下一个groupby

，其中两个字符串之间的差异超过

500秒。
我试着
但它返回keyrerror:（'ID'，'used_at'）
您需要的IIUC：
print (df.groupby('ID')['used_at'].diff().dt.seconds)
0     NaN
1    33.0
2    54.0
3    34.0
4     4.0
5     4.0
6     8.0
7    16.0
8     6.0
Name: used_at, dtype: float64

如果您希望使用TimeGrouper
，应首先设置Datetimeindex
，然后可以使用任何聚合功能，例如sum
：
df['used_at'] = pd.to_datetime(df.used_at)
df.set_index('used_at', inplace=True)
print (df.groupby([df['ID'],pd.TimeGrouper(freq='5Min')]).sum())

另一种方法是将

处使用的列

复制到索引
：
df['used_at'] = pd.to_datetime(df.used_at)
df.set_index(df['used_at'], inplace=True)
print (df.groupby([df['ID'], df['used_at'],pd.TimeGrouper(freq='5Min')]).sum())

您可以尝试df.groupby（[df[['ID'，'used_at']]，pd.TimeGrouper（freq='5Min'）））
您需要传递字符串列表，您试图传递的实际上是一个元组，因此keyerror@EdChumValueError:Grouper for''不是一维的doesdf.groupby（[df[['ID'，'used_at']，pd.TimeGrouper（freq='5Min'））
work？@EdChum it returnTypeError:unhabable type:'list'
code withtimegropper
returnTypeError:仅对DatetimeIndex、TimedeltaIndex或periodinex有效，但得到了一个“Index”的实例
Seed edit，可能需要将string
列转换为datetime。谢谢！能看到我的下一个吗呃，请回答问题
df['used_at'] = pd.to_datetime(df.used_at)
df.set_index(df['used_at'], inplace=True)
print (df.groupby([df['ID'], df['used_at'],pd.TimeGrouper(freq='5Min')]).sum())