Python 索引上的循环

Python 索引上的循环,python,datetime,pandas,normalization,Python,Datetime,Pandas,Normalization,我有一个熊猫数据帧,它由一些非唯一的非连续id号索引 x 类“pandas.core.frame.DataFrame” INT64索引:814061条,8536896至8498857 数据列(共1列): 收到814061个非空值 数据类型:datetime64ns x['received']是长度不完全相同的时间戳 x.ix[i] might have len() == 20 x.ix[j] might have len() == 32. 对于任何x.ix[i],我都可以使用 df['t

我有一个熊猫数据帧,它由一些非唯一的非连续id号索引

x
类“pandas.core.frame.DataFrame”
INT64索引:814061条,8536896至8498857
数据列(共1列):
收到814061个非空值
数据类型:datetime64ns

x['received']是长度不完全相同的时间戳

x.ix[i] might have len() == 20  
x.ix[j] might have len() == 32. 
对于任何x.ix[i],我都可以使用

df['totalseconds'] = x.ix[i]['received']-x.ix[i]['received'].min()
y = x.ix[i]['received'].max()-x.ix[i]['received'].min()
z = timedelta.total_seconds(y)
df['seconds'] = df['totalseconds'].apply(lambda x: x / timedelta64(1, 's'))
df['norm'] = df['seconds']/z
我正在尝试规范化x中每个索引的时间段。但是我因为某种原因遇到了麻烦


tldr;如何按索引id将所有时间戳放入[0,1]范围?

有点困惑,您如何拥有唯一的索引、datetime64[ns]的数据类型以及x.ix[scalar]返回不同长度的对象?也许你指的是分组行动?(如果是这样的话,很高兴发布)
np.shape(x)=(814061,1)
&
len(x.ix[8498857]['received']]=2
&
len(x.ix[8536896]['received']=3
如果有帮助的话,索引只有100个不同长度时间戳的唯一数字。
x.ix[8536896]['received']=2013-09-09 16:27:54,2013-09-09 15:01:35
我想将所有索引的开始和停止标准化为[0,1]。我尝试了groupby,但无法使其正常工作
key=lambda x:x.index
seconds=lambda x:(x['received']-x['received'].min()/(x['received'].max()-x['received'].min())x['norm']=x.groupby(key)。transform(seconds)给我一个AttributeError:'long'对象没有属性'index',我想
x['norm']=x.groupby(x['received'])。transform(秒)
几乎正确。它给出了错误:只能对时间增量进行加法和减法运算,但传递了运算符[truediv]。但是,当我尝试使用
timedelta.total_seconds
时,我得到了TypeError:描述符“total_seconds”需要一个“datetime.timedelta”对象,但收到了一个“function”