Python 索引上的循环_Python_Datetime_Pandas_Normalization

Python 索引上的循环

python datetime pandas

Python 索引上的循环,python,datetime,pandas,normalization,Python,Datetime,Pandas,Normalization,我有一个熊猫数据帧，它由一些非唯一的非连续id号索引 x 类“pandas.core.frame.DataFrame” INT64索引：814061条，8536896至8498857 数据列（共1列）：收到814061个非空值数据类型：datetime64ns x['received']是长度不完全相同的时间戳 x.ix[i] might have len() == 20 x.ix[j] might have len() == 32. 对于任何x.ix[i]，我都可以使用 df['t

我有一个熊猫数据帧，它由一些非唯一的非连续id号索引

x
类“pandas.core.frame.DataFrame”
INT64索引：814061条，8536896至8498857
数据列（共1列）：
收到814061个非空值
数据类型：datetime64ns

x['received']是长度不完全相同的时间戳

x.ix[i] might have len() == 20  
x.ix[j] might have len() == 32.

对于任何x.ix[i]，我都可以使用

df['totalseconds'] = x.ix[i]['received']-x.ix[i]['received'].min()
y = x.ix[i]['received'].max()-x.ix[i]['received'].min()
z = timedelta.total_seconds(y)
df['seconds'] = df['totalseconds'].apply(lambda x: x / timedelta64(1, 's'))
df['norm'] = df['seconds']/z

我正在尝试规范化x中每个索引的时间段。但是我因为某种原因遇到了麻烦

tldr；如何按索引id将所有时间戳放入[0,1]范围？

有点困惑，您如何拥有唯一的索引、datetime64[ns]的数据类型以及x.ix[scalar]返回不同长度的对象？也许你指的是分组行动？（如果是这样的话，很高兴发布）

np.shape（x）=（814061，1）

len（x.ix[8498857]['received']]=2

len（x.ix[8536896]['received']=3

如果有帮助的话，索引只有100个不同长度时间戳的唯一数字。

x.ix[8536896]['received']=2013-09-09 16:27:54，2013-09-09 15:01:35

我想将所有索引的开始和停止标准化为[0，1]。我尝试了groupby，但无法使其正常工作

key=lambda x:x.index

seconds=lambda x:（x['received']-x['received'].min（）/（x['received'].max（）-x['received'].min（））x['norm']=x.groupby（key）。transform（seconds）给我一个AttributeError:'long'对象没有属性'index'，我想

x['norm']=x.groupby（x['received']）。transform（秒）

几乎正确。它给出了错误：只能对时间增量进行加法和减法运算，但传递了运算符[truediv]。但是，当我尝试使用

timedelta.total_seconds

时，我得到了TypeError:描述符“total_seconds”需要一个“datetime.timedelta”对象，但收到了一个“function”