Python 将以秒为单位的时间戳转换为hh:mm:ss时间_Python_Pandas_Time_Timedelta

Python 将以秒为单位的时间戳转换为hh:mm:ss时间

python pandas time

Python 将以秒为单位的时间戳转换为hh:mm:ss时间,python,pandas,time,timedelta,Python,Pandas,Time,Timedelta,我有一个df，有一个列以秒为单位显示时间。我想把它们转换成hh:mm或hh:mm:ss 如果时间超过了标准的24小时，我仍然希望它是hh:mm:ss。非'n'天hh:mm:ss 举个例子： import pandas as pd import numpy as np import datetime ts1 = ['21000', np.nan, '40000', np.nan, '49000', '100000'] ts2 = [0, 2, 'yy', 3, 'yy', 'yy'] ts3 =

我有一个

df

，有一个

列

以秒为单位显示时间。我想把它们转换成

hh:mm

或

hh:mm:ss

如果时间超过了标准的24小时，我仍然希望它是

hh:mm:ss

。非

'n'天hh:mm:ss

举个例子：

import pandas as pd
import numpy as np
import datetime

ts1 = ['21000', np.nan, '40000', np.nan, '49000', '100000']
ts2 = [0, 2, 'yy', 3, 'yy', 'yy']
ts3 = [0, 2, np.nan, 3, 4, np.nan]
d =  {'X': ts1, 'Y': ts2, 'Z': ts3}
df = pd.DataFrame(data=d)

输出：

        X   Y    Z
0   21000   0  0.0
1     NaN   2  2.0
2   40000  yy  NaN
3     NaN   3  3.0
4   49000  yy  4.0
5  100000  yy  NaN

我可以使用以下方法在单个

字符串上执行此操作：
t = str(datetime.timedelta(seconds=21000))

输出t：
5:50:00    

但是如何将相同的函数传递给整个列呢
#t_col = str(datetime.timedelta(seconds=df['ts1']))

预期产出：
          X   Y    Z
0   5:50:00   0  0.0
1       NaN   2  2.0
2  11:06:40  yy  NaN
3       Nan   3  3.0
4  13:36:40  yy  4.0
5  27:46:40  yy  NaN

更为循序渐进的方法
首先，让我们创建新的专栏，去掉讨厌的NaN
值
In [156]: df['new_column'] = df.X.fillna(0)

In [157]: df
Out[157]:
       X   Y    Z new_column
0  21000   0  0.0      21000
1    NaN   2  2.0          0
2  40000  yy  NaN      40000
3    NaN   3  3.0          0
4  49000  yy  4.0      49000
5  80000  yy  NaN      80000

然后，我们可以根据您编写的代码，使用lambda
函数创建delta。注意，对于timedelta
的seconds
参数，我们必须将新列的值强制转换为int
s
In [158]: df['new_column'] = df.apply(lambda x: datetime.timedelta(seconds=int(x['new_column'])), axis=1)

In [159]: df
Out[159]:
       X   Y    Z new_column
0  21000   0  0.0   05:50:00
1    NaN   2  2.0   00:00:00
2  40000  yy  NaN   11:06:40
3    NaN   3  3.0   00:00:00
4  49000  yy  4.0   13:36:40
5  80000  yy  NaN   22:13:20

使用一行线
在我们之前编写的基础上，我们需要消除NaN
s，然后首先将整个系列转换为int
s，然后转换为timedelta
s
In [173]: df['td'] = pd.to_timedelta(pd.to_numeric(df.X.fillna(0)), unit='s')

In [174]: df
Out[174]:
       X   Y    Z new_column       td
0  21000   0  0.0   05:50:00 05:50:00
1    NaN   2  2.0   00:00:00 00:00:00
2  40000  yy  NaN   11:06:40 11:06:40
3    NaN   3  3.0   00:00:00 00:00:00
4  49000  yy  4.0   13:36:40 13:36:40
5  80000  yy  NaN   22:13:20 22:13:20

这种方法应该更快，因为apply
非常简单
根据您的评论，为了与NaN
s保持一致，您可以使用
df['td'] = df.apply(lambda x: x['td'] if x['X'] is not np.NaN else None, axis=1)

使用后跟一些混乱的字符串格式将天转换为小时：
def formatter(x):
    x = str(x)
    return str(int(x[-8:-6])+int(x.split('days')[0])*24).zfill(2) + x[-6:]

df['TD'] = pd.to_timedelta(df['X'].fillna(0).astype(int), unit='s')\
             .apply(formatter)

print(df)

        X   Y    Z        TD
0   21000   0  0.0  05:50:00
1     NaN   2  2.0  00:00:00
2   40000  yy  NaN  11:06:40
3     NaN   3  3.0  00:00:00
4   49000  yy  4.0  13:36:40
5  100000  yy  NaN  27:46:40

另外，我们可以在转换之前或转换之后删除00:00:00吗？@PeterJames123，你在重新定义这个问题。这超出了你最初问的范围不是吗？NaN家很好。现在我需要移除这些。如果时间实际上是00:00:00呢。我无法区分。我指的是你删除的评论，你要求我为《泰晤士报>24小时》编写代码。你的第一个问题在范围之内，我已经更新了我的回答。对不起。我可以加上这些。一切都好。我只需要做一个。replace@jpp运行良好