Python 解析具有已知格式的日期字符串的最快方法
假设我有一个以下格式的字符串:Python 解析具有已知格式的日期字符串的最快方法,python,performance,datetime,Python,Performance,Datetime,假设我有一个以下格式的字符串: "YYYY mm dd" 将其放入python日期对象的最快方法是什么?我的第一个想法是: >>> import datetime >>> datetime.datetime.strptime('2018 01 12', "%Y %m %d").date() datetime.date(2018, 1, 12) 然而,我有大约一百万个日期字符串需要转换,我想知道是否有人有更快的替代方法,或者基准测试表明上述方法最快。一百万个
"YYYY mm dd"
将其放入python日期对象的最快方法是什么?我的第一个想法是:
>>> import datetime
>>> datetime.datetime.strptime('2018 01 12', "%Y %m %d").date()
datetime.date(2018, 1, 12)
然而,我有大约一百万个日期字符串需要转换,我想知道是否有人有更快的替代方法,或者基准测试表明上述方法最快。一百万个文件?也许你可以试试Pandas/Dask?为什么不把它们读入Pandas中,并在整个字符串列上使用
pd.to_datetime()
?@rahlf23——当然有可能……如果这是最快的方法的话。那肯定是我的方法,在你的问题范围有限的情况下。你是将所有内容都保存在内存中,还是将它们加载并写回硬盘驱动器?如果是这样的话,您确定时间将主要花在转换数据上,还是I/O将占主导地位?