将各种不一致的日期字符串转换为有效的';日期';;python
我有各种文本输入文件,其中包含需要处理的基于行的记录(csv/tsv等);每个文件中的每一行通常都有一个日期字段,并且日期格式变化很大 我的第一反应是(手动)尝试识别每个日期格式,然后对每一行使用正则表达式来识别格式、验证数据并转换为有效的日期对象 然而,我想借此机会提高我对python和编程的总体知识,并希望您能提供一些技术,我可以使用这些技术更有效地管理这项工作,并在此过程中学习一些东西 谢谢 使用该模块,它的方法可以检测和解析多种不同的日期格式将各种不一致的日期字符串转换为有效的';日期';;python,python,date,Python,Date,我有各种文本输入文件,其中包含需要处理的基于行的记录(csv/tsv等);每个文件中的每一行通常都有一个日期字段,并且日期格式变化很大 我的第一反应是(手动)尝试识别每个日期格式,然后对每一行使用正则表达式来识别格式、验证数据并转换为有效的日期对象 然而,我想借此机会提高我对python和编程的总体知识,并希望您能提供一些技术,我可以使用这些技术更有效地管理这项工作,并在此过程中学习一些东西 谢谢 使用该模块,它的方法可以检测和解析多种不同的日期格式 请注意,python dateutil在如何
请注意,python dateutil在如何处理不明确的日期(首先是年、月或日)方面非常具体,让我们调整一下如何解析这些日期。这当然取决于数据的外观;您可能需要测试一些样品并手动验证。我甚至不确定这是否可行。考虑以下日期:
83-05-03 10:20
这是:
- 1983年5月3日上午10:20
- 2083年3月5日,晚上10:20
- 等
如果不指定格式,我看不出如何解决这种歧义。python dateutil定义了一个优先级,您可以重新配置它以满足您的需要。谢谢;我已经准备好在这个山毛榉上安装所有的解析器/词法分析器,谢天谢地,这里有一个简单的解决方案!