Python 如何识别日期格式

Python 如何识别日期格式,python,pandas,dataframe,date,Python,Pandas,Dataframe,Date,我有一个正在清理的数据框,其中一个值是出生日期。 该格式非常奇怪,因为它采用如下值 df['Birth'] Out[12]: 0 -11749.0 1 2472.0 2 707.0 3 7904.0 4 -3633.0 ... 99987 831.0 99988 2181.0 99989 -2842.0 99990 -1506.0 99991 3167.0 它是一种特定的格式

我有一个正在清理的数据框,其中一个值是出生日期。 该格式非常奇怪,因为它采用如下值

df['Birth']
Out[12]: 
0      -11749.0
1        2472.0
2         707.0
3        7904.0
4       -3633.0
          ...  
99987     831.0
99988    2181.0
99989   -2842.0
99990   -1506.0
99991    3167.0
它是一种特定的格式吗?如何从中获取公历日期?
因为我搞不清楚,这个变量可能对我正在构建的模型很重要。

胡乱猜测:Unix纪元前后的天数:
pd.Timestamp(0)+pd.TimedeltaIndex(df.bornath,unit=“D”)
。结果是否有意义,我不知道;也许你可以考虑一下其他专栏等等,我已经看过类似的东西了。日期编码为从出生日期到特定参考日期的天数。通常人们会使用epoch/Unix时间(1970年11月午夜)。所以基本上你的第一次约会(-11749)是在1970年11月11日之前的11.749天(大约32年61天),大概是1937年11月1日。这对你有意义吗?(1/2)@Alex的猜测可能是正确的。但如果没有进一步的信息,我们也只能猜测。确定参考日期的唯一方法是了解至少一个人的实际出生日期,并确定参考日期。你还需要希望所有的dob都使用相同的参考日期-可能是这样,但不能保证。无论如何,投票结束这项工作,因为这只是猜测和基于意见的。(2/2)您可以尝试使用
datetime.timedelta()
或使用特定的基准日期来确定参考日期,看看哪个日期有意义。例如,对于rowid=3,
datetime.date(2000,1,1)+datetime.timedelta(days=707)
(2001,12,8)
,这将使达到法定年龄的人今天能够工作。因此,2000年1月1日可能是您的参考日期。其他因素:是否有就业数据?如果不是,法定年龄不是一个指标。对照基准日期检查您的最小/最大+/-,看看是否合理。非常感谢您的帮助!我将反复查看日期,看看哪一个更有意义。