Python 从.csv文件读取数据帧的时间戳的意外分析

Python 从.csv文件读取数据帧的时间戳的意外分析,python,pandas,timestamp,Python,Pandas,Timestamp,我有一个从csv文件中读取的熊猫数据框,其中包含一列日期 In[1]: df = pd.read_csv(fileStats, index_col=0, parse_dates= ['start_date']) In[2]: df.head() Out[3]: start_date customer_ID 10006

我有一个从csv文件中读取的熊猫数据框,其中包含一列日期

In[1]: df = pd.read_csv(fileStats, index_col=0, parse_dates= ['start_date'])

In[2]: df.head()
Out[3]:
                 start_date  
    customer_ID                                                               
    10006414       2012-10-02 08:30:00   
    10006486       2013-12-02 09:00:00   
    10006492       2013-12-02 09:00:00   
    10006572       2012-03-31 08:30:00   
    10006630       2012-01-06 10:30:00  
我想找到最早的日期:

In[4]: df['start_date'].min()
Out[5]:
Timestamp('2011-01-12 08:00:00')
这看起来不错,只是当我在excel中打开.csv文件,并按开始日期对行排序时,最早的日期是
2011-10-06 13:00:00
。同样的问题也发生在
.max()
上。这是指一个类似的问题,但与我在这里不使用的np.datetime64有关。
.max()
.min()
是否存在问题,还是与解析
中的日期有关。读取\u csv

编辑:
对@DYZ建议的进一步调查表明,时间戳被错误读取或解析<.csv文件中的code>2011年6月10日13:00已成为数据帧中的
2014-03-03 10:00:00
。如何更正此问题?

首先检查[6]中的最早日期在
df
中:最早=df['Start\u date'].min()
在[7]中:最早在df
中[8]:False
最早在df
中不检查行是否在数据帧中。检查
df['start\u date']中的最早值。值
df['start\u date']中的最早值。值
返回
False
因此,看起来该行未被读取、未正确读取或未正确解析。我会检查
df
和CSV文件中的行数是否相同。