Python 从.csv文件读取数据帧的时间戳的意外分析_Python_Pandas_Timestamp

Python 从.csv文件读取数据帧的时间戳的意外分析

python pandas

Python 从.csv文件读取数据帧的时间戳的意外分析,python,pandas,timestamp,Python,Pandas,Timestamp,我有一个从csv文件中读取的熊猫数据框，其中包含一列日期 In[1]: df = pd.read_csv(fileStats, index_col=0, parse_dates= ['start_date']) In[2]: df.head() Out[3]: start_date customer_ID 10006

我有一个从csv文件中读取的熊猫数据框，其中包含一列日期

In[1]: df = pd.read_csv(fileStats, index_col=0, parse_dates= ['start_date'])

In[2]: df.head()
Out[3]:
                 start_date  
    customer_ID                                                               
    10006414       2012-10-02 08:30:00   
    10006486       2013-12-02 09:00:00   
    10006492       2013-12-02 09:00:00   
    10006572       2012-03-31 08:30:00   
    10006630       2012-01-06 10:30:00

我想找到最早的日期：

In[4]: df['start_date'].min()
Out[5]:
Timestamp('2011-01-12 08:00:00')

这看起来不错，只是当我在excel中打开.csv文件，并按开始日期对行排序时，最早的日期是

2011-10-06 13:00:00

。同样的问题也发生在

.max（）

上。这是指一个类似的问题，但与我在这里不使用的np.datetime64有关。

.max（）

和

.min（）

是否存在问题，还是与解析

中的日期有关。读取\u csv

编辑：

对@DYZ建议的进一步调查表明，时间戳被错误读取或解析<.csv文件中的code>2011年6月10日13:00已成为数据帧中的

2014-03-03 10:00:00

。如何更正此问题？

首先检查[6]中的最早日期在

df

中：最早=df['Start\u date'].min（）

在[7]中：最早在df中[8]：False
最早在df
中不检查行是否在数据帧中。检查df['start\u date']中的最早值。值
df['start\u date']中的最早值。值

False

因此，看起来该行未被读取、未正确读取或未正确解析。我会检查

df

和CSV文件中的行数是否相同。