Python pandas read_table parse_dates:另一列的dict中已存在新的日期列?
作为a(强制将错误格式的日期转换为NAs)的一个潜在解决方案,我尝试在pandas 0.18.0中读取时将两列转换为日期。(不清楚这是否可行,或者只能从一列或多列中编译一个日期索引。) 我不理解(其中一个?)新日期列已经在未受影响列的dict中的错误 导入行的内容如下:Python pandas read_table parse_dates:另一列的dict中已存在新的日期列?,python,date,pandas,type-conversion,Python,Date,Pandas,Type Conversion,作为a(强制将错误格式的日期转换为NAs)的一个潜在解决方案,我尝试在pandas 0.18.0中读取时将两列转换为日期。(不清楚这是否可行,或者只能从一列或多列中编译一个日期索引。) 我不理解(其中一个?)新日期列已经在未受影响列的dict中的错误 导入行的内容如下: treatments = pd.read_table(filename,usecols=[0,3,4,6], engine='c',parse_dates=[[3],[4]]) 数据文件以 LopNr SJUKHUS MV
treatments = pd.read_table(filename,usecols=[0,3,4,6], engine='c',parse_dates=[[3],[4]])
数据文件以
LopNr SJUKHUS MVO INDATUMA UTDATUMA HDIA DIAGNOS OP PVARD EKOD1 EKOD2 EKOD3 EKOD4 EKOD5 ICD
1562 21001 046 20030707 20030711 I489A I489A I509 2 10
1562 21001 046 2003o730 20030801 I501 I501 I489A DG001 2 10
错误是
ValueError: New date column already in dict DIAGNOS
我想您需要
pd.read\u表(文件名,usecols=[0,3,4,6],引擎=[c],解析日期=[3,4]
我误读了手册!抱歉。尽管如此,我还是收到了一个索引器:列表索引超出范围的错误,即使它与这里的主题无关。我应该使用与新数据帧对应的列号,而不是原始数据文件吗?treatments=pd.read_table(文件名,usecols=[0,3,4,6],engine='c',parse_dates=[1,2])
工作正常,但对于格式错误的INDATUMA
强制NA
s维护一列数据类型object
。。您必须对两个COL使用转换器,或者随后对其进行处理以获得所需的数据类型