Python 熊猫:阅读csv遗漏了最后一行
我正在读取一个仅包含数字数据的csv文件,但并不是所有数据都被读取 我这样称呼它:Python 熊猫:阅读csv遗漏了最后一行,python,pandas,Python,Pandas,我正在读取一个仅包含数字数据的csv文件,但并不是所有数据都被读取 我这样称呼它: df=pd.read\u csv(文件名,sep=';',usecols=Settings.util\u columns(),解析日期=['TIMESTAMP'],推断日期时间格式=True,低内存=False,引号=csv.QUOTE\u NONE) 打印(f'Reading{file_name}') 打印(df['TIMESTAMP'].min(),'|',df['TIMESTAMP'].max()) 它输
df=pd.read\u csv(文件名,sep=';',usecols=Settings.util\u columns(),解析日期=['TIMESTAMP'],推断日期时间格式=True,低内存=False,引号=csv.QUOTE\u NONE)
打印(f'Reading{file_name}')
打印(df['TIMESTAMP'].min(),'|',df['TIMESTAMP'].max())
它输出以下内容:
Reading clean_data.csv
2008-12-03 20:30:00 | 2018-10-05 03:50:00
但是,clean_data.csv
(按时间戳排序)包含2019-08-27之前的时间戳
除此之外,不会引发/显示任何警告或错误消息
我从哪里找到了quoting=csv.QUOTE\u NONE
,但是它没有改变任何东西。考虑一下我的数据是数字的。< /P>
使用:
- python==3.6.6
- 熊猫==0.25.1
再一次,我很抱歉,感谢您抽出时间。您能分享csv吗?如果我们不能重现这个问题,很难帮助您。我不确定是否可以共享它,它非常大(千兆字节的数据):/code>wc-l clean_data.csv对应于
len(df)+1
?(对于Windows,请参见)len(df)
是413992wc-l clean_data.csv
是455429我在linux中工作,但是文件是在Windows中生成的。您能给我们看一下命令的结果吗tail
?