Python 无法读取csv文件,出现错误
我从pandas lib收到解析器错误…不确定可能是什么问题Python 无法读取csv文件,出现错误,python,pandas,Python,Pandas,我从pandas lib收到解析器错误…不确定可能是什么问题 Traceback (most recent call last): File "C:/2020/python-nifi/test.py", line 4, in <module> df = pd.read_csv("C:\\2020\\test\\sum.csv", '\t') File "C:\2020\python-nifi\venv\lib\site-packages\pandas\io\parse
Traceback (most recent call last):
File "C:/2020/python-nifi/test.py", line 4, in <module>
df = pd.read_csv("C:\\2020\\test\\sum.csv", '\t')
File "C:\2020\python-nifi\venv\lib\site-packages\pandas\io\parsers.py", line 676, in parser_f
return _read(filepath_or_buffer, kwds)
File "C:\2020\python-nifi\venv\lib\site-packages\pandas\io\parsers.py", line 454, in _read
data = parser.read(nrows)
File "C:\2020\python-nifi\venv\lib\site-packages\pandas\io\parsers.py", line 1133, in read
ret = self._engine.read(nrows)
File "C:\2020\python-nifi\venv\lib\site-packages\pandas\io\parsers.py", line 2037, in read
data = self._reader.read(nrows)
File "pandas\_libs\parsers.pyx", line 860, in pandas._libs.parsers.TextReader.read
File "pandas\_libs\parsers.pyx", line 875, in pandas._libs.parsers.TextReader._read_low_memory
File "pandas\_libs\parsers.pyx", line 929, in pandas._libs.parsers.TextReader._read_rows
File "pandas\_libs\parsers.pyx", line 916, in pandas._libs.parsers.TextReader._tokenize_rows
File "pandas\_libs\parsers.pyx", line 2071, in pandas._libs.parsers.raise_parser_error
pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 5, saw 4
import pandas as pd
df = pd.read_csv("C:\\2020\\test\\sum.csv", sep='\t')
print(df)
回溯(最近一次呼叫最后一次):
文件“C:/2020/python nifi/test.py”,第4行,在
df=pd.read\u csv(“C:\\2020\\test\\sum.csv”,“\t”)
文件“C:\2020\python nifi\venv\lib\site packages\pandas\io\parsers.py”,第676行,在解析器中
返回读取(文件路径或缓冲区,kwds)
文件“C:\2020\python nifi\venv\lib\site packages\pandas\io\parsers.py”,第454行,已读
data=parser.read(nrows)
文件“C:\2020\python nifi\venv\lib\site packages\pandas\io\parsers.py”,第1133行,已读
ret=自身。\发动机读取(nrows)
文件“C:\2020\python nifi\venv\lib\site packages\pandas\io\parsers.py”,第2037行,已读
数据=自身。\读卡器读取(nrows)
文件“pandas\\ libs\parsers.pyx”,第860行,在pandas.\ libs.parsers.TextReader.read中
文件“pandas\\ libs\parsers.pyx”,第875行,在pandas.\u libs.parsers.TextReader.\u读取\u内存不足
文件“pandas\\ libs\parsers.pyx”,第929行,在pandas.\u libs.parsers.TextReader.\u read\u行中
pandas.\u libs.parsers.TextReader.\u标记化\u行中的文件“pandas\\u libs\parsers.pyx”,第916行
文件“pandas\\u libs\parsers.pyx”,第2071行,在pandas.\u libs.parsers.raise\u parser\u错误
pandas.errors.ParserError:标记数据时出错。C错误:第5行中预期有1个字段,SAW4
作为pd进口熊猫
df=pd.read\u csv(“C:\\2020\\test\\sum.csv”,sep='\t')
打印(df)
试图读取的文件是
如果您使用
df=pd.read_csv(“文件名”,sep='[:,|.]',engine='python')
?
因为您可以在导入时使用多个分隔符。此错误是由于编码错误造成的: 试试这个:
df = pd.read_csv('filename', encoding='utf-8')
错误在这里打印
第5行中的预期1字段,saw 4
,如果您想共享数据帧的示例df
,您可以使用跳过错误行:pandas.read_csv(fileName,sep='delimiter',error\u bad\u lines=False)
@Cavin Dsouza,添加screenshot@narendra-乔杜里,您的意思是在单元格中删除/转义管道“|”?在添加“error_bad_lines=False”后..出现了一些不同的错误..谢谢Karel,这是损坏的csv的问题