Windows 迭代标记错误
我的ipython笔记本中有一行: 对于outFileList中的sourceCSV:Windows 迭代标记错误,windows,pandas,iteration,Windows,Pandas,Iteration,我的ipython笔记本中有一行: 对于outFileList中的sourceCSV: for df in pd.read_csv(sourceCSV, chunksize=chunksize, iterator=True, encoding='utf-8') 它应该添加两个csv文件,每个文件10000行,并将它们添加到一个数据帧中。它返回标记化错误(CParserError:error TOKENISING data.C error:EOF INDER string,从第10000行开始)
for df in pd.read_csv(sourceCSV, chunksize=chunksize, iterator=True, encoding='utf-8')
它应该添加两个csv文件,每个文件10000行,并将它们添加到一个数据帧中。它返回标记化错误(CParserError:error TOKENISING data.C error:EOF INDER string,从第10000行开始)。它发生在读取第二个文件的最后一行时。我在windows上运行代码,我们在Mac上运行,没有这个问题。我应该更改read\u CSV选项吗?你能为pd中的df尝试一下这个
吗。read\u CSV(sourceCSV,chunksize=chunksize,iterator=True,encoding='utf-8',error\u bad\u line=False)
我这样做了,它返回相同的错误。我认为EOF问题也可能是由于我的系统设置。我在Mac上运行了这段代码,一切正常。这可能是我的计算机上的读写权限问题。