Python parserError将字符串转换为数据帧
我有一个大的字符串值需要转换为dataframe。我使用stringIO作为包装,然后使用read_csv将其转换为数据帧。这是我的密码:Python parserError将字符串转换为数据帧,python,pandas,Python,Pandas,我有一个大的字符串值需要转换为dataframe。我使用stringIO作为包装,然后使用read_csv将其转换为数据帧。这是我的密码: t4 = str(t3, 'utf-8') #String Output df = pd.read_csv(StringIO(t4)) #wrap in stringIO and convert to dataframe 这就抛出了错误 ParserError: Error tokenizing data. C error: Expected 33 f
t4 = str(t3, 'utf-8') #String Output
df = pd.read_csv(StringIO(t4)) #wrap in stringIO and convert to dataframe
这就抛出了错误
ParserError: Error tokenizing data. C error: Expected 33 fields in line 30025, saw 34
我确实意识到这是由于原始字符串对象中的错误数据造成的,但是如何处理呢?我尝试粘贴到剪贴板并从那里读取,但没有效果。我想您必须将其复制到文件中,并在导入之前修复该文件。您不能只将字符串写入文件吗,处理/删除引发错误的特定行?@VikashB-这使我无法自动执行,因为我需要在给定时间每天运行它。您仍然可以自动执行,将其写入临时文件,修复/忽略引发错误的行,然后继续处理。因为最终,除非您编写自己的解析器,或者使用允许您跳过错误的自定义解析器,否则无法从错误的格式错误中恢复。请将输出发布到例如
lines=t4.splitlines()[30022:30027]