Python Pandas read_csv不忽略带引号字符串中的逗号
我有一个导出的csv数据集,它允许来自用户的html文本,我需要将其转换为数据帧 可能带有额外逗号的列用Python Pandas read_csv不忽略带引号字符串中的逗号,python,pandas,Python,Pandas,我有一个导出的csv数据集,它允许来自用户的html文本,我需要将其转换为数据帧 可能带有额外逗号的列用“引用,但解析器使用其中的逗号作为分隔符 这是我正在使用的代码,我已经尝试了和的解决方案 导致 这是csv文件本身,包含列和第一个条目。 我不知道问题出在哪里,quotechar应该是有效的,可能是quoted字符串中额外的“?以下是您遇到的问题: 您将quote(“)设置为quotechar。不幸的是,您的文本中也有quote: <a href ="...."&
“
引用,但解析器使用其中的逗号作为分隔符
这是我正在使用的代码,我已经尝试了和的解决方案
导致
这是csv文件本身,包含列和第一个条目。
我不知道问题出在哪里,
quotechar
应该是有效的,可能是quoted字符串中额外的“
?以下是您遇到的问题:
您将quote(“)设置为quotechar。不幸的是,您的文本中也有quote:
<a href ="....">
所以…在锚定标记之后,接下来的几个逗号不在引号内。你最好的办法可能是用引号(在你的文本中根本不出现)重新生成原始csv文件.希望这不是问题,因为正则表达式很难使用。我会尝试替换quotechar,如果它有效,将发布更新。替换“,和,`,`因为它们没有在文本中使用,并将quotechar改为“`”,工作起来很有魅力。很高兴它对你有效!正则表达式可能会很痛苦!
<a href ="....">