Python 熊猫在编写CSV时不会读取CSV
我创建了一个数据框,并希望将其导出为CSV。我用了 df.to_csv方法 当我读到我创建的csv时,它没有被很好地解析,我有一些错误 列的值相互混合 我试图更改编码和分隔符,但它失败了 解决不了我的问题 以下是我的数据帧在导出为CSV之前的示例:Python 熊猫在编写CSV时不会读取CSV,python,pandas,csv,export,Python,Pandas,Csv,Export,我创建了一个数据框,并希望将其导出为CSV。我用了 df.to_csv方法 当我读到我创建的csv时,它没有被很好地解析,我有一些错误 列的值相互混合 我试图更改编码和分隔符,但它失败了 解决不了我的问题 以下是我的数据帧在导出为CSV之前的示例: societe ... cluster 6 ACTION AIR ENVIRONNEMENT ...
societe ... cluster
6 ACTION AIR ENVIRONNEMENT ... aquavalley
7 AD NUCLEIS ... aquavalley
8 AD'OCC ... aquavalley
9 ADEQUABIO ... aquavalley
10 ADICT SOLUTIONS ... aquavalley
然后我用它导出:
csv_df.to_csv(r"path.csv", sep="\t")
要阅读它:
pd.read_csv(r"path.csv", sep="\t", engine='python')
我得到了类似的东西
7 AD NUCLEIS ... aquavalley
8 AD'OCC ... None
215 Rue 34000 Mont... contact@cc.com ... None
9 ADEQUABIO ... aquavalley
尝试将其读取为pd.read_csvpath.csv您可以尝试将参数索引添加到\u csv中: 或者一个问题可能是您的字段包含选项卡,因此在这种情况下,我建议您更改分隔符谢谢您的快速回答。我解决了我的问题 我以为我通过使用df.replace'\r',''摆脱了回车'\r'和新行'\n',但它不起作用,直到不知道为什么,所以我以为它们不起作用时它们还在这里 相反,我使用了:
df.replace(to_replace=[r"\\t|\\n|\\r", "\t|\n|\r"], value=[" "," "], regex=True)
在摆脱它之后,我没有任何问题
再次感谢你的帮助 您能发布一个引起错误的数据示例吗?至少在engine='python'之前添加逗号
df.replace(to_replace=[r"\\t|\\n|\\r", "\t|\n|\r"], value=[" "," "], regex=True)