Python 如何使用熊猫数据框打开csv文件

Python 如何使用熊猫数据框打开csv文件,python,pandas,csv,dataframe,Python,Pandas,Csv,Dataframe,有一个带有三列数据框的CSV格式文件。 第三列有很长的文本。 当我试图使用pandas.read\u csv message : UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 0: invalid start byte. 但是,使用打开文件没有问题 with open('file.csv', 'r', encoding='utf-8', errors = "ignore") as csvfile: 我

有一个带有三列数据框的CSV格式文件。 第三列有很长的文本。 当我试图使用
pandas.read\u csv

message : UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 0: invalid start byte.
但是,使用打开文件没有问题

with open('file.csv', 'r', encoding='utf-8', errors = "ignore") as csvfile:
我不知道如何将此数据转换为数据帧,我不认为
pandas.read_csv
正确处理此错误


那么,如何打开此文件并获取数据帧呢?

试试这个:

在文本编辑器中打开cvs文件,并确保以utf-8格式保存

然后按正常方式读取文件:

import pandas
csvfile = pandas.read_csv('file.csv', encoding='utf-8')

我会尝试使用内置的csv阅读器,然后将数据放入pandas中

import csv
with open('eggs.csv', newline='') as csvfile:
     spamreader = csv.reader(csvfile, delimiter=' ', quotechar='|')
     for row in spamreader:
         print(', '.join(row))
如果这不起作用,那么至少您可以确认这是一个csv问题,而不是编码阻塞的熊猫问题

另一个建议是确保您使用的Python3.x比2.7更好地处理编码问题


如果您能提供您的样本,我可以自己测试并相应地更新我的答案。

您可以尝试另一种编码方式,即“ISO-8859-1”

就你而言:

with open('file.csv', 'r', encoding = 'ISO-8859-1', errors = "ignore") as csvfile:
或者试试这个:

import pandas as pd
data_file = pd.read_csv("file.csv", encoding = "ISO-8859-1")
print(data_file)

您在使用pandas.read_csv()时是否指定了编码,如:pandas.read_csv(encoding=“utf-8”)?使用pandas.read_csv()@woblers是的,但我收到了相同的消息..输入read.csv()->read_csv(),您应该在这里发布一个csv文件示例-比如前5行。