读取Python和UnicodeDecodeError中的大型excel文件:
我是Python新手,我正在尝试用Python阅读一个大型excel文件。我将xlsx文件转换为csv,以便与熊猫一起工作。我写了下面的代码:读取Python和UnicodeDecodeError中的大型excel文件:,python,excel,Python,Excel,我是Python新手,我正在尝试用Python阅读一个大型excel文件。我将xlsx文件转换为csv,以便与熊猫一起工作。我写了下面的代码: import pandas as pd pd.read_csv('filepath.csv') df = csv.parse("Sheet") df.head() 但它给出了这样一个错误: UnicodeDecodeError:“charmap”编解码器无法解码第28位的字节0x81:字符映射到 你能告诉我为什么会出现这个错误吗?或者你有没有阅读大型e
import pandas as pd
pd.read_csv('filepath.csv')
df = csv.parse("Sheet")
df.head()
但它给出了这样一个错误:
UnicodeDecodeError:“charmap”编解码器无法解码第28位的字节0x81:字符映射到
你能告诉我为什么会出现这个错误吗?或者你有没有阅读大型excel文件的建议?我还尝试使用openpyxl
模块,但由于Python版本的原因,我无法使用read\u
。(我使用的是Python 2.7.8)尝试使用
pd.read_csv('filepath.csv',encoding ='utf-8')
还有许多其他编码技术,如
编码='iso-8859-1'
或编码='cp1252'
或编码='latin1'
。您可以根据需要选择 使用Microsoft excel将excel保存到Unicode文本文件中
使用以下行打开文件:
df = pd.read_csv(filename,sep='\t',encoding='utf-16-le')
print(df.head())
你试过pd.read_excel吗?我试过了,但速度太慢了。我通常会将excel保存到Unicode文本文件中,然后使用pd.read_csv(文件名,sep='\t,encoding='utf-16-le')打开文本文件。当我这样做时,会发生以下错误:cparserror:error标记化数据。C错误:第3行中应该有1个字段,使用分隔符看到28个字符
pd.read\u csv('filepath.csv',sep=None,encoding='utf-8')
成功了,谢谢。但它只读取了5行,在我的文件中有超过5行。转到另存为选项并选择Unicode文本作为另存为类型。查看我添加到我发布的答案中的图像。