Python 熊猫:解析损坏的.xls文件

Python 熊猫:解析损坏的.xls文件,python,excel,pandas,dataframe,Python,Excel,Pandas,Dataframe,我正在使用pandas读取.xls文件并将表提取到df中。(我可以用Excel打开它,但它会弹出一个窗口:.xls文件无法访问。该文件可能已损坏、位于没有响应的服务器上或只读异常。) 一般来说,它的Microsoft Excel 97-2003工作表(.xls) 代码: 错误: pd.ExcelFile(name) : raise XLRDError('Unsupported format, or corrupt file: ' + msg) xlrd.biffh.XLRDError:

我正在使用pandas读取.xls文件并将表提取到df中。(我可以用Excel打开它,但它会弹出一个窗口:.xls文件无法访问。该文件可能已损坏、位于没有响应的服务器上或只读异常。)

一般来说,它的Microsoft Excel 97-2003工作表(.xls)

代码:

错误:

pd.ExcelFile(name) :

    raise XLRDError('Unsupported format, or corrupt file: ' + msg)
xlrd.biffh.XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\xc1\xc5  \t\xc7\xed\xcf'

or  (with rea_html)
  File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\html.py", line 545, in _parse_tables
    raise ValueError("No tables found")
ValueError: No tables found
但是,正如错误消息所说,文件的前8个字节是“\xc1\xc5”。。。这绝对不是Excel.xls格式


有没有办法继续处理这些文件?

虽然我对这些东西不熟悉;我首先意识到下面有一个语法错误。它应该是“pd.read\u excel”

excels=[pd.read\u exel(name)表示文件路径中的名称]


我能说的第二件事是;“pd.read_html()”可以读取损坏的xls文件。我希望它能帮上忙。

你希望它能做什么?如果你甚至不能弄清楚这些数据是什么,那么你就不能告诉计算机怎么做。我想指出的是,您并没有将搜索限制在
.xls
文件。“你试图打开所有东西。@TimRoberts说得好,谢谢,我修改了代码,使它更吸引人。我的文件夹中只有xls文件,所以我只读取它们。如果文件正常打开并在Exel\Hex编辑器中工作,我如何才能确定数据是什么?啊,我错过了Excel在抱怨后能够打开它的事实。旧的Office文档都以十六进制D0 CF 11 E0开头。没有档案,我猜不到。
pd.ExcelFile(name) :

    raise XLRDError('Unsupported format, or corrupt file: ' + msg)
xlrd.biffh.XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\xc1\xc5  \t\xc7\xed\xcf'

or  (with rea_html)
  File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\io\html.py", line 545, in _parse_tables
    raise ValueError("No tables found")
ValueError: No tables found