Python 表格问题如何提取分布在多个页面中的pdf表格数据

Python 表格问题如何提取分布在多个页面中的pdf表格数据,python,pypdf2,tabula-py,Python,Pypdf2,Tabula Py,我正在尝试使用以下表格从pdf中提取所有表格数据: df=tabla.read\u ptabula.read\u pdf(test\u pdf,stream=True,multiple tables=True,pages=“all”) pdf有3个表格。第二张表格共2页。 当我尝试len(df)时,它返回4而不是3 扩展页上第二个表数据的第一行作为标题返回 如何将数据作为同一表格从标题提取到最后一行hello。你找到解决办法了吗?

我正在尝试使用以下表格从pdf中提取所有表格数据: df=tabla.read\u ptabula.read\u pdf(test\u pdf,stream=True,multiple tables=True,pages=“all”)

pdf有3个表格。第二张表格共2页。 当我尝试len(df)时,它返回4而不是3 扩展页上第二个表数据的第一行作为标题返回
如何将数据作为同一表格从标题提取到最后一行

hello。你找到解决办法了吗?