如何使用python将pdf文件转换为excel文件

如何使用python将pdf文件转换为excel文件,python,csv,export-to-csv,tabula,convertto-json,Python,Csv,Export To Csv,Tabula,Convertto Json,我想将pdf文件转换为excel,并通过python将其保存在本地。 我已将pdf转换为excel格式,但如何将其保存到本地 我的代码: 您可以指定整个输出路径,而不是仅指定output.csv 希望这能回答你的问题 您可以指定整个输出路径,而不仅仅是output.csv 希望这能回答你的问题 说: 输出文件将保存到输出路径中 输出路径是第二个参数test.csv。我想它很好用,但你把它放错文件夹了。因为您没有指定完整路径,所以它将位于要严格控制的脚本附近 说: 输出文件将保存到输出路径中 输出

我想将pdf文件转换为excel,并通过python将其保存在本地。 我已将pdf转换为excel格式,但如何将其保存到本地

我的代码:


您可以指定整个输出路径,而不是仅指定output.csv


希望这能回答你的问题

您可以指定整个输出路径,而不仅仅是output.csv

希望这能回答你的问题

说:

输出文件将保存到输出路径中

输出路径是第二个参数test.csv。我想它很好用,但你把它放错文件夹了。因为您没有指定完整路径,所以它将位于要严格控制的脚本附近

说:

输出文件将保存到输出路径中


输出路径是第二个参数test.csv。我想它很好用,但你把它放错文件夹了。因为您没有指定完整路径,所以它将位于要严格控制的脚本附近

在我的例子中,下面的脚本起了作用:

进口表格 df=tabla.read\u pdfr'C:\Users\user\Downloads\folder\3.pdf',pages='all' 表格转换为r'C:\Users\user\Downloads\folder\3.pdf',r'C:\Users\user\Downloads\folder\test.csv',输出格式=csv,页面=all',流=True
在我的例子中,下面的脚本起了作用:

进口表格 df=tabla.read\u pdfr'C:\Users\user\Downloads\folder\3.pdf',pages='all' 表格转换为r'C:\Users\user\Downloads\folder\3.pdf',r'C:\Users\user\Downloads\folder\test.csv',输出格式=csv,页面=all',流=True
我的代码是下面的代码,但它不是在阅读所有的PDF页面,只是中间的几个页面。我做错了什么

import tabula

df = tabula.read_pdf(r'C:\Users\user\Downloads\folder\3.pdf', pages='all')
tabula.convert_into(r'C:\Users\user\Downloads\folder\3.pdf', r'C:\Users\user\Downloads\folder\test.csv' , output_format="csv",pages='all', stream=True)

我的代码是下面的代码,但它不是在阅读所有的PDF页面,只是中间的几个页面。我做错了什么

import tabula

df = tabula.read_pdf(r'C:\Users\user\Downloads\folder\3.pdf', pages='all')
tabula.convert_into(r'C:\Users\user\Downloads\folder\3.pdf', r'C:\Users\user\Downloads\folder\test.csv' , output_format="csv",pages='all', stream=True)
PDF至.xlsx文件:

for item in df:
   list1.append(item)
df = pd.DataFrame(list1)
df.to_excel('outputfile.xlsx', sheet_name='Sheet1', index=True)
PDF至.xlsx文件:

for item in df:
   list1.append(item)
df = pd.DataFrame(list1)
df.to_excel('outputfile.xlsx', sheet_name='Sheet1', index=True)