Python 选择PDF中的扫描页面_Python_Pdf_Plugins_Acrobat_Acrobat Sdk

Python 选择PDF中的扫描页面

python pdf plugins

Python 选择PDF中的扫描页面,python,pdf,plugins,acrobat,acrobat-sdk,Python,Pdf,Plugins,Acrobat,Acrobat Sdk,我正在从事一个自动化项目，该项目要求我识别扫描PDF（图像）中的文本。我需要用python编写代码，使用Acrobat Pro DC中的识别文本功能将整个PDF（扫描）转换为可读的PDF 到目前为止，我已经用python编写了以下代码： avDoc = Dispatch("AcroExch.AVDoc") pdDoc = avDoc.GetPDDoc() app = Dispatch("AcroExch.App") app.MenuItemExecute("Cpt:CapturePages")

我正在从事一个自动化项目，该项目要求我识别扫描PDF（图像）中的文本。我需要用python编写代码，使用Acrobat Pro DC中的识别文本功能将整个PDF（扫描）转换为可读的PDF

到目前为止，我已经用python编写了以下代码：

avDoc = Dispatch("AcroExch.AVDoc")
pdDoc = avDoc.GetPDDoc()
app = Dispatch("AcroExch.App")
app.MenuItemExecute("Cpt:CapturePages")

这将打开pdf并将我带到包含“识别文本”按钮的屏幕。如何单击该按钮并获得所需的输出？

是否尝试对PDF进行OCR以使其可搜索？否。我只想使用python将扫描的PDF转换为可读的PDF。输入：扫描的pdf文件。输出：可读pdf。附言：我正在使用adobe acrobat API。@Prabal我认为Rick是对的。你在试着用光学字符识别PDF。是的，我也这么认为。你能帮我解决这个问题吗？是的，瑞克。有什么想法吗？