Python 选择PDF中的扫描页面

Python 选择PDF中的扫描页面,python,pdf,plugins,acrobat,acrobat-sdk,Python,Pdf,Plugins,Acrobat,Acrobat Sdk,我正在从事一个自动化项目,该项目要求我识别扫描PDF(图像)中的文本。我需要用python编写代码,使用Acrobat Pro DC中的识别文本功能将整个PDF(扫描)转换为可读的PDF 到目前为止,我已经用python编写了以下代码: avDoc = Dispatch("AcroExch.AVDoc") pdDoc = avDoc.GetPDDoc() app = Dispatch("AcroExch.App") app.MenuItemExecute("Cpt:CapturePages")

我正在从事一个自动化项目,该项目要求我识别扫描PDF(图像)中的文本。我需要用python编写代码,使用Acrobat Pro DC中的识别文本功能将整个PDF(扫描)转换为可读的PDF

到目前为止,我已经用python编写了以下代码:

avDoc = Dispatch("AcroExch.AVDoc")
pdDoc = avDoc.GetPDDoc()
app = Dispatch("AcroExch.App")
app.MenuItemExecute("Cpt:CapturePages")

这将打开pdf并将我带到包含“识别文本”按钮的屏幕。如何单击该按钮并获得所需的输出?

是否尝试对PDF进行OCR以使其可搜索?否。我只想使用python将扫描的PDF转换为可读的PDF。输入:扫描的pdf文件。输出:可读pdf。附言:我正在使用adobe acrobat API。@Prabal我认为Rick是对的。你在试着用光学字符识别PDF。是的,我也这么认为。你能帮我解决这个问题吗?是的,瑞克。有什么想法吗?