如何在Python（Mac）中将扫描的PDF转换为可搜索的PDF？e、 g.OCRMYPDF模块_Python_Python 3.x

如何在Python（Mac）中将扫描的PDF转换为可搜索的PDF？e、 g.OCRMYPDF模块

python python-3.x

如何在Python（Mac）中将扫描的PDF转换为可搜索的PDF？e、 g.OCRMYPDF模块,python,python-3.x,Python,Python 3.x,我正在用python编写一个程序，可以读取pdf文档，从文档中提取文本，并使用提取的文本重命名文档。首先，扫描的pdf文档不可搜索。我想在Python上将pdf转换为可搜索的pdf，而不是使用GoogleDoc、Cisdem pdf转换器我已经阅读了ocrmypdf模块，它可以用来解决这个问题。但是，由于知识有限，我不知道如何编写代码我希望输出将扫描的pdf转换为可搜索的pdf。我建议通过turoial进行工作，可能需要一些时间，但应该是值得的我不确定你到底想要什么。在我的项目中，以下设置

我正在用python编写一个程序，可以读取pdf文档，从文档中提取文本，并使用提取的文本重命名文档。首先，扫描的pdf文档不可搜索。我想在Python上将pdf转换为可搜索的pdf，而不是使用GoogleDoc、Cisdem pdf转换器

我已经阅读了ocrmypdf模块，它可以用来解决这个问题。但是，由于知识有限，我不知道如何编写代码

我希望输出将扫描的pdf转换为可搜索的pdf。

我建议通过turoial进行工作，可能需要一些时间，但应该是值得的

我不确定你到底想要什么。在我的项目中，以下设置在大多数情况下都可以正常工作

导入ocrmypdf，tesseract
def ocr（文件路径、保存路径）：
ocrmypdf.ocr（文件路径、保存路径、旋转页面=True，
删除_background=True，language=“en”，deskew=True，force\u ocr=True）

&NIT关于语言：s/en/eng