如何在Python(Mac)中将扫描的PDF转换为可搜索的PDF?e、 g.OCRMYPDF模块
我正在用python编写一个程序,可以读取pdf文档,从文档中提取文本,并使用提取的文本重命名文档。首先,扫描的pdf文档不可搜索。我想在Python上将pdf转换为可搜索的pdf,而不是使用GoogleDoc、Cisdem pdf转换器 我已经阅读了ocrmypdf模块,它可以用来解决这个问题。但是,由于知识有限,我不知道如何编写代码如何在Python(Mac)中将扫描的PDF转换为可搜索的PDF?e、 g.OCRMYPDF模块,python,python-3.x,Python,Python 3.x,我正在用python编写一个程序,可以读取pdf文档,从文档中提取文本,并使用提取的文本重命名文档。首先,扫描的pdf文档不可搜索。我想在Python上将pdf转换为可搜索的pdf,而不是使用GoogleDoc、Cisdem pdf转换器 我已经阅读了ocrmypdf模块,它可以用来解决这个问题。但是,由于知识有限,我不知道如何编写代码 我希望输出将扫描的pdf转换为可搜索的pdf。我建议通过turoial进行工作,可能需要一些时间,但应该是值得的 我不确定你到底想要什么。在我的项目中,以下设置
我希望输出将扫描的pdf转换为可搜索的pdf。我建议通过turoial进行工作,可能需要一些时间,但应该是值得的 我不确定你到底想要什么。在我的项目中,以下设置在大多数情况下都可以正常工作
导入ocrmypdf,tesseract
def ocr(文件路径、保存路径):
ocrmypdf.ocr(文件路径、保存路径、旋转页面=True,
删除_background=True,language=“en”,deskew=True,force\u ocr=True)
&NIT关于语言:s/en/eng