Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/307.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/python-3.x/17.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何在Python(Mac)中将扫描的PDF转换为可搜索的PDF?e、 g.OCRMYPDF模块_Python_Python 3.x - Fatal编程技术网

如何在Python(Mac)中将扫描的PDF转换为可搜索的PDF?e、 g.OCRMYPDF模块

如何在Python(Mac)中将扫描的PDF转换为可搜索的PDF?e、 g.OCRMYPDF模块,python,python-3.x,Python,Python 3.x,我正在用python编写一个程序,可以读取pdf文档,从文档中提取文本,并使用提取的文本重命名文档。首先,扫描的pdf文档不可搜索。我想在Python上将pdf转换为可搜索的pdf,而不是使用GoogleDoc、Cisdem pdf转换器 我已经阅读了ocrmypdf模块,它可以用来解决这个问题。但是,由于知识有限,我不知道如何编写代码 我希望输出将扫描的pdf转换为可搜索的pdf。我建议通过turoial进行工作,可能需要一些时间,但应该是值得的 我不确定你到底想要什么。在我的项目中,以下设置

我正在用python编写一个程序,可以读取pdf文档,从文档中提取文本,并使用提取的文本重命名文档。首先,扫描的pdf文档不可搜索。我想在Python上将pdf转换为可搜索的pdf,而不是使用GoogleDoc、Cisdem pdf转换器

我已经阅读了ocrmypdf模块,它可以用来解决这个问题。但是,由于知识有限,我不知道如何编写代码


我希望输出将扫描的pdf转换为可搜索的pdf。

我建议通过turoial进行工作,可能需要一些时间,但应该是值得的

我不确定你到底想要什么。在我的项目中,以下设置在大多数情况下都可以正常工作

导入ocrmypdf,tesseract
def ocr(文件路径、保存路径):
ocrmypdf.ocr(文件路径、保存路径、旋转页面=True,

删除_background=True,language=“en”,deskew=True,force\u ocr=True)

&NIT关于语言:s/en/eng