如何在windows上将pdf转换为文本?

如何在windows上将pdf转换为文本?,windows,transform,pdftotext,Windows,Transform,Pdftotext,我有一个扫描过的pdf,我想把它转换成可编辑的文本格式。对于在Windows上执行此操作,您有什么建议吗?我正在考虑使用Linux作为Windows的子程序。还有其他想法吗?看起来您使用的是Python,因此您可能需要研究的pypi包是。基本上,您需要使用poppler之类的工具渲染pdf并从中获取图像(扫描的pdf是基于图像构建的),然后通过OCR解决方案从图像中读取文本以获取文本 我自己也没有用过这个软件包,所以这是我能给予的最大帮助。它应该在Windows和Linux中与python一起工

我有一个扫描过的pdf,我想把它转换成可编辑的文本格式。对于在Windows上执行此操作,您有什么建议吗?我正在考虑使用Linux作为Windows的子程序。还有其他想法吗?

看起来您使用的是Python,因此您可能需要研究的pypi包是。基本上,您需要使用poppler之类的工具渲染pdf并从中获取图像(扫描的pdf是基于图像构建的),然后通过OCR解决方案从图像中读取文本以获取文本

我自己也没有用过这个软件包,所以这是我能给予的最大帮助。它应该在Windows和Linux中与python一起工作