无法在Python 3.6上安装pdftotext,缺少poppler

无法在Python 3.6上安装pdftotext,缺少poppler,python,installation,pdftotext,Python,Installation,Pdftotext,如何正确安装pdftotext 在Python3.6中安装pdftotext时,我收到以下错误消息。我还试图通过下载zip文件手动安装该软件包,但仍然出现相同的错误 pdftotext/pdftotext.cpp(4): fatal error C1083: Cannot open include file: 'poppler/cpp/poppler-document.h': No such file or directory error: command 'C:\\Program Fi

如何正确安装pdftotext

在Python3.6中安装pdftotext时,我收到以下错误消息。我还试图通过下载zip文件手动安装该软件包,但仍然出现相同的错误

  pdftotext/pdftotext.cpp(4): fatal error C1083: Cannot open include file: 'poppler/cpp/poppler-document.h': No such file or directory
  error: command 'C:\\Program Files (x86)\\Microsoft Visual Studio 14.0\\VC\\BIN\\x86_amd64\\cl.exe' failed with exit status 2     

我在pdftotext包的Readme.md文件中找到了一些帮助:

1) 安装操作系统依赖项:

在Debian、Ubuntu和friends上:

sudo apt-get update
sudo apt-get install build-essential libpoppler-cpp-dev pkg-config python-dev
sudo yum install gcc-c++ pkgconfig poppler-cpp-devel python-devel redhat-rpm-config
戴上软呢帽、红帽和朋友:

sudo apt-get update
sudo apt-get install build-essential libpoppler-cpp-dev pkg-config python-dev
sudo yum install gcc-c++ pkgconfig poppler-cpp-devel python-devel redhat-rpm-config
2) 进行正常安装:

pip install pdftotext

下面的命令为我解决了这个问题

sudo apt-get install libpoppler-cpp-dev

对于mac操作系统: brew为Ubuntu用户安装poppler

sudo apt-get install libpoppler58=0.41.0-0ubuntu1 libpoppler-dev libpoppler-cpp-dev

为我工作了几天来,我一直在想如何在Win10上安装pdftotext。互联网搜索什么也没给我。因此,对于那些需要知道的人,这里是在Win10上使用Anaconda安装pdftotext。YMMV

安装anacondapython。有很多关于安装Anaconda的文章,所以我不在这里讨论

尝试运行PIP安装PDFTOTE,您将得到微软Visual C++所需的错误。

在浏览器中导航到。在VisualStudio2019的工具选项卡下,下载VisualStudio2019的构建工具。然后,通过检查C++构建工具选项框并点击安装。 现在应该让pip安装越过VC++错误。不幸的是,您现在会遇到错误“无法打开包含文件:'poppler/cpp/poppler document.h'。这是因为您缺少poppler库

回到Internet!您需要windows的poppler。在撰写本文时,您最好的选择是。获取最新的二进制文件,并解压缩它。如果您看到错误,pip正在{Anaconda3 directory}查找头文件\include\poppler\cpp\poppler document.h。因此,请查看刚刚解压缩的归档文件。在include文件夹中,您将看到一个poppler目录。如果您进入其中的cpp目录,您将找到poppler document.h文件

我将整个poppler目录复制到Anaconda3\include文件夹中,请执行此操作

如果您再次尝试运行pip安装,您仍然会收到大量错误!但这些不是您以前看到的任何错误,而是查找丢失的链接库poppler-cpp.lib。通过另一台计算机上的Conda安装进行搜索,在poppler包中找到了此文件。因此

conda安装-c conda forge poppler

它将安装我们的poppler-cpp.lib文件。然后我们可以从它的主目录{Anaconda3 directory}\Library\lib\poppler-cpp.lib复制该文件,并将其粘贴到pdftotext期望它位于{Anaconda3 directory}\libs的位置

如果我们再次进行pip安装pdftotext,就是这样!我相信有人会找到一种方法来改进它,但是现在我们在Win10上有一个工作的pdftotext Python库


在我的博客

简易windows解决方案中,可以找到这些说明和屏幕截图:

  • 从下载poppler zip文件
  • 从下载并安装visual studio工具
  • 将文件夹
    \poppler-0.68.0\bin
    设置为环境变量中的路径

  • 就是这样。重新启动您的环境,例如jupyter笔记本、vscode等。请欣赏

    您需要安装poppler。我不确定pdftotext是否支持windows。github页面仅列出linux的安装依赖项。非常感谢。对我也有帮助。非常感谢您在您的博客上提供的详细说明,我遵循了步骤和步骤能够安装Win 10x64的LIB。在安装C++ C++构建工具时,我只想添加一件事,我以前没有检查所有4个可选组件,但是它不工作W/O,所以在博客中也需要提到它们。它们的确切名称是:MSVC V142VS 2019 C++X64 /x86构建工具,Windows 10 SDK。(10.0.18362.0)C++开发了Windows的工具,测试工具的核心特性-构建工具感谢HARSHAD的反馈,并为它工作了。我会看一下指令并让它们更新。作为说明,有一个PR合并到项目中,以便在Windows上安装更容易,最终将使它成为PyPI。t还希望为Windows生成预编译的二进制文件,没有预期的时间表。嘿,伙计,非常感谢这些步骤,在conda安装-c conda forge poppler步骤之前,一切都运行得很好。收集包元数据(current_repodata.json):完成解决环境:使用初始冻结解决失败。使用灵活解决重试。解决环境:使用当前_repodata.json中的repodata失败,将使用下一个repodata源重试。正在收集包元数据(repodata.json):完成解决环境:初始冻结解决失败。使用灵活解决重试。解决环境:-发现冲突!查找不兼容的包…然后继续检查一堆东西,它已经连续运行了10个小时,但仍然没有完成。知道发生了什么事吗?这对我在win10,thanks!该博客已不再维护。请在此处下载:这对我安装很有用。