在Amazon EMR实例上安装textract时出现问题(它有CentOS)。

在Amazon EMR实例上安装textract时出现问题(它有CentOS)。,centos,Centos,所以,当我试图在AmazonEMR实例中安装textract时,我面临着这个问题。我在网络上尝试了几乎所有可能的解决方案,但似乎没有什么对我有效。有人能帮忙吗 命令-sudopip安装textract 错误- 滑动压痕 deps/sphinxbase/src/libsphinxad/ad_pulse.c:44:30:致命错误:pulse/pulseaudio.h:没有这样的文件或目录 #包括 ^ 编译终止。 错误:命令“gcc”失败,退出状态为1 -----------------------

所以,当我试图在AmazonEMR实例中安装textract时,我面临着这个问题。我在网络上尝试了几乎所有可能的解决方案,但似乎没有什么对我有效。有人能帮忙吗

命令-
sudopip安装textract

错误-
滑动压痕
deps/sphinxbase/src/libsphinxad/ad_pulse.c:44:30:致命错误:pulse/pulseaudio.h:没有这样的文件或目录
#包括
^
编译终止。
错误:命令“gcc”失败,退出状态为1
----------------------------------------

命令“/usr/bin/python2.7-u-c”导入setuptools,标记化__文件“\uuux=”/mnt/tmp/pip-build-3dsfXm/pocketsphinx/setup.py”;f=getattr(标记化“打开”,打开)(_文件);code=f.read().replace('\r\n','\n');f、 close();exec(compile(code,_ufile,_uu,'exec'))“安装--record/tmp/pip-lW6lBv-record/install-record.txt--外部管理的单一版本--compile”失败,错误代码为/mnt/tmp/pip-build-3dsfXm/pocketsphinx/
延迟回答-但仍可能对您有所帮助

面临类似问题-通过安装以下依赖项解决:

sudo apt-get install python-dev libxml2-dev libxslt1-dev antiword unrtf poppler-utils pstotext tesseract-ocr flac ffmpeg lame libmad0 libsox-fmt-mp3 sox libjpeg-dev libpulse-dev swig
文本摘要文档中缺少的是libpulse dev

sudo apt-get install libpulse-dev
在以下链接中也解决了此问题:
没有真正的答案。不幸的是,目前Amazon Linux AMI实例不支持
libpulse dev

我自己解决了这个问题——留下答案,以防将来有人发现并需要它

sudo yum install -y pulseaudio-libs-devel python-devel libxml2-devel libxslt-devel poppler poppler-utils

这让我至少可以从PDF中提取文本,这是我的主要目标

同意!它不见了