当文档包含图像时,使用python docx读取文本的问题

当文档包含图像时,使用python docx读取文本的问题,python,ubuntu,docx,python-docx,Python,Ubuntu,Docx,Python Docx,我在解析包含图像的文档中的文本时遇到问题 我在运行Ubuntu12.04.4LTS(GNU/Linux 3.2.0-60-generic x86_64)的UbuntuLinux机器上使用PythonDocx的0.7.0版 我用这个逻辑: ``` ``` 当存在映像时,此过程将失败 我做错了什么吗?python docx应该支持您在这里尝试做的事情。如果您提供在引发错误时获得的堆栈跟踪,我将进行查看 顺便说一句,您可以更优雅地将其编码为: document = Document(path) tex

我在解析包含图像的文档中的文本时遇到问题

我在运行Ubuntu12.04.4LTS(GNU/Linux 3.2.0-60-generic x86_64)的UbuntuLinux机器上使用PythonDocx的0.7.0版

我用这个逻辑:

```

```

当存在映像时,此过程将失败


我做错了什么吗?

python docx
应该支持您在这里尝试做的事情。如果您提供在引发错误时获得的堆栈跟踪,我将进行查看

顺便说一句,您可以更优雅地将其编码为:

document = Document(path)
text = '\n'.join([para.text for para in document.paragraphs])

您应在此处提供错误跟踪。“失败”有很多含义。另外,检查文档和库的已知问题,看看它们是否支持使用图像解析文档。我似乎无法让它在使用相同文件时失败。我必须进行更多调查,看看是什么导致了问题。我们将对python docx代码的调用封装在另一个使用argparse设置的脚本的调用中。我可能需要展开日志记录子脚本,看看是否可以找出导致问题的原因。
document = Document(path)
text = '\n'.join([para.text for para in document.paragraphs])