Python 从.doc(非docx)中提取文本

Python 从.doc(非docx)中提取文本,python,doc,Python,Doc,我检查了stackoverflow和其他文件中的大多数问题和答案。有很多方法可以使用python打开和读取.docx文件,而不是doc 我已经检查了pythondocx库,但它只支持docx 我想从.doc文件(不是docx)中打开并提取文本。请帮助我,因为我是python新手您可以使用它,它是python的Apache Tika绑定。另一个好的图书馆是图书馆 您可以使用,它是一个用于python的Apache Tika绑定。另一个好的图书馆是图书馆 这些都是有用的。Textract是用于Pyt

我检查了stackoverflow和其他文件中的大多数问题和答案。有很多方法可以使用python打开和读取.docx文件,而不是doc

我已经检查了pythondocx库,但它只支持docx


我想从.doc文件(不是docx)中打开并提取文本。请帮助我,因为我是python新手

您可以使用它,它是python的Apache Tika绑定。另一个好的图书馆是图书馆

您可以使用,它是一个用于python的Apache Tika绑定。另一个好的图书馆是图书馆

这些都是有用的。Textract是用于Python2的,不是用于Python3的。它们中没有一个是有用的。Textract用于Python2,而不是Python3。