哪些Python库用于分析doc和docx文件?
我正在编写一个doc和docx解析器。需要获取关于这些格式的文档的各种元数据。例如,对于docx,我需要获取XML代码并继续使用标记。告诉我解决问题的方法?像python docx这样的解决方案并不合适,因为它们只处理文本。如果您需要原始哪些Python库用于分析doc和docx文件?,python,docx,doc,Python,Docx,Doc,我正在编写一个doc和docx解析器。需要获取关于这些格式的文档的各种元数据。例如,对于docx,我需要获取XML代码并继续使用标记。告诉我解决问题的方法?像python docx这样的解决方案并不合适,因为它们只处理文本。如果您需要原始docx数据,您可能会在底层使用它,即使用打开文件和读取元数据
docx
数据,您可能会在底层使用它,即使用打开文件和读取元数据