Python 彻底讨论了如何使用.doc API

Python 彻底讨论了如何使用.doc API,python,python-3.x,pdf,doc,unoconv,Python,Python 3.x,Pdf,Doc,Unoconv,首先,我要说,我的python知识是初级到中级的,经过很长一段时间之后,我最近又开始使用该语言了 目标是: 今天早上我遇到了一堆word文档,我想转换并连接成PDF文件,其中2.doc文件创建了一个PDF。 这似乎是一个相当简单的任务,所以我想我应该试着学习如何用python来完成它。 连接PDF并不是太糟糕,我找到了PyPDF2并设法编写了一个脚本来实现这一点 但是7个小时后,在无数个依赖关系被破坏的脚本之后,我仍然找不到一种方法来自动化doc-pdf转换 问题: 我找到的每一个脚本: 使用p

首先,我要说,我的python知识是初级到中级的,经过很长一段时间之后,我最近又开始使用该语言了

目标是: 今天早上我遇到了一堆word文档,我想转换并连接成PDF文件,其中2.doc文件创建了一个PDF。 这似乎是一个相当简单的任务,所以我想我应该试着学习如何用python来完成它。 连接PDF并不是太糟糕,我找到了PyPDF2并设法编写了一个脚本来实现这一点

但是7个小时后,在无数个依赖关系被破坏的脚本之后,我仍然找不到一种方法来自动化doc-pdf转换

问题: 我找到的每一个脚本:

  • 使用python docx(我的文档是word 2003.docs)
  • 使用unoconv桥(我与OpenOffice一起安装了它,然后四处搜索文档,但没有找到任何文档-因此我不知道如何从python脚本或shell调用。我看到了这一点,但它不断抛出错误)
  • 使用win32com或win32com.client或pywin32等。 我在安装这些软件时遇到了很多问题,但无法从代码中导入(就像那个家伙发生的那样),现在我甚至无法在pip中找到它们。搜索了它们的文档(它们是模块还是类?我不知道),除了它们连接到ActivePython之外,我几乎什么都看不懂。(这显然是Python的超集,具有更多功能?)
  • ,我安装了它,但由于某种原因也无法使用/导入(可能我使用的pip不正确?)
  • 我知道我的问题很难集中,但老实说,现在我的大脑已经被信息过载炸了。对noob的任何简化都是非常受欢迎的

    TL;博士: 假设不了解COM内容,也没有使用任何外部框架的经验:

  • 如何将Word 2003.doc文件转换为.pdf文件?我正在Windows 10 64位计算机上运行32位Python 3.5.1
  • 从哪里可以了解到更多关于从python访问其他软件API的信息?了解操作系统如何在较低级别上工作这样的东西有很大的先决条件吗

  • 谢谢

    根据我的经验,各种office格式之间的转换最好在python之外完成。使用子流程模块,您可以调用外部命令

    soffice --convert-to pdf file.doc  --headless
    
    其中soffice是LibreOffice附带的命令