Python 编写器的PyUno文件类型转换

Python 编写器的PyUno文件类型转换,python,openoffice-writer,pyuno,Python,Openoffice Writer,Pyuno,全部, 我正在修改一个python脚本(使用PyUno),该脚本将读取MSword文档(.docx)并将其转换为xml。我有一个脚本,将做我需要的一切,除了它将从文档转换为pdf。我找不到可接受的xml导出格式列表 任何帮助都将不胜感激 谢谢 :bp:这两个FilterName值生成不同的平面XML格式: OpenDocument文本平面XML MS Word 2003 XML 我通过这样做找到了这些名称: 通过进入工具->选项->高级,选中“启用宏录制”,启用宏录制 工具->宏->记录宏

全部,

我正在修改一个python脚本(使用PyUno),该脚本将读取MSword文档(.docx)并将其转换为xml。我有一个脚本,将做我需要的一切,除了它将从文档转换为pdf。我找不到可接受的xml导出格式列表

任何帮助都将不胜感激

谢谢


:bp:

这两个FilterName值生成不同的平面XML格式:

  • OpenDocument文本平面XML
  • MS Word 2003 XML
我通过这样做找到了这些名称:

  • 通过进入工具->选项->高级,选中“启用宏录制”,启用宏录制
  • 工具->宏->记录宏
  • 文件->另存为。为类型选择了各种选项
  • 命名宏,然后在生成的基本代码中检查FilterName属性
  • 请记住,.odt和.docx也是基于XML的格式,只是它们是压缩格式而不是平面格式。可以通过执行以下操作来解析这些格式的文件:

    导入操作系统
    导入xml.dom.minidom
    导入xml.parsers.expat
    进口拉链
    filepath=“in.odt”或“in.docx”
    tempDir=“path/to/temp/dir/”#根据您的系统进行更改
    使用zipfile.zipfile(文件路径“r”)作为拉链:
    拉链抽拉(tempDir)
    尝试:
    dom=xml.dom.minidom.parse(os.path.join(tempDir,“content.xml”))
    除xml.parsers.expat.expat错误外:
    #处理异常
    
    澄清:上面引用的代码使用:property name=“FilterName”和值作为“writer\u pdf\u Export”——XML文件的等效值是什么?