PythonDocx并从word文档中提取编号项目

PythonDocx并从word文档中提取编号项目,python,ms-word,python-docx,Python,Ms Word,Python Docx,我试图提取Word docx文档中属于编号列表一部分的所有标题。编号列表已按Word格式化,因此当您按return键时,它会添加下一个编号。我想不出如何隔离编号的列表 例如,在下文中,我想摘录: 我是校长1 - Some text 我是校长2 这是header2.1 - Some text 谢谢 ------------ 这是一个标题 我是校长1 - Some text 我是校长2 2.1这是校长2.1 - Some text

我试图提取Word docx文档中属于编号列表一部分的所有标题。编号列表已按Word格式化,因此当您按return键时,它会添加下一个编号。我想不出如何隔离编号的列表

例如,在下文中,我想摘录: 我是校长1

- Some text
我是校长2

这是header2.1

  - Some text
谢谢

------------

这是一个标题

  • 我是校长1

    - Some text
    
  • 我是校长2

    2.1这是校长2.1

      - Some text