Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/xml/15.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 3.x 如何使用python 3识别以word文档结尾的页面?_Python 3.x_Python Docx - Fatal编程技术网

Python 3.x 如何使用python 3识别以word文档结尾的页面?

Python 3.x 如何使用python 3识别以word文档结尾的页面?,python-3.x,python-docx,Python 3.x,Python Docx,需要识别word文档中的页面何时结束,并使用其他文本(如PAGEEND)标记它 我能够使用以下代码迭代段落: from docx.api import Document from docx.enum.text import WD_BREAK inputfile = 'test.docx' document = Document(inputfile) for paragraph in document.paragraphs: # Write paragraph text into

需要识别word文档中的页面何时结束,并使用其他文本(如PAGEEND)标记它

我能够使用以下代码迭代段落:

from docx.api import Document    
from docx.enum.text import WD_BREAK

inputfile = 'test.docx'
document = Document(inputfile)
for paragraph in document.paragraphs:
    # Write paragraph text into new document
    # Write additional text as PARAEND_<<ParaNumber>>
来自docx.api导入文档的

从docx.enum.text导入WD_BREAK
inputfile='test.docx'
文档=文档(输入文件)
对于文件中的段落。段落:
#将段落文本写入新文档
#写额外的文字作为副词_

如何对每个页面执行相同的操作?

简单的回答是,在
python docx中不可能可靠地执行,因为确定页面边界是(运行时)页面渲染引擎的一项功能,而不是在.docx文件本身中表示

这个问题的答案中有更多细节:

还有这个:

感谢您的回复。你说得对。我们无法可靠地提取页面结尾。仍在寻找可能的方法。您在以下链接中的答案提到了使用版本2.7的方法。您有python 3.0的解决方案吗?