使用pythonpymupdf(fitz)迭代行,检查行的长度,如果满足条件,则添加句点

使用pythonpymupdf(fitz)迭代行,检查行的长度,如果满足条件,则添加句点,python,pymupdf,Python,Pymupdf,尝试遍历PyMuPDF库中页面的每一行以检查句子的长度,如果少于10个单词,那么我想添加一个句号。 Psuedo代码应为: #loop through the lines of the PDF #check number of words in line #if line has less than 10 words #add period 真实代码如下: import fitz myfile = "my.pdf" doc =fitz.open(myfile) pag

尝试遍历PyMuPDF库中页面的每一行以检查句子的长度,如果少于10个单词,那么我想添加一个句号。 Psuedo代码应为:

#loop through the lines of the PDF
#check number of words in line
#if line has less than 10 words 
#add period 
真实代码如下:

import fitz
myfile = "my.pdf"
doc  =fitz.open(myfile)
page=doc[0]
for page in doc:
    text = page.getText("text")
    print(text)
当我添加另一个for循环时,例如
对于页面中的行:

我收到一个错误,说页面不可编辑。我还有别的办法吗


谢谢

为了在页面行上进行迭代,您可以使用getDisplayList:

page_display = page.getDisplayList()
dictionary_elements = page_display.getTextPage().extractDICT()
for block in dictionary_elements['blocks']:
    for line in block['lines']:
        line_text = ''
        for span in line['spans']:
             line_text += ' ' + span['text]
        print(l