Python基于字符串选择PDF页面并将其复制到新文件

Python基于字符串选择PDF页面并将其复制到新文件,python,pdf,Python,Pdf,Python Noob问题。 我正在尝试筛选PDF文件“FILEIN.PDF”中包含单词“TEXT”的页面,并将这些页面复制到新文件“FILEOUT.PDF”。 我做了一些测试,并使用了我知道在FILEIN中的文本值来查看这些页面是否最终在FILEOUT中,但它们没有,我在if语句中做了什么错误导致这些页面没有在FILEOUT中显示? 谢谢 .find()返回找到的子字符串的索引,如果未找到,则返回-1。它几乎可以返回任何正数(和零)。因此,条件可以重写为 if TEST.find(“文本”)!

Python Noob问题。 我正在尝试筛选PDF文件“FILEIN.PDF”中包含单词“TEXT”的页面,并将这些页面复制到新文件“FILEOUT.PDF”。 我做了一些测试,并使用了我知道在FILEIN中的文本值来查看这些页面是否最终在FILEOUT中,但它们没有,我在if语句中做了什么错误导致这些页面没有在FILEOUT中显示? 谢谢

.find()返回找到的子字符串的索引,如果未找到,则返回-1。它几乎可以返回任何正数(和零)。因此,条件可以重写为

if TEST.find(“文本”)!=-1:

.find()返回找到的子字符串的索引,如果未找到,则返回-1。它几乎可以返回任何正数(和零)。因此,条件可以重写为


if TEST.find(“文本”)!=-1:

您检查过大写/小写“文本”吗?是的,我确保使用完全相同的大写/小写。您检查过大写/小写“文本”吗?是的,我确保使用完全相同的大写/小写。
import PyPDF2
pdfFileObj = open('FILEIN.pdf', 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
pdfReader.numPages
pdfWriter = PyPDF2.PdfFileWriter()

for pageNum in range(pdfReader.numPages):
pageObj = pdfReader.getPage(pageNum)
    TEST = pageObj.extractText()
    if TEST.find("TEXT") == 1:
        pdfWriter.addPage(pageObj)


pdfOutput = open('FILEOUT.pdf', 'wb')
pdfWriter.write(pdfOutput)
pdfOutput.close()