Python基于字符串选择PDF页面并将其复制到新文件_Python_Pdf

Python基于字符串选择PDF页面并将其复制到新文件

python pdf

Python基于字符串选择PDF页面并将其复制到新文件,python,pdf,Python,Pdf,Python Noob问题。我正在尝试筛选PDF文件“FILEIN.PDF”中包含单词“TEXT”的页面，并将这些页面复制到新文件“FILEOUT.PDF”。我做了一些测试，并使用了我知道在FILEIN中的文本值来查看这些页面是否最终在FILEOUT中，但它们没有，我在if语句中做了什么错误导致这些页面没有在FILEOUT中显示？谢谢 .find（）返回找到的子字符串的索引，如果未找到，则返回-1。它几乎可以返回任何正数（和零）。因此，条件可以重写为 if TEST.find（“文本”）！

Python Noob问题。我正在尝试筛选PDF文件“FILEIN.PDF”中包含单词“TEXT”的页面，并将这些页面复制到新文件“FILEOUT.PDF”。我做了一些测试，并使用了我知道在FILEIN中的文本值来查看这些页面是否最终在FILEOUT中，但它们没有，我在if语句中做了什么错误导致这些页面没有在FILEOUT中显示？谢谢

.find（）返回找到的子字符串的索引，如果未找到，则返回-1。它几乎可以返回任何正数（和零）。因此，条件可以重写为

if TEST.find（“文本”）！=-1:

.find（）返回找到的子字符串的索引，如果未找到，则返回-1。它几乎可以返回任何正数（和零）。因此，条件可以重写为

if TEST.find（“文本”）！=-1:

您检查过大写/小写“文本”吗？是的，我确保使用完全相同的大写/小写。您检查过大写/小写“文本”吗？是的，我确保使用完全相同的大写/小写。

import PyPDF2
pdfFileObj = open('FILEIN.pdf', 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
pdfReader.numPages
pdfWriter = PyPDF2.PdfFileWriter()

for pageNum in range(pdfReader.numPages):
pageObj = pdfReader.getPage(pageNum)
    TEST = pageObj.extractText()
    if TEST.find("TEXT") == 1:
        pdfWriter.addPage(pageObj)


pdfOutput = open('FILEOUT.pdf', 'wb')
pdfWriter.write(pdfOutput)
pdfOutput.close()