Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/python-2.7/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
File io 如何从pdf文件中逐行读取txt_File Io_Python 2.7 - Fatal编程技术网

File io 如何从pdf文件中逐行读取txt

File io 如何从pdf文件中逐行读取txt,file-io,python-2.7,File Io,Python 2.7,这不是将pdf内容写入txt文件。。。我该怎么做?反复浏览每一页并调用extractText()如下所示: import pyPdf f= open('jayabal_appt.pdf','rb') pdfl = pyPdf.PdfFileReader(f) output = pyPdf.PdfFileWriter() content="" for i in range(0,1): content += pdfl.getPage(i).extractText() + "\n" outp

这不是将pdf内容写入txt文件。。。我该怎么做?

反复浏览每一页并调用
extractText()
如下所示:

import pyPdf 
f= open('jayabal_appt.pdf','rb')
pdfl = pyPdf.PdfFileReader(f)
output = pyPdf.PdfFileWriter()
content=""
for i in range(0,1):
    content += pdfl.getPage(i).extractText() + "\n"
outpu = open('b.txt','wb')
outpu.write(content)
f.close()
outpu.close()     
获得完整内容后,可以通过“\n”分隔符轻松拆分行

编辑:
在for循环之后检查变量
contents
是否包含任何文本。并非所有PDF文件都包含文本信息。

import pyPdf f=open('jayabal_appt.PDF','rb')pdfl=pyPdf.PdfFileReader(f)output=pyPdf.PdfFileWriter()content=”“对于范围(0,1)内的i:content+=pdfl.getPage(i).extractText()+“\n”output.addPage(pdfl.getPage(0))outpu=open('b.txt','wb')outpu.write(content)f.close()outpu.close()这对吗?@VenkatramanK请更新您的问题并在那里添加格式化的代码。但从我所了解到的情况来看,您的代码中有一些拼写错误。
content = ""
for i in range(0, num_pages):
    content += pdfl.getPage(i).extractText() + "\n"