Python 使用pypdf2的Pdf解析

Python 使用pypdf2的Pdf解析,python,pdf,pypdf,pdf-parsing,Python,Pdf,Pypdf,Pdf Parsing,在使用pypdf2解析pdf文件时,它在换行符中读取诸如mm-dd-yy之类的隐藏单词,如下所示: 嗯 - dd - yy 这是我的代码: import PyPDF2 def getPDFContent(path): pdf = PyPDF2.PdfFileReader(file(path, "rb")) content = "" content += pdf.getPage(0).extractText() + "\n" return c

在使用pypdf2解析pdf文件时,它在换行符中读取诸如mm-dd-yy之类的隐藏单词,如下所示:

-

dd

-

yy

这是我的代码:

import PyPDF2    
def getPDFContent(path):
    pdf = PyPDF2.PdfFileReader(file(path, "rb"))    
    content = ""
    content += pdf.getPage(0).extractText() + "\n"    
    return content

如何克服这个问题并将其打印在同一行?

检查此问题是否未解决Yet有人帮我解决此问题吗?检查此问题是否未解决Yet有人帮我解决此问题吗?