Python 使用pypdf2的Pdf解析
在使用pypdf2解析pdf文件时,它在换行符中读取诸如mm-dd-yy之类的隐藏单词,如下所示: 嗯 - dd - yy 这是我的代码:Python 使用pypdf2的Pdf解析,python,pdf,pypdf,pdf-parsing,Python,Pdf,Pypdf,Pdf Parsing,在使用pypdf2解析pdf文件时,它在换行符中读取诸如mm-dd-yy之类的隐藏单词,如下所示: 嗯 - dd - yy 这是我的代码: import PyPDF2 def getPDFContent(path): pdf = PyPDF2.PdfFileReader(file(path, "rb")) content = "" content += pdf.getPage(0).extractText() + "\n" return c
import PyPDF2
def getPDFContent(path):
pdf = PyPDF2.PdfFileReader(file(path, "rb"))
content = ""
content += pdf.getPage(0).extractText() + "\n"
return content
如何克服这个问题并将其打印在同一行?检查此问题是否未解决Yet有人帮我解决此问题吗?检查此问题是否未解决Yet有人帮我解决此问题吗?