Python 使用pypdf2的Pdf解析_Python_Pdf_Pypdf_Pdf Parsing

Python 使用pypdf2的Pdf解析

python pdf

Python 使用pypdf2的Pdf解析,python,pdf,pypdf,pdf-parsing,Python,Pdf,Pypdf,Pdf Parsing,在使用pypdf2解析pdf文件时，它在换行符中读取诸如mm-dd-yy之类的隐藏单词，如下所示：嗯 - dd - yy 这是我的代码： import PyPDF2 def getPDFContent(path): pdf = PyPDF2.PdfFileReader(file(path, "rb")) content = "" content += pdf.getPage(0).extractText() + "\n" return c

在使用pypdf2解析pdf文件时，它在换行符中读取诸如mm-dd-yy之类的隐藏单词，如下所示：

嗯

这是我的代码：

import PyPDF2    
def getPDFContent(path):
    pdf = PyPDF2.PdfFileReader(file(path, "rb"))    
    content = ""
    content += pdf.getPage(0).extractText() + "\n"    
    return content

如何克服这个问题并将其打印在同一行？

检查此问题是否未解决Yet有人帮我解决此问题吗？检查此问题是否未解决Yet有人帮我解决此问题吗？