在一个单元格python中将PDF数据转换为csv

在一个单元格python中将PDF数据转换为csv,python,csv,pdf,Python,Csv,Pdf,我正在提取pdf的文本并将其写入csv,但它会将pdf的每一行写入不同的行。我正在使用pdf miner从pdf中提取文本,并使用csv writer将其写入csv文件。我想将一个文件的内容写入一个单元格,但将每一行写入不同的单元格。任何帮助都将不胜感激。下面是到目前为止我的代码 # -*- coding: utf-8 -*- from __future__ import unicode_literals from pdfminer.pdfinterp import PDFResourceMan

我正在提取pdf的文本并将其写入csv,但它会将pdf的每一行写入不同的行。我正在使用pdf miner从pdf中提取文本,并使用csv writer将其写入csv文件。我想将一个文件的内容写入一个单元格,但将每一行写入不同的单元格。任何帮助都将不胜感激。下面是到目前为止我的代码

# -*- coding: utf-8 -*-
from __future__ import unicode_literals
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from pdfminer.pdfpage import PDFPage
from cStringIO import StringIO
import requests
from StringIO import StringIO
import csv
import pandas as pd
from os import listdir
# exctract pdf text
def convert_pdf_to_txt(path):
    rsrcmgr = PDFResourceManager()
    retstr = StringIO()
    codec = 'utf-8'
    laparams = LAParams()
    device = TextConverter(rsrcmgr, retstr, codec=codec, laparams=laparams)
    # fp = file(path, 'rb')
    interpreter = PDFPageInterpreter(rsrcmgr, device)
    password = ""
    maxpages = 0
    caching = True
    pagenos=set()

    for page in PDFPage.get_pages(path, pagenos, maxpages=maxpages, 
        password=password,caching=caching, check_extractable=True):
        interpreter.process_page(page)

    text = retstr.getvalue()

    # fp.close()
    device.close()
    retstr.close()
    return text
# get url from csv and download it using request module
input_file = csv.DictReader(open("pdfdata.csv"))
res=[]

for row in input_file:
    try:
        filename=row['URL'].split("/")[-1].split('.')[0]
        response=requests.get(row['URL'])
        res.append([convert_pdf_to_txt(StringIO(response.content))])# call 
       pdf extractor
        break
    except Exception as e:
        pass
fl=open('newpdfdata.csv','wb')
writer = csv.writer(fl)
writer.writerow(['text'])# write header
writer.writerows(res) # write result list to csv

问题是,你必须包括一些细节,比如,从pdf中提取的数据是什么样子的,csv是什么样子的,以及你希望它是什么样子的be@RolandSmith请看我的更新谢谢highlighting@Sunitha谢谢你来见我update@Chaudhary马上我看到每个文件的每个文本提取都被写入到它自己的不同行中的一个单元格中。你想干什么?是否将所有文本提取到不同的单元格中,但只提取到一行?