Python 基于命名实体识别的自动文摘

Python 基于命名实体识别的自动文摘,python,nlp,spacy,ner,Python,Nlp,Spacy,Ner,我想使用命名实体识别器根据给定的数据集自动汇总机票 基本上这是我的数据集 在这里,我需要创建一个pdf格式的乘客详细信息摘要,如: PNR编号是指乘客姓名 ____在开始时间从德普机场、出发国到阿拉尔机场、出发国的旅行名称。航班号为航班号,使用 _____基本票价的客舱舱位票uuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuu 此

我想使用命名实体识别器根据给定的数据集自动汇总机票

基本上这是我的数据集

在这里,我需要创建一个pdf格式的乘客详细信息摘要,如:

PNR编号是指乘客姓名 ____在开始时间从德普机场、出发国到阿拉尔机场、出发国的旅行名称。航班号为航班号,使用 _____基本票价的客舱舱位票uuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuu

此时,应将PNR编号作为输入输入输入到第一个空格中,并且应在剩余空格中填写数据集中的相应数据

airline = pd.read_csv("AIR-LINE.csv")
def create_airline_ticket():
    c = canvas.Canvas('AIRlines.pdf')

    c.setFont("Courier", 20)
    c.drawCentredString(300, 700, 'Airline Ticket')
    c.setFont("Courier", 14)
    form = c.acroForm

    c.drawString(10, 650, 'The PNR Number')
    options = [('airline.loc[[0, 10], :]')]
    form.choice(name='choice1', tooltip='Field choice1',
                value='A',
                x=165, y=645, width=72, height=20,
                borderColor=magenta, fillColor=pink, 
                textColor=blue, forceBorder=True, options=options)

    c.save()
我考虑使用ReportLabs模块,以便使用其中可用的列表框。但事实并非如此。我得用别的办法


你能给我建议一个循序渐进的程序吗?因为我是python的初学者,所以学习起来很容易。谢谢

是的,我绝对推荐使用python的SpaCy。另一个选择是斯坦福德


我不明白你所说的推荐信是什么意思?你是说如果有人想做机票摘要?

谢谢,伙计!!我在用spaCy工作。是的,我指的是任何github链接或其他可供参考的东西?我不相信已经完成了。但是这种检测通常是通过结合计算机视觉搜索图像上的感兴趣区域并读取它们,以及每个领域的NLP分类来完成的!!还有一个疑问。我无法使用熊猫读取csv文件。FileNotFound错误总是出现。我使用了pd.read\u csvC:/Users/TAMILARASAN/Desktop/airline.csv。检查路径是否正确。我建议您始终使用参数sep读取csv文件,因此如果csv中的实体之间用分隔符分隔,您可以像pd.read_csvC:/Users/TAMILARASAN/Desktop/airline.csv,sep=',“我很高兴能够帮助您: