Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/elixir/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 问答中的问题生成&x2B;自然语言处理_Python_Machine Learning_Nlp_Question Answering - Fatal编程技术网

Python 问答中的问题生成&x2B;自然语言处理

Python 问答中的问题生成&x2B;自然语言处理,python,machine-learning,nlp,question-answering,Python,Machine Learning,Nlp,Question Answering,我有一个数据集(大约3K到4K)excel文件,每个文件都有大约12K条记录,这些记录是常见问题解答、电子邮件对话、博客评论、聊天等的组合 最好的部分是,它有两个专栏,一个是问题,另一个是答案 excel中的一条示例记录-(注意-无法公开客户机数据,因此我自己只创建一条记录来解释该场景) 例如。 示例问题-印度的IIT学院是什么? 示例答案-印度理工学院(IITs)是位于印度的自治公立高等教育学院。它们受1961年《技术学院法》管辖,该法宣布它们为国家重要机构,并规定了它们的权力、职责和治理框架

我有一个数据集(大约3K到4K)excel文件,每个文件都有大约12K条记录,这些记录是常见问题解答、电子邮件对话、博客评论、聊天等的组合

最好的部分是,它有两个专栏,一个是问题,另一个是答案

excel中的一条示例记录-(注意-无法公开客户机数据,因此我自己只创建一条记录来解释该场景)

例如。 示例问题-
印度的IIT学院是什么?

示例答案-
印度理工学院(IITs)是位于印度的自治公立高等教育学院。它们受1961年《技术学院法》管辖,该法宣布它们为国家重要机构,并规定了它们的权力、职责和治理框架。1961年的《技术研究所法》列出了23个研究所。每个研究所都是自主的,通过一个共同理事会(IIT理事会)相互联系,该理事会监督它们的管理。人力资源开发部长是IIT理事会的当然主席。截至2018年,所有IITs本科生课程的总学额为11279。

客户的要求是—

从(以上示例答案)段落中生成尽可能多的简单问题及其答案,并将其附加到同一excel中

(然后,他将进一步处理每个excel,方法是将其提供给他的某个工具,该工具将生成聊天机器人故事)

例如

  • 它是自主的吗?(回答:
  • 什么支配着IIT?(答:
    1961年《技术学院法》
  • IIT位于哪个国家?(回答:
    印度
  • 《1961年技术学院法》列出了多少所学院?(回答:
    二十三个
    ) 等等
答案生成我可以使用AllenAI完成,但不确定如何生成问题? 我尝试了一个,但它看起来不完整,需要更多的努力,因为我是NLP或ML的新手,所以不知道如何做这些更改

有关于在问答中生成问题的帮助吗

我可以在现有的语言模型(如spacy的模型)之上创建任何模型来生成实体,然后生成问题吗