Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/310.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python NLP-确定多项选择题和答案_Python_Nlp_Nltk - Fatal编程技术网

Python NLP-确定多项选择题和答案

Python NLP-确定多项选择题和答案,python,nlp,nltk,Python,Nlp,Nltk,说到NLP,我是一个完全的初学者。只是想找个人给我指出正确的方向 我的文档中包含了很多选择题、选项和它们的答案(如下图) 我想建立一个程序,能够得到每个问题,它的选择和答案。问题是不是每个文档都遵循完全相同的格式/间距,所以我想构建一个能够考虑各种格式的包罗万象的程序。NLTK、scikit learn或TensorFlow中是否有任何内容可以帮助我做到这一点?什么类型的文档?如果是pdf,则需要将分析嵌入从pdf文档中提取的信息中,例如pyPDF@CLpragmatics-既有PDF文件,也

说到NLP,我是一个完全的初学者。只是想找个人给我指出正确的方向

我的文档中包含了很多选择题、选项和它们的答案(如下图)


我想建立一个程序,能够得到每个问题,它的选择和答案。问题是不是每个文档都遵循完全相同的格式/间距,所以我想构建一个能够考虑各种格式的包罗万象的程序。NLTK、scikit learn或TensorFlow中是否有任何内容可以帮助我做到这一点?

什么类型的文档?如果是pdf,则需要将分析嵌入从pdf文档中提取的信息中,例如pyPDF@CLpragmatics-既有PDF文件,也有Docx文件。我将使用pyPDF作为PDF文件,PythonDocX作为docx文件。我更不知道解析文件后该怎么做。你是否设法避免了pyPDF中的错误,它使你的解析输出没有空格?而且,由于微软使用了正确的标记,docx使得它变得更加复杂。如果你想试探性地做这件事,这意味着你首先必须收集关于如何标记多项选择题的信息(即标记上下文)。有监督的机器学习可能是一个问题,因为您需要带注释的数据来训练您的模型。也许一些无监督的集群会起作用。