Python 如何使用NLP从原始文本中提取信息并推荐医学文章

Python 如何使用NLP从原始文本中提取信息并推荐医学文章,python,machine-learning,nlp,recommendation-engine,ner,Python,Machine Learning,Nlp,Recommendation Engine,Ner,我是NLP的新手,我有一堆原始数据,在所有的医学问题上都没有标记,我需要从这些数据中提取那些文本中说明的健康问题,并推荐医学文章 我想我需要为NER创建两个自定义POS标签: -车身上的位置 -问题本身 因此,如果有人问“我的头受伤了”,它会理解位置是头部,问题是它受伤了,但是如果有人问“我的腹部周围的皮肤是红色的”,它会理解位置是腹部,问题是皮肤是红色的 在我提取这些数据之后,我需要根据用户的要求推荐医学文章。 我有一些问题: 1.我是否需要一个位置和健康问题的定制pos标签,或者可以更容易地

我是NLP的新手,我有一堆原始数据,在所有的医学问题上都没有标记,我需要从这些数据中提取那些文本中说明的健康问题,并推荐医学文章

我想我需要为NER创建两个自定义POS标签:
-车身上的位置
-问题本身

因此,如果有人问“我的头受伤了”,它会理解位置是头部,问题是它受伤了,但是如果有人问“我的腹部周围的皮肤是红色的”,它会理解位置是腹部,问题是皮肤是红色的

在我提取这些数据之后,我需要根据用户的要求推荐医学文章。 我有一些问题:

1.我是否需要一个位置和健康问题的定制pos标签,或者可以更容易地完成?您将如何提取这些信息?
2.您将使用什么框架


正如我所说,我是NLP新手,我还没有决定框架,但问题不是英语的,但是我在github上发现了我的语言的WordNet克隆和命名实体语料库,因此,在推荐框架时,请记住。

首先,您需要借助PlaintextCorpusReader方法读取原始文本,并将文件ptr作为参数传递

这将创建一个nltk语料库对象,然后您可以在该语料库对象上使用所有nltk函数

您可以在中查找示例和实现