Python 您将如何从文本数据中识别身体部位和受伤类型?

Python 您将如何从文本数据中识别身体部位和受伤类型?,python,nlp,nltk,Python,Nlp,Nltk,我发布这篇文章是想获得一些想法,但我想浏览一些文本,找出如何标记身体部位和受伤部位。你知道我该怎么做吗 例如,如果我有这样一段文字:“奇才队后卫约翰·沃尔将接受手术,以修复断裂的左跟腱。该手术将由威斯康星州格林湾的罗伯特·安德森博士进行,但尚未安排。沃尔预计将在手术后大约12个月内恢复全面的篮球活动。” 我想拔掉约翰·沃尔和左跟腱,你们觉得我该怎么做呢?我想你们应该为Python使用NLTK或Spacy软件包 NLTK库只是一个词性标记器。它将用已识别的名词、动词和副词对输入字符串进行注释。自然

我发布这篇文章是想获得一些想法,但我想浏览一些文本,找出如何标记身体部位和受伤部位。你知道我该怎么做吗

例如,如果我有这样一段文字:“奇才队后卫约翰·沃尔将接受手术,以修复断裂的左跟腱。该手术将由威斯康星州格林湾的罗伯特·安德森博士进行,但尚未安排。沃尔预计将在手术后大约12个月内恢复全面的篮球活动。”


我想拔掉约翰·沃尔和左跟腱,你们觉得我该怎么做呢?

我想你们应该为Python使用NLTK或Spacy软件包


NLTK库只是一个词性标记器。它将用已识别的名词、动词和副词对输入字符串进行注释。自然语言的问题是,内部结构遵循特定领域的知识,这些知识必须在本体中进行形式化。更好的工具是Protege,它是一个本体构建器。这意味着您需要为您的应用程序构建一个本体,->运动伤害