Tensorflow 从n个不同的描述中生成一组名词和动词,列出与名词和动词匹配的描述

Tensorflow 从n个不同的描述中生成一组名词和动词,列出与名词和动词匹配的描述,tensorflow,machine-learning,nlp,deep-learning,nltk,Tensorflow,Machine Learning,Nlp,Deep Learning,Nltk,我是NLP的新手,我有关于应用程序名称及其描述的专栏。数据如下所示 app1,说明1(app1的一些信息,它是如何工作的) 附录2,说明2 . . 应用程序(n),说明(n) 根据这些描述,我需要生成一组有限的名词和动词。在最后一个应用程序中,当我们将此列表中的名词和动词配对时,输出应该是满足该名词+动词的应用程序列表。 我不知道从哪里开始,你能告诉我从哪里开始吗。谢谢。在句子中查找词的形态句法类别的任务称为词性(或词性)标记。 在您的情况下,您可能还需要首先标记文本 为此,您可以使用或(以及其

我是NLP的新手,我有关于应用程序名称及其描述的专栏。数据如下所示
app1,说明1(app1的一些信息,它是如何工作的)
附录2,说明2
.
.
应用程序(n),说明(n)
根据这些描述,我需要生成一组有限的名词和动词。在最后一个应用程序中,当我们将此列表中的名词和动词配对时,输出应该是满足该名词+动词的应用程序列表。
我不知道从哪里开始,你能告诉我从哪里开始吗。谢谢。

在句子中查找词的形态句法类别的任务称为词性(或词性)标记。 在您的情况下,您可能还需要首先标记文本

为此,您可以使用或(以及其他工具)

注意,根据您使用的模型,名词(单数名词、复数名词、专有名词)和动词(取决于时态和人称)可以有几个标签

NLTK示例:

import nltk

description = "This description describes apps with words."
tokenized_description = nltk.word_tokenize(description)
tagged_description = nltk.pos_tag(tokenized_description)
#tagged_description:
# [('This', 'DT'), ('description', 'NN'), ('describes', 'VBZ'), ('apps', 'RP'), ('with', 'IN'), ('words', 'NNS'), ('.', '.')]

# map the tags to a smaller set of tags
universal_tags_description = [(word, nltk.map_tag("wsj", "universal", tag)) for word, tag in tagged_description]  
# universal_tags_description:
# [('This', 'DET'), ('description', 'NOUN'), ('describes', 'VERB'), ('apps', 'PRT'), ('with', 'ADP'), ('words', 'NOUN'), ('.', '.')]
filtered = [(word, tag) for word, tag in universal_tags_description if tag in {'NOUN', 'VERB'}]
# filtered: 
# [('description', 'NOUN'), ('describes', 'VERB'), ('words', 'NOUN')]