Python 从字符串中提取所有名词

Python 从字符串中提取所有名词,python,nlp,Python,Nlp,可能重复: 有没有人举过一些例子来说明如何使用Python从字符串中提取所有名词 例如,我有一个字符串:“我喜欢西红柿和莴苣”。我想构建一个返回“西红柿”和“莴苣”的方法 如果不是在Python中,有人知道其他解决方案吗?Dave Taylor使用Bash编写了一个adlib生成器,查询Princetons wordnet以完成此任务。当然,您可以使用WordNet帮助在python中执行类似的操作 这里是链接 获取包,然后使用其内置解析器;或者,更快地输入字符串并取出所有带有标记的单词NN;

可能重复:

有没有人举过一些例子来说明如何使用Python从字符串中提取所有名词

例如,我有一个字符串:“我喜欢西红柿和莴苣”。我想构建一个返回“西红柿”和“莴苣”的方法


如果不是在Python中,有人知道其他解决方案吗?

Dave Taylor使用Bash编写了一个adlib生成器,查询Princetons wordnet以完成此任务。当然,您可以使用WordNet帮助在python中执行类似的操作

这里是链接

获取包,然后使用其内置解析器;或者,更快地输入字符串并取出所有带有标记的单词
NN
;这些是名词。阅读其他词性标记,了解如何正确提取
I
like


这两种方法都不是十全十美的,但都是你能做到的最好的方法。一个好的词性标记器在干净输入时的准确率将在95%以上。我认为使用基于WordNet的方法,如果不做大量额外工作,就无法达到这样的准确度。

为什么“我”、“喜欢”和“和”会被排除在外?它们也包含名词。对不起,我和Like也应该被提取出来。@Matt Ball:不是重复的。另一个问题是如何从解析树中提取名词,OP想从字符串中提取。这适用于那篇文章中的普通示例,但不会扩展到实际的NLP任务。在Python中有更好的方法可以轻松完成这项工作。词性标记链接位于密码保护的后面。您有其他类似资源的链接吗?@2cents更新了链接。