Python-如何在NLTK中解析后提取名词短语
我想使用NLTK从解析的文本中提取名词短语,但我不知道怎么做。我还在找,但还没找到。所以我必须在这里问一下 解析后的文本在列表中,如下所示:Python-如何在NLTK中解析后提取名词短语,python,text,Python,Text,我想使用NLTK从解析的文本中提取名词短语,但我不知道怎么做。我还在找,但还没找到。所以我必须在这里问一下 解析后的文本在列表中,如下所示: (S the/DT (NP phone/NN) has/VBZ a/DT (NP good/JJ screen/NN) ./.) (S (NP ipod/NN) is/VBZ the/DT best/JJS (NP mp3/NN player/NN) ./.) (S does/VBZ the/DT (NP player/NN play/NN d
(S the/DT (NP phone/NN) has/VBZ a/DT (NP good/JJ screen/NN) ./.)
(S (NP ipod/NN) is/VBZ the/DT best/JJS (NP mp3/NN player/NN) ./.)
(S
does/VBZ
the/DT
(NP player/NN play/NN dvd/NN)
with/IN
audio/JJ
and/CC
(NP video/NN)
?/.)
以前,我使用TextBlob提取名词短语,但出于某种原因,在第一句话中,“电话”没有提取,只有“良好的屏幕”。这就是为什么我要返回使用NLTK的原因。我想这就是您要寻找的:
import re
s = """(S the/DT (NP phone/NN) has/VBZ a/DT (NP good/JJ screen/NN) ./.)
(S (NP ipod/NN) is/VBZ the/DT best/JJS (NP mp3/NN player/NN) ./.)
(S
does/VBZ
the/DT
(NP player/NN play/NN dvd/NN)
with/IN
audio/JJ
and/CC
(NP video/NN)
?/.)"""
print(re.findall("(\w+)/NN", s))
re.findall()
将搜索整个字符串以查找匹配项。以上内容试图查找并返回括号中的内容,括号中的内容表示一个作品,后跟/NN
当它们在列表中时,如何查找所有内容?我忘了提那件事。我试着在名单上用它,但没有运气。你到底是什么意思,我没有理解你?