Python 如何从NLTK中标记的结果中获取前三个单词
我正在尝试将结果中的前三个单词标记为NLTK。这是按单词的使用频率排序的Python 如何从NLTK中标记的结果中获取前三个单词,python,nltk,Python,Nltk,我正在尝试将结果中的前三个单词标记为NLTK。这是按单词的使用频率排序的 导入nltk nltk.download('punkt') nltk.download('averaged\u perceptron\u tagger') raw=open('sample.txt')。read() tokens=nltk.word\u标记化(原始) text=nltk.text(标记) 令牌\u l=[w.lower()表示令牌中的w] pos=nltk.pos_标记(令牌) 仅当y在('nn')中时,位
导入nltk
nltk.download('punkt')
nltk.download('averaged\u perceptron\u tagger')
raw=open('sample.txt')。read()
tokens=nltk.word\u标记化(原始)
text=nltk.text(标记)
令牌\u l=[w.lower()表示令牌中的w]
pos=nltk.pos_标记(令牌)
仅当y在('nn')中时,位置中(x,y)的x=
freq=nltk.FreqDist(仅适用于)
打印(频率项())
结果:
口述项目([('everyone',1),('work',15),('ability',7),('determination',3),('Component',2),('Understand',1)])
我想获得
工作
,能力
,以及决心
。如何从结果中获取这三个单词?只需调用freq.most\u common(3)
,然后收集元组中的第一个项目。只需调用freq.most\u common(3)
,然后收集元组中的第一个项目
for word, frequency in freq.items().__reversed__():
print("Word:", word, "Frequency:", frequency)
这是一个字典,因此它由键值对组成。循环只是通过它进行迭代
“反转”部分按降序排序
这是一个字典,因此它由键值对组成。循环只是通过它进行迭代
“反转”部分按降序排序