使用nltk统计python中csv文件中单词的出现次数_Python_Nltk

使用nltk统计python中csv文件中单词的出现次数

python

使用nltk统计python中csv文件中单词的出现次数,python,nltk,Python,Nltk,我试图计算.csv文件中单词“the”的出现次数，但当我运行在下面的代码中，它返回0。（test.csv位于）我只是搜索这个文件的第一列 import csv import nltk tweet = [] for t in csv.DictReader(open('test.csv'), delimiter=','): tweet.append(t['text']) tweet_text = nltk.Text(tweet) print tweet_text.count("th

我试图计算.csv文件中单词“the”的出现次数，但当我运行在下面的代码中，它返回0。（test.csv位于）

我只是搜索这个文件的第一列

import csv
import nltk

tweet = []

for t in csv.DictReader(open('test.csv'), delimiter=','):
    tweet.append(t['text'])

tweet_text = nltk.Text(tweet)
print tweet_text.count("the")

提前感谢您的帮助。

使用将

文本

字段拆分为单词，并相应使用。并使用小写，除非您只需要小写的

>>> nltk.Text(['the world The words']).count('the')
0
>>> nltk.Text(['the', 'world', 'The', 'words']).count('the')
1

完整代码：

import csv
import nltk

tweet = []

for t in csv.DictReader(open('test.csv'), delimiter=','):
    tweet.extend(t['text'].lower().split()) # <-----------

tweet_text = nltk.Text(tweet)
print tweet_text.count('the')

导入csv
导入nltk
tweet=[]
对于csv.DictReader中的t（打开（'test.csv'），分隔符='，'）：
extend（t['text'].lower（）.split（））#