使用nltk统计python中csv文件中单词的出现次数

使用nltk统计python中csv文件中单词的出现次数,python,nltk,Python,Nltk,我试图计算.csv文件中单词“the”的出现次数,但当我运行 在下面的代码中,它返回0。(test.csv位于) 我只是搜索这个文件的第一列 import csv import nltk tweet = [] for t in csv.DictReader(open('test.csv'), delimiter=','): tweet.append(t['text']) tweet_text = nltk.Text(tweet) print tweet_text.count("th

我试图计算.csv文件中单词“the”的出现次数,但当我运行 在下面的代码中,它返回0。(test.csv位于)

我只是搜索这个文件的第一列

import csv
import nltk

tweet = []

for t in csv.DictReader(open('test.csv'), delimiter=','):
    tweet.append(t['text'])

tweet_text = nltk.Text(tweet)
print tweet_text.count("the")

提前感谢您的帮助。

使用将
文本
字段拆分为单词,并相应使用。并使用小写,除非您只需要小写的

>>> nltk.Text(['the world The words']).count('the')
0
>>> nltk.Text(['the', 'world', 'The', 'words']).count('the')
1
完整代码:

import csv
import nltk

tweet = []

for t in csv.DictReader(open('test.csv'), delimiter=','):
    tweet.extend(t['text'].lower().split()) # <-----------

tweet_text = nltk.Text(tweet)
print tweet_text.count('the')
导入csv
导入nltk
tweet=[]
对于csv.DictReader中的t(打开('test.csv'),分隔符=','):
extend(t['text'].lower().split())#