尝试让朴素贝叶斯分类器运行备用训练数据集(Python)时出错

尝试让朴素贝叶斯分类器运行备用训练数据集(Python)时出错,python,twitter,indexing,classification,Python,Twitter,Indexing,Classification,我试图让一个朴素的贝叶斯分类器处理一组用于情绪分析的tweet训练集。代码在我练习过的sample.csv文件上非常有效。然而,当我在我的培训数据csv文件(格式完全相同,只比大约7000条tweets大)上尝试时,我得到了一个索引错误 下面是特定的代码块: import csv import nltk #Read the tweets one by one and process it inpTweets = csv.reader(open('SampleTweets.csv', 'rb')

我试图让一个朴素的贝叶斯分类器处理一组用于情绪分析的tweet训练集。代码在我练习过的sample.csv文件上非常有效。然而,当我在我的培训数据csv文件(格式完全相同,只比大约7000条tweets大)上尝试时,我得到了一个索引错误

下面是特定的代码块:

import csv
import nltk

#Read the tweets one by one and process it
inpTweets = csv.reader(open('SampleTweets.csv', 'rb'), delimiter=',', quotechar='|')
tweets = []
for row in inpTweets:
    sentiment = row[0]
    tweet = row[1]
    processedTweet = processTweet(tweet)
    featureVector = getFeatureVector(processedTweet)
    tweets.append((featureVector, sentiment));
返回的错误是针对该行的

tweet=行[1]

和状态“链接索引超出范围”

它以前工作得很好,作为一名新程序员,我真的被卡住了


谢谢

如果您只更改了输入文件,那么问题可能是数据。向循环中添加一些调试语句。例如,当文件失败时,打印出文件中的行-可能有一些特殊字符,或不同的格式,或类似的内容。可能会在文件末尾添加额外的空格。用输入文件检查一次。