尝试让朴素贝叶斯分类器运行备用训练数据集（Python）时出错_Python_Twitter_Indexing_Classification

尝试让朴素贝叶斯分类器运行备用训练数据集（Python）时出错

python twitter indexing

尝试让朴素贝叶斯分类器运行备用训练数据集（Python）时出错,python,twitter,indexing,classification,Python,Twitter,Indexing,Classification,我试图让一个朴素的贝叶斯分类器处理一组用于情绪分析的tweet训练集。代码在我练习过的sample.csv文件上非常有效。然而，当我在我的培训数据csv文件（格式完全相同，只比大约7000条tweets大）上尝试时，我得到了一个索引错误下面是特定的代码块： import csv import nltk #Read the tweets one by one and process it inpTweets = csv.reader(open('SampleTweets.csv', 'rb')

我试图让一个朴素的贝叶斯分类器处理一组用于情绪分析的tweet训练集。代码在我练习过的sample.csv文件上非常有效。然而，当我在我的培训数据csv文件（格式完全相同，只比大约7000条tweets大）上尝试时，我得到了一个索引错误

下面是特定的代码块：

import csv
import nltk

#Read the tweets one by one and process it
inpTweets = csv.reader(open('SampleTweets.csv', 'rb'), delimiter=',', quotechar='|')
tweets = []
for row in inpTweets:
    sentiment = row[0]
    tweet = row[1]
    processedTweet = processTweet(tweet)
    featureVector = getFeatureVector(processedTweet)
    tweets.append((featureVector, sentiment));

返回的错误是针对该行的

tweet=行[1]

和状态“链接索引超出范围”

它以前工作得很好，作为一名新程序员，我真的被卡住了

谢谢

如果您只更改了输入文件，那么问题可能是数据。向循环中添加一些调试语句。例如，当文件失败时，打印出文件中的行-可能有一些特殊字符，或不同的格式，或类似的内容。可能会在文件末尾添加额外的空格。用输入文件检查一次。