无法上载用于WEKA分析的CSV文件-java

无法上载用于WEKA分析的CSV文件-java,java,csv,machine-learning,data-mining,weka,Java,Csv,Machine Learning,Data Mining,Weka,我正在做一个大数据分析项目,我被困在这一点上 我正在尝试上载一个包含数据的CSV文件,并希望使用WEKA java API执行分析。我希望标记文本,删除停止词,识别词性,过滤名词 我不知道为什么我会看到这个错误。解释和解决这将是伟大的! 但是我看到了下面的错误 Error: Exception in thread "main" java.io.IOException: wrong number of values. Read 21, expected 20, read Token[EO

我正在做一个大数据分析项目,我被困在这一点上 我正在尝试上载一个包含数据的CSV文件,并希望使用WEKA java API执行分析。我希望标记文本,删除停止词,识别词性,过滤名词 我不知道为什么我会看到这个错误。解释和解决这将是伟大的! 但是我看到了下面的错误

Error: 

   Exception in thread "main" java.io.IOException: wrong number of values. Read 21, expected 20, read Token[EOL], line 3
     at weka.core.converters.ConverterUtils.errms(ConverterUtils.java:912)
     at weka.core.converters.CSVLoader.getInstance(CSVLoader.java:819)
     at weka.core.converters.CSVLoader.getDataSet(CSVLoader.java:642)
代码:

CSVLoader loader = new CSVLoader();
loader.setSource(new File("C:\\fakepath\\CSVfilesample.csv"));
Instances data = loader.getDataSet();

// save ARFF
ArffSaver saver = new ArffSaver();
saver.setInstances(data);
saver.setFile(new File("C:\\fakepath\\CSVfilesample.arff"));
saver.setDestination(new File("C:\\fakepath\\CSVfilesample.arff"));
saver.writeBatch();

BufferedReader br=null;
br=new BufferedReader(new FileReader("C:\\fakepath\\CSVfilesample.arff"));
Instances train=new Instances(br);
train.setClassIndex(train.numAttributes()-1);
br.close();
NaiveBayes nb=new NaiveBayes();
nb.buildClassifier(train);
Evaluation eval=new Evaluation(train);
eval.crossValidateModel(nb, train, 10, new Random(1));
System.out.println(eval.toSummaryString("\nResults\n=====\n",true));
System.out.println(eval.fMeasure(1)+" "+eval.precision(1)+" "+eval.recall(1));

此错误通常是由于加载某个ARFF文件时格式不正确造成的。有几个原因。检查以下几点:

通常使用ARFF格式而不是CSV,因为它比CSV文件具有某些优势。检查 现在,对于另一部分,检查文件的编码是否为UTF-8。如果是,您将不得不使用UTF 8格式对文件进行解码。推荐: 第三,检查CSV中是否有一些不兼容的字符。像%2之类的。检查是否有语法错误的结尾。检查是否有多余的逗号。 此错误告诉您文件内容有问题。它们不遵循WEKA标准格式。修正这个错误,错误就会消失


希望有帮助

此错误通常是由于加载某个ARFF文件时格式不正确造成的。有几个原因。检查以下几点:

通常使用ARFF格式而不是CSV,因为它比CSV文件具有某些优势。检查 现在,对于另一部分,检查文件的编码是否为UTF-8。如果是,您将不得不使用UTF 8格式对文件进行解码。推荐: 第三,检查CSV中是否有一些不兼容的字符。像%2之类的。检查是否有语法错误的结尾。检查是否有多余的逗号。 此错误告诉您文件内容有问题。它们不遵循WEKA标准格式。修正这个错误,错误就会消失

希望有帮助