Python sklearn中naive_bayes.py的解包错误
我将一个arff文件作为输入,并读取其中的数据部分,以获得训练和测试实例。我现在计划做GaussiaNB、决策树等来训练我的数据,并用于预测测试数据的类。 当我尝试执行此操作时,会出现以下错误: 文件“/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site packages/sklearn/naive_bayes.py”,第152行 n_样本,n_特征=X.shape 值错误:需要超过1个值才能解包 以下是我的代码的详细信息: 目前,我已将数据集缩减为仅10个实例,以调试该问题。(培训规模:8,测试规模:2) 课程/标签:2(好和坏)(这是我想用上述学习者预测的) 我的输入文件:Python sklearn中naive_bayes.py的解包错误,python,scikit-learn,Python,Scikit Learn,我将一个arff文件作为输入,并读取其中的数据部分,以获得训练和测试实例。我现在计划做GaussiaNB、决策树等来训练我的数据,并用于预测测试数据的类。 当我尝试执行此操作时,会出现以下错误: 文件“/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site packages/sklearn/naive_bayes.py”,第152行 n_样本,n_特征=X.shape 值错误:需要超过1个值才能解包 以下是我的代码
@关系petsc\U数据
@属性lambda max by magnity im NUMERIC
@属性右带宽数值
@ATTRIBUTE avgdistfromdiag NUMERIC
@属性对称数字
@属性n-dummy-rows NUME
RIC@ATTRIBUTE blocksize NUMERIC
@属性每行数字的最大nn0
@属性诊断明确数字
@ATTRIBUTE avgnnzprow NUMERIC
@属性lambda max by magnity re NUMERIC
@属性椭圆数字
@ATTRIBUTE nnzup NUMERIC
@属性ruhe75绑定数字
@ATTRIBUTE avg diag dist NUMERIC
@ATTRIBUTE nnz NUMERIC
@属性lambda最小值(按大小重新计算)
@属性lambda max by im part im NUMERIC
@属性左带宽数值
@ATTRIBUTE norm1 NUMERIC
@属性西格玛最小数值
@属性和数字
@属性n-struct-unsymm NUMERIC
@属性lambda min(按大小)im NUMERIC
@属性对角平均数值
@属性对角优势数值
@属性虚拟行数字
@ATTRIBUTE ritz-values-r NUMERIC
@ATTRIBUTE symmetry snrom NUMERIC
@属性对称扇形数字
@属性对称fsnorm NUMERIC
@属性颜色数字
@属性lambda max按im部分重新编号
@ATTRIBUTE col variability NUMERIC
@属性跟踪abs NUMERIC
@ATTRIBUTE ritz-values-c NUMERIC
@ATTRIBUTE nnzeros NUMERIC
@ATTRIBUTE diag zerostart NUMERIC
@属性和数字
@属性正分数数值
@属性跟踪数字
@ATTRIBUTE min nn每行数字为零
@属性对角符号数字
@属性行可变性数值
@ATTRIBUTE nrows NUMERIC
@属性lambda max by real part im NUMERIC
@属性颜色偏移数值
@属性n-颜色数字
@ATTRIBUTE relsymm NUMERIC
@属性对角方差数值
@属性离开数值
@ATTRIBUTE nnzlow NUMERIC
@ATTRIBUTE n-nonzero-diags NUMERIC
@ATTRIBUTE sigma max NUMERIC
@属性虚拟行种类数字
@ATTRIBUTE kappa NUMERIC
@属性n-ritz-values数值
@属性颜色集大小数字
@ATTRIBUTE sigma diag dist NUMERIC
@ATTRIBUTE symmetry anorm NUMERIC
@属性椭圆ax数值
@属性值为数值
@属性椭圆cx数值
@ATTRIBUTE normF NUMERIC
@属性normInf NUMERIC
@属性绑定数字
@实数部分的lambda max属性
@ATTRIBUTE nnzdia NUMERIC
@属性跟踪为四次数字
@属性类{good,bad}
@DATA
“代码”这些代码>,他们他们的864,4,864,4,4,4,4,2.8787871694,21 18,0.0118,0.1670 0.8016716716716460.3434355858892,0.5858584141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141414141,?,475474.4,0.0007929995,1.935847,?,0.9358466,18.82156,5.727387,0.00236145,2.8716941136354.2513,坏的
“代码”这些代码>在1801、6、1801、6、1801、12、76761310 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0他们他们他们他们他们的1801、1801、1801他们他们他们他们他们他们他们他们他们他们他们的1801,他们他们他们他们他们他们他们他们他们的1801 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 03275275474747474747474747474747474747474747474747479 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9.4141414141414141414141414141414141414141414141414141414141414141414141414141419 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9,77,?,1328154.0,0.05763386,10.6881,?,9.688105,23.2352,29.9004,0.03057284,20.376211801539.8737,坏的
在这些代码中,他们的1800、1800、6、6、6、6、7、6、6、6、0.0 0 0.0 0.41414141414141414141414141417、0.0 0 0.3513313119,他们的1800、1800、1800、6、6、6、6、6、6、6、6以及0.0.0.0.0.0.414141414141414141414141414141414141414141414141414141414141414141414141414141410.0.41414141414141414141414141414141414141414141414141414141410.0.41414141414141414141414141414141414141414141414141414141414141410.4141414141414141414141414141414141414141414141414141414141411.44,81,?,1327519.0,0.1013244,1.30505,0.001032658,0.3050501,4.579824,2.99671,0.04196146,1.61011801,20.97304,坏的
,420,5,?93402,11,?5,1.0,?1000,?244.45952796,-0.00292884,?42136627470000.0,?420476,?52.27869,-7227981000.0,?36139900000.07466151
from sklearn.naive_bayes import GaussianNB
from sklearn.ensemble import RandomForestClassifier
from sklearn import metrics, preprocessing
from sklearn import svm, naive_bayes, neighbors, tree
from sklearn.ensemble import AdaBoostClassifier
from sklearn import cross_validation
from tabulate import tabulate
from scipy.io.arff import loadarff
import arff
import pandas as pd
import numpy as np
import csv #not used right now
import scipy as sp
import numpy as np
filename = 'input.arff'
dataset = arff.load(open(filename, 'r'))
meta, data = loadarff(filename)
no_of_lines = len(meta)
train_size = int(0.8 * no_of_lines)
targets = []
targets = meta['nnzeros']
print(len(meta[0:70][0:train_size]))
print(meta['class'][0:train_size])
X = meta[0:70][0:train_size]
Y = meta['class'][0:train_size]
Z = meta[0:70][train_size:no_of_lines]
y_gnb = gnb.fit(X,Y).predict(Z)
print('Gaussian Naive Bayes prediction: -> ',y_gnb)