Python 贝努利朴素贝叶斯错误:ValueError:未知标签类型:(数组([0,0,0,…,0,0,0],dtype=object),)

Python 贝努利朴素贝叶斯错误:ValueError:未知标签类型:(数组([0,0,0,…,0,0,0],dtype=object),),python,numpy,machine-learning,scikit-learn,naivebayes,Python,Numpy,Machine Learning,Scikit Learn,Naivebayes,我有两个numpy数组x和y,它们是从一个sframe获取的,其中x有6个维度,y(目标变量)有一个维度 x =np.array([[ 0 , 0 , 0, 24 ,0, 34], [ 0 , 0 , 0, 22 ,0, 34], ...]) y = np.array([[0], [0], [0], [1], [1], ...]) 我正在使用scikit学习应用朴素贝叶斯分类器。当我尝试在朴素贝叶斯分类器中拟合x和y时,我给出了以下错误: /home/.../local/lib/python2

我有两个numpy数组x和y,它们是从一个sframe获取的,其中x有6个维度,y(目标变量)有一个维度

x =np.array([[ 0 , 0 , 0, 24 ,0, 34], [ 0 , 0 , 0, 22 ,0, 34], ...])
y = np.array([[0], [0], [0], [1], [1], ...])
我正在使用scikit学习应用朴素贝叶斯分类器。当我尝试在朴素贝叶斯分类器中拟合x和y时,我给出了以下错误:

/home/.../local/lib/python2.7/site-packages/sklearn/utils/validation.py:526: DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples, ), for example using ravel().

      Traceback (most recent call last):
  File "main_naive.py", line 10, in <module>
    main()
  File "main_naive.py", line 7, in main
    naive_bayes.predict()
  File "/home/.../naive_bayes_model.py", line 184, in predict
    self.naive_bayes.fit(x, y)
  File "/home/.../local/lib/python2.7/site-packages/sklearn/naive_bayes.py", line 566, in fit
    Y = labelbin.fit_transform(y)
  File "/home/.../local/lib/python2.7/site-packages/sklearn/base.py", line 494, in fit_transform
    return self.fit(X, **fit_params).transform(X)
  File "/home/.../local/lib/python2.7/site-packages/sklearn/preprocessing/label.py", line 304, in fit
    self.classes_ = unique_labels(y)
  File "/home/.../local/lib/python2.7/site-packages/sklearn/utils/multiclass.py", line 98, in unique_labels
    raise ValueError("Unknown label type: %s" % repr(ys))
ValueError: Unknown label type: (array([0, 0, 0, ..., 0, 0, 0], dtype=object),)

我哪里出错了?

我发现了问题所在。这是因为y包含“None”值,所以我只是从y中删除了None值。

我解决了这个问题。这是因为y包含“None”值,所以我只是从y中删除了None值。

发布完整的堆栈跟踪几乎总能帮助您更快地获得答案。另外,您发布的代码与您拥有的代码完全不同(它保证不会在当前状态下工作)。我缺乏这方面的数学知识,但现在当我运行您的代码时,我得到了一个不同的错误,这表明此方法可能是为相同维度的数组设计的。您的数组形状错误,您有一个2 x 6阵列和一个6 x 1阵列。在
scikit
中,输入是(n个样本,n个特征)
x
y
实际上都是二维的<代码>朴素贝叶斯拟合期望
y
为1d。这可能是错误的根源。发布完整的堆栈跟踪几乎总能帮助您更快地获得答案。另外,您发布的代码与您拥有的代码完全不同(它保证不会在当前状态下工作)。我缺乏这方面的数学知识,但现在当我运行您的代码时,我得到了一个不同的错误,这表明此方法可能是为相同维度的数组设计的。您的数组形状错误,您有一个2 x 6阵列和一个6 x 1阵列。在
scikit
中,输入是(n个样本,n个特征)
x
y
实际上都是二维的<代码>朴素贝叶斯拟合期望
y
为1d。这可能是错误的根源。
from sklearn.naive_bayes import BernoulliNB
naive_bayes = BernoulliNB(alpha=1e-2)
#x = self.training1[self.feature_columns].to_numpy()
#x = x.reshape(-len(self.feature_columns), len(self.feature_columns))
#y = self.training1[[target_column]].to_numpy()
#y = y.reshape(-1L,1L)    
x =np.array([[ 0 , 0 , 0, 24 ,0, 34], [ 0 , 0 , 0, 22 ,0, 34], ...])
y = np.array([[0], [0], [0], [1], [1], ...])    
naive_bayes.fit(x, y)