Python ValueError:未知的标签类型：'；未知'；_Python_Pandas_Numpy_Scikit Learn_Logistic Regression

Python ValueError:未知的标签类型：'；未知'；

python pandas numpy scikit-learn

Python ValueError:未知的标签类型：'；未知'；,python,pandas,numpy,scikit-learn,logistic-regression,Python,Pandas,Numpy,Scikit Learn,Logistic Regression,我尝试运行以下代码。顺便说一句，我对python和sklearn都是新手 import pandas as pd import numpy as np from sklearn.linear_model import LogisticRegression # data import and preparation trainData = pd.read_csv('train.csv') train = trainData.values testData = pd.read_csv('test

我尝试运行以下代码。顺便说一句，我对python和sklearn都是新手

import pandas as pd
import numpy as np
from sklearn.linear_model import LogisticRegression


# data import and preparation
trainData = pd.read_csv('train.csv')
train = trainData.values
testData = pd.read_csv('test.csv')
test = testData.values
X = np.c_[train[:, 0], train[:, 2], train[:, 6:7],  train[:, 9]]
X = np.nan_to_num(X)
y = train[:, 1]
Xtest = np.c_[test[:, 0:1], test[:, 5:6],  test[:, 8]]
Xtest = np.nan_to_num(Xtest)


# model
lr = LogisticRegression()
lr.fit(X, y)

其中y是0和1的np.N数组

我收到以下消息：

文件“C:\Anaconda3\lib\site packages\sklearn\linear\u model\logistic.py”，行>1174，适合检查\u分类\u目标（y）

文件“C:\Anaconda3\lib\site packages\sklearn\utils\multiclass.py”，第172行，在check\u classification\u targets中提升值错误（“未知标签类型：%r”%y\u类型）

ValueError:未知标签类型：“未知”

从sklearn文档：

y：类似阵列的形状（n_个样本）目标值（分类中的类标签，回归中的实数）

我的错误是什么

upd：

y是数组（[0.0,1.0,1.0，…，0.0,1.0,0.0]，dtype=object）大小是（891，）

您的

属于

object

类型，因此sklearn无法识别其类型。将行

y=y.astype（'int'）

添加到行

y=train[：，1]

之后

添加到Miriam中，我也得到了类似的错误，但在我的例子中，y_pred的单个元素的类型是

'np.int32'

，y的单个元素的类型是

'int'

。我通过以下方式解决了这个问题：

枚举中i，x的

（y_pred）：
y_pred[i]=x.astype（'int'））

请简要介绍数据和导入。为什么要使用numpy，也可以按名称选择dataframe的列。顺便说一句，为什么测试文件的结构与火车文件不同。这看起来很奇怪。如果

scikit learn

无法告诉您要解决的问题类型（查看

数据，它将返回二进制、多类、连续等），则会出现此错误。具体来说，

中的数据类型是什么？在这里发布，或者像@Quickbeam2k1所说的，如果发布完整数据的样本会更有帮助。我认为y数据是个问题，因为它们是浮点1.0。使用lr.fit（X，y.astype（int））。我尝试了lr.fit（X，y.astype（float）），但得到了相同的错误。我试着做一个高斯朴素贝叶斯模型，明白了！非常感谢你，米里亚姆！如果我尝试执行此操作，就会出现此错误………

TypeError:int（）参数必须是字符串、类似于对象的字节或数字，而不是“numpy.ufunc”

您是一个救生员！