Python 3.x Logistic回归拟合问题

Python 3.x Logistic回归拟合问题,python-3.x,scikit-learn,regression,Python 3.x,Scikit Learn,Regression,我对逻辑回归分析有意见。正在从大小为(2039,7)的csv文件读取数据 前6列包含输入(即6个特征),第7列包含我想要预测的输出。程序运行时没有错误,但问题是当我运行程序时,我得到了太多的系数和截获。对于系数,我得到一个大小为(1239,6)的数组,对于截取,我得到一个长度为1239的数字列表。我假设我应该得到6个系数(每个特征一个)和一个截距 此外,回归模型的精度过低。任何关于我做错了什么的想法都将不胜感激。代码如下 import pandas import numpy from sklea

我对逻辑回归分析有意见。正在从大小为(2039,7)的csv文件读取数据

前6列包含输入(即6个特征),第7列包含我想要预测的输出。程序运行时没有错误,但问题是当我运行程序时,我得到了太多的系数和截获。对于系数,我得到一个大小为(1239,6)的数组,对于截取,我得到一个长度为1239的数字列表。我假设我应该得到6个系数(每个特征一个)和一个截距

此外,回归模型的精度过低。任何关于我做错了什么的想法都将不胜感激。代码如下

import pandas
import numpy
from sklearn import cross_validation
from sklearn.linear_model import LogisticRegression
filename = '1.csv'
names = ['A', 'B', 'C', 'D', 'E', 'F', 'G']
dataframe = pandas.read_csv(filename, names=names)
array = dataframe.values
X = array[:,0:6]
Y = numpy.asarray(array[:,6], dtype="|S6")
test_size = 0.33
seed = 7
X_train, X_test, Y_train, Y_test = cross_validation.train_test_split(X, Y, test_size=test_size, random_state=seed)
model = LogisticRegression()
model.fit(X_train, Y_train)
result = model.score(X_test, Y_test)
print(result*100.0)
print(model.coef_.shape)
print(model.intercept_.shape) 

展示Y的一些部分。我非常肯定,问题会在那里找到!谢谢事实上,在你给我看Y的线索后,我自己就明白了。我的Y是一个连续变化的数字串。问题是逻辑回归需要Y中的装箱数据。感谢您的帮助!展示Y的一些部分。我非常肯定,问题会在那里找到!谢谢事实上,在你给我看Y的线索后,我自己就明白了。我的Y是一个连续变化的数字串。问题是逻辑回归需要Y中的装箱数据。感谢您的帮助!