Python 3.x Logistic回归拟合问题_Python 3.x_Scikit Learn_Regression

Python 3.x Logistic回归拟合问题

python-3.x scikit-learn

Python 3.x Logistic回归拟合问题,python-3.x,scikit-learn,regression,Python 3.x,Scikit Learn,Regression,我对逻辑回归分析有意见。正在从大小为（2039,7）的csv文件读取数据前6列包含输入（即6个特征），第7列包含我想要预测的输出。程序运行时没有错误，但问题是当我运行程序时，我得到了太多的系数和截获。对于系数，我得到一个大小为（1239，6）的数组，对于截取，我得到一个长度为1239的数字列表。我假设我应该得到6个系数（每个特征一个）和一个截距此外，回归模型的精度过低。任何关于我做错了什么的想法都将不胜感激。代码如下 import pandas import numpy from sklea

我对逻辑回归分析有意见。正在从大小为（2039,7）的csv文件读取数据

前6列包含输入（即6个特征），第7列包含我想要预测的输出。程序运行时没有错误，但问题是当我运行程序时，我得到了太多的系数和截获。对于系数，我得到一个大小为（1239，6）的数组，对于截取，我得到一个长度为1239的数字列表。我假设我应该得到6个系数（每个特征一个）和一个截距

此外，回归模型的精度过低。任何关于我做错了什么的想法都将不胜感激。代码如下

import pandas
import numpy
from sklearn import cross_validation
from sklearn.linear_model import LogisticRegression
filename = '1.csv'
names = ['A', 'B', 'C', 'D', 'E', 'F', 'G']
dataframe = pandas.read_csv(filename, names=names)
array = dataframe.values
X = array[:,0:6]
Y = numpy.asarray(array[:,6], dtype="|S6")
test_size = 0.33
seed = 7
X_train, X_test, Y_train, Y_test = cross_validation.train_test_split(X, Y, test_size=test_size, random_state=seed)
model = LogisticRegression()
model.fit(X_train, Y_train)
result = model.score(X_test, Y_test)
print(result*100.0)
print(model.coef_.shape)
print(model.intercept_.shape)

展示Y的一些部分。我非常肯定，问题会在那里找到！谢谢事实上，在你给我看Y的线索后，我自己就明白了。我的Y是一个连续变化的数字串。问题是逻辑回归需要Y中的装箱数据。感谢您的帮助！展示Y的一些部分。我非常肯定，问题会在那里找到！谢谢事实上，在你给我看Y的线索后，我自己就明白了。我的Y是一个连续变化的数字串。问题是逻辑回归需要Y中的装箱数据。感谢您的帮助！