Python 3.x 逻辑回归程序的准确性总是不同的_Python 3.x_Scikit Learn_Logistic Regression

Python 3.x 逻辑回归程序的准确性总是不同的

python-3.x scikit-learn

Python 3.x 逻辑回归程序的准确性总是不同的,python-3.x,scikit-learn,logistic-regression,Python 3.x,Scikit Learn,Logistic Regression,尝试将random\u state传递到train\u test\u split功能中。如果您不这样做，那么每次数据都会被随机洗牌->生成不同的训练集和测试集例如： import math import numpy as np import pandas as pd #from pandas import DataFrame from sklearn import preprocessing,cross_validation from sklearn.linear_model imp

尝试将

random\u state

传递到

train\u test\u split

功能中。如果您不这样做，那么每次数据都会被随机洗牌->生成不同的训练集和测试集

例如：

import math

import numpy as np

import pandas as pd

#from pandas import DataFrame

from sklearn import preprocessing,cross_validation

from sklearn.linear_model import LogisticRegression

#from sklearn.cross_validation import train_test_split

from numpy import loadtxt, where

from pylab import scatter, show, legend, xlabel, ylabel

# scale larger positive and values to between -1,1 depending on the largest
# value in the data

min_max_scaler = preprocessing.MinMaxScaler(feature_range=(0, 1))

df = pd.read_excel("Cryotherapy.xlsx", header=0)

# clean up data

df.columns = ["sex","age","Time","Number_of_Warts", "Type", 

"Area","Result_of_Treatment"]

x = df["Result_of_Treatment"]

X = df[["Type","Area",]]

X = np.array(X)

X = min_max_scaler.fit_transform(X)

Y = df["Result_of_Treatment"]

Y = np.array(Y)

X_train, X_test, Y_train, Y_test = cross_validation.train_test_split(X, Y, 

test_size=0.4)

# train scikit learn model

clf = LogisticRegression()

clf.fit(X_train, Y_train)

accuracy = clf.score(X_test,Y_test)

print(accuracy)

你想在这里得到答案的实际问题是什么？我尝试了精度=clf.score（X_train，Y_train），但它大约是70%。你能解释一下原因吗

X_train, X_test, Y_train, Y_test = cross_validation.train_test_split(X, Y, test_size=0.4, random_state=1)