Python sklearn(逻辑回归模型选择)有错误 我想为逻辑回归拆分数据。但是,出现了如下错误代码:
ValueError回溯(最近一次调用上次) 在里面 ---->1列测试功能、测试功能、列测试标签、测试标签=列测试拆分(功能、诊断) D:\python\lib\site packages\sklearn\model\u selection\u split.py in train\u test\u split(*数组,**选项) 2116 raise TypeError(“传递的参数无效:%s”%str(选项)) 2117 ->2118数组=可转位(*数组) 2119 2120个n_样本=_num_样本(数组[0]) D:\python\lib\site packages\sklearn\utils\validation.py可索引(*iterables) 246 """ 247结果=[[u使X在iterables中可索引(X)] -->248检查长度是否一致(*结果) 249返回结果 二百五十 检查长度(*数组)中的D:\python\lib\site packages\sklearn\utils\validation.py 210如果len(uniques)>1: 211 raise VALUERROR(“找到的输入变量的数量不一致”) -->212“样本:%r”%[int(l)表示长度为l的样本]) 213 214 ValueError:找到样本数不一致的输入变量:[10569]Python sklearn(逻辑回归模型选择)有错误 我想为逻辑回归拆分数据。但是,出现了如下错误代码:,python,pandas,scikit-learn,logistic-regression,Python,Pandas,Scikit Learn,Logistic Regression,ValueError回溯(最近一次调用上次) 在里面 ---->1列测试功能、测试功能、列测试标签、测试标签=列测试拆分(功能、诊断) D:\python\lib\site packages\sklearn\model\u selection\u split.py in train\u test\u split(*数组,**选项) 2116 raise TypeError(“传递的参数无效:%s”%str(选项)) 2117 ->2118数组=可转位(*数组) 2119 2120个n_样本=_n
我如何修复它?我认为
features=Dt[2:12]
会导致您的错误。
您的尝试是对特性进行切片,但python会将代码解释为对记录进行切片。
因此,将代码更改为Dt.iloc[:,2:12
]
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler
Dt = pd.read_csv("D:\wisc_bc_data.csv")
'''
print(Dt.shape)
print(Dt.head())
'''
def changer(x):
if x == 'B':
return 0
else:
return 1
Dt['diagnosis'] = Dt['diagnosis'].map(lambda x: changer(x))
features = Dt[2:12]
Diagnosis = Dt['diagnosis']
train_features, test_features, train_labels, test_labels = train_test_split(features, Diagnosis) 'this line emits error code'
'''
this is my code and i used dataset from here: https://gomguard.tistory.com/52
'''