Python sklearn（逻辑回归模型选择）有错误我想为逻辑回归拆分数据。但是，出现了如下错误代码：_Python_Pandas_Scikit Learn_Logistic Regression

Python sklearn（逻辑回归模型选择）有错误我想为逻辑回归拆分数据。但是，出现了如下错误代码：

python pandas scikit-learn

Python sklearn（逻辑回归模型选择）有错误我想为逻辑回归拆分数据。但是，出现了如下错误代码：,python,pandas,scikit-learn,logistic-regression,Python,Pandas,Scikit Learn,Logistic Regression,ValueError回溯（最近一次调用上次）在里面 ---->1列测试功能、测试功能、列测试标签、测试标签=列测试拆分（功能、诊断） D:\python\lib\site packages\sklearn\model\u selection\u split.py in train\u test\u split（*数组，**选项） 2116 raise TypeError（“传递的参数无效：%s”%str（选项）） 2117 ->2118数组=可转位（*数组） 2119 2120个n_样本=_n

ValueError回溯（最近一次调用上次）在里面 ---->1列测试功能、测试功能、列测试标签、测试标签=列测试拆分（功能、诊断）

D:\python\lib\site packages\sklearn\model\u selection\u split.py in train\u test\u split（*数组，**选项） 2116 raise TypeError（“传递的参数无效：%s”%str（选项）） 2117 ->2118数组=可转位（*数组） 2119 2120个n_样本=_num_样本（数组[0]）

D:\python\lib\site packages\sklearn\utils\validation.py可索引（*iterables） 246 """ 247结果=[[u使X在iterables中可索引（X）] -->248检查长度是否一致（*结果） 249返回结果二百五十

检查长度（*数组）中的D:\python\lib\site packages\sklearn\utils\validation.py 210如果len（uniques）>1： 211 raise VALUERROR（“找到的输入变量的数量不一致”） -->212“样本：%r”%[int（l）表示长度为l的样本]） 213 214

ValueError:找到样本数不一致的输入变量：[10569]

我如何修复它？

我认为

features=Dt[2:12]

会导致您的错误。您的尝试是对特性进行切片，但python会将代码解释为对记录进行切片。因此，将代码更改为

Dt.iloc[：，2:12

]

    import numpy as np
    import matplotlib.pyplot as plt
    import pandas as pd
    from sklearn import datasets
    from sklearn.model_selection import train_test_split
    from sklearn.linear_model import LogisticRegression
    from sklearn.preprocessing import StandardScaler


    Dt = pd.read_csv("D:\wisc_bc_data.csv")
    '''
    print(Dt.shape)     
    print(Dt.head())
    '''
     def changer(x):
         if x == 'B':
            return 0
         else:
            return 1
     Dt['diagnosis'] = Dt['diagnosis'].map(lambda x: changer(x))
     features = Dt[2:12]
     Diagnosis = Dt['diagnosis']
     train_features, test_features, train_labels, test_labels = train_test_split(features, Diagnosis) 'this line emits error code'

     '''
     this is my code and i used dataset from here: https://gomguard.tistory.com/52
     '''