Python ValueError:找到样本数不一致的输入变量:[4,25001]似乎无法识别标题?

Python ValueError:找到样本数不一致的输入变量:[4,25001]似乎无法识别标题?,python,header,regression,Python,Header,Regression,有人知道问题出在哪里吗?似乎列名未被识别为标题。下面是我的代码,粗体显示了相应的错误。我想编写一个函数,通过将数据集拆分为训练集和测试集(70%的数据训练和30%的测试数据)来训练逻辑回归。先谢谢你 进口 将numpy作为np导入 将熊猫作为pd导入 导入csv 来自sklearn.linear\u模型导入逻辑回归 来自sklearn.metrics导入混淆矩阵 来自sklearn导入树的 来自sklearn.linear\u模型导入逻辑回归 来自sklearn.metrics导入混淆矩阵 从s

有人知道问题出在哪里吗?似乎列名未被识别为标题。下面是我的代码,粗体显示了相应的错误。我想编写一个函数,通过将数据集拆分为训练集和测试集(70%的数据训练和30%的测试数据)来训练逻辑回归。先谢谢你

进口

将numpy作为np导入

将熊猫作为pd导入

导入csv

来自sklearn.linear\u模型导入逻辑回归

来自sklearn.metrics导入混淆矩阵

来自sklearn导入树的

来自sklearn.linear\u模型导入逻辑回归

来自sklearn.metrics导入混淆矩阵

从sklearn.dataset导入数据

来自sklearn.model\u选择导入列车\u测试\u分割

加载数据集,在列中分离数据并给出列名称:

colnames=[“水印”、“微打印”、“紫外线场”、“磁场”、“直径”、“目标”]

Dataset=pd.read\u csv(“/Users/David/Documents/Python Assignment2/data banknote.csv”,sep=”,“,names=colnames)

Dataset.index=np.arange(1,len(数据集)+1)

定义列车数据和测试数据

TrainData=数据集[“水印”]、数据集[“微打印”]、数据集[“紫外线场”]、数据集[“磁场”]、数据集[“直径”]

TestData=Dataset[“Target”]

显示数据集的头部

TrainData.head()

TestData.head()

列车数据没有标题时出现错误?

拆分数据集

TrainData\u train,TrainData\u test,TestData\u train,TestData\u test=train\u test\u split(TrainData,TestData,test\u size=0.3,随机状态=0)


ValueError:找到样本数不一致的输入变量:[42501]?

如果文件中没有标题,则传递
pd.read\u csv(…,header=None)
。如果文件中没有标题,则传递
pd.read\u csv(…,header=None)