Python ValueError:找到样本数不一致的输入变量:[4,25001]似乎无法识别标题?
有人知道问题出在哪里吗?似乎列名未被识别为标题。下面是我的代码,粗体显示了相应的错误。我想编写一个函数,通过将数据集拆分为训练集和测试集(70%的数据训练和30%的测试数据)来训练逻辑回归。先谢谢你 进口Python ValueError:找到样本数不一致的输入变量:[4,25001]似乎无法识别标题?,python,header,regression,Python,Header,Regression,有人知道问题出在哪里吗?似乎列名未被识别为标题。下面是我的代码,粗体显示了相应的错误。我想编写一个函数,通过将数据集拆分为训练集和测试集(70%的数据训练和30%的测试数据)来训练逻辑回归。先谢谢你 进口 将numpy作为np导入 将熊猫作为pd导入 导入csv 来自sklearn.linear\u模型导入逻辑回归 来自sklearn.metrics导入混淆矩阵 来自sklearn导入树的 来自sklearn.linear\u模型导入逻辑回归 来自sklearn.metrics导入混淆矩阵 从s
将numpy作为np导入
将熊猫作为pd导入
导入csv
来自sklearn.linear\u模型导入逻辑回归
来自sklearn.metrics导入混淆矩阵
来自sklearn导入树的
来自sklearn.linear\u模型导入逻辑回归
来自sklearn.metrics导入混淆矩阵
从sklearn.dataset导入数据
来自sklearn.model\u选择导入列车\u测试\u分割
加载数据集,在列中分离数据并给出列名称:
colnames=[“水印”、“微打印”、“紫外线场”、“磁场”、“直径”、“目标”]
Dataset=pd.read\u csv(“/Users/David/Documents/Python Assignment2/data banknote.csv”,sep=”,“,names=colnames)
Dataset.index=np.arange(1,len(数据集)+1)
定义列车数据和测试数据
TrainData=数据集[“水印”]、数据集[“微打印”]、数据集[“紫外线场”]、数据集[“磁场”]、数据集[“直径”]
TestData=Dataset[“Target”]
显示数据集的头部
TrainData.head()
TestData.head()
列车数据没有标题时出现错误?
拆分数据集
TrainData\u train,TrainData\u test,TestData\u train,TestData\u test=train\u test\u split(TrainData,TestData,test\u size=0.3,随机状态=0)
ValueError:找到样本数不一致的输入变量:[42501]?如果文件中没有标题,则传递
pd.read\u csv(…,header=None)
。如果文件中没有标题,则传递pd.read\u csv(…,header=None)
。