Machine learning 从两个不同来源培训和测试ML

Machine learning 从两个不同来源培训和测试ML,machine-learning,scikit-learn,Machine Learning,Scikit Learn,我正在使用sklearn进行分类任务。我想在表train的数据上训练我的模型,并在另一个表test的数据上测试它。两个表具有相同的功能,但行数不同。我有下面的代码,但我得到了错误: ,ValueError“找到样本数不一致的输入变量:[123,174]” 我做错了什么 获取列车数据='从列车中选择* 获取测试数据='select*fromtest;' df\u train=pd.read\u sql\u queryget\u train\u data,con=connection df\u te

我正在使用sklearn进行分类任务。我想在表train的数据上训练我的模型,并在另一个表test的数据上测试它。两个表具有相同的功能,但行数不同。我有下面的代码,但我得到了错误: ,ValueError“找到样本数不一致的输入变量:[123,174]”

我做错了什么

获取列车数据='从列车中选择* 获取测试数据='select*fromtest;' df\u train=pd.read\u sql\u queryget\u train\u data,con=connection df\u test=pd.read\u sql\u queryget\u test\u data,con=connection X=df_列车[:,2:30] Y=df_试验[:,:30] X_列,X_测试,Y_列,Y_测试=X,Y列 fitX_型列车,Y_型列车 预测=model.predictX\u测试 分割矩阵=混乱矩阵测试,预测
如果您想在数据帧df_train上进行训练,并在数据帧df_test上进行测试,为什么要将df_train的特性和df_test的目标列传递给train_test_split函数

您可以简单地执行以下操作:

获取列车数据='从列车中选择* 获取测试数据='select*fromtest;' df\u train=pd.read\u sql\u queryget\u train\u data,con=connection df\u test=pd.read\u sql\u queryget\u test\u data,con=connection X_列车=df_列车[:,2:30] y_train=df_train.y假设y是df_train中目标变量的名称 X_test=df_test[:,i:j]将i更改为j,数字允许您使用与X_train相同的列 y_test=df_test.y假设y是df_test中目标变量的名称 fitX_型列车,y_型列车 预测=model.predictX\u测试 对预测做点什么,例如。 平均预测==y_检验