Machine learning 从两个不同来源培训和测试ML_Machine Learning_Scikit Learn

Machine learning 从两个不同来源培训和测试ML

machine-learning scikit-learn

Machine learning 从两个不同来源培训和测试ML,machine-learning,scikit-learn,Machine Learning,Scikit Learn,我正在使用sklearn进行分类任务。我想在表train的数据上训练我的模型，并在另一个表test的数据上测试它。两个表具有相同的功能，但行数不同。我有下面的代码，但我得到了错误：，ValueError“找到样本数不一致的输入变量：[123，174]” 我做错了什么获取列车数据='从列车中选择* 获取测试数据='select*fromtest；' df\u train=pd.read\u sql\u queryget\u train\u data，con=connection df\u te

我正在使用sklearn进行分类任务。我想在表train的数据上训练我的模型，并在另一个表test的数据上测试它。两个表具有相同的功能，但行数不同。我有下面的代码，但我得到了错误：，ValueError“找到样本数不一致的输入变量：[123，174]”

我做错了什么

获取列车数据='从列车中选择* 获取测试数据='select*fromtest；' df\u train=pd.read\u sql\u queryget\u train\u data，con=connection df\u test=pd.read\u sql\u queryget\u test\u data，con=connection X=df_列车[：，2:30] Y=df_试验[：，：30] X_列，X_测试，Y_列，Y_测试=X，Y列 fitX_型列车，Y_型列车预测=model.predictX\u测试分割矩阵=混乱矩阵测试，预测

如果您想在数据帧df_train上进行训练，并在数据帧df_test上进行测试，为什么要将df_train的特性和df_test的目标列传递给train_test_split函数

您可以简单地执行以下操作：

获取列车数据='从列车中选择* 获取测试数据='select*fromtest；' df\u train=pd.read\u sql\u queryget\u train\u data，con=connection df\u test=pd.read\u sql\u queryget\u test\u data，con=connection X_列车=df_列车[：，2:30] y_train=df_train.y假设y是df_train中目标变量的名称 X_test=df_test[：，i:j]将i更改为j，数字允许您使用与X_train相同的列 y_test=df_test.y假设y是df_test中目标变量的名称 fitX_型列车，y_型列车预测=model.predictX\u测试对预测做点什么，例如。平均预测==y_检验