Machine learning 表格数据回归任务的半监督学习？_Machine Learning_Regression_Data Science_Tabular_Non Linear Regression

Machine learning 表格数据回归任务的半监督学习？

machine-learning

Machine learning 表格数据回归任务的半监督学习？,machine-learning,regression,data-science,tabular,non-linear-regression,Machine Learning,Regression,Data Science,Tabular,Non Linear Regression,表格数据回归任务的半监督学习？我有20K标记数据和200K未标记数据模型通过半监督学习变得越来越好，例如，自学习，最重要的是，如果你只有20K，并且对200K进行预测，那么你假设特征的方差和分布保持不变，这并不总是正确的，因此即使你的模型在K倍CV上的平均R2为90，你也会做出一个具有相当大误差的预测。希望这能解释为什么我在寻找回归的半监督方法为什么说它是半监督的。您有20K条记录要训练您的模型，剩余的记录应该为您执行prediction@SwaritAgarwal模型在半监督学习（例如自学

表格数据回归任务的半监督学习？我有20K标记数据和200K未标记数据

模型通过半监督学习变得越来越好，例如，自学习，最重要的是，如果你只有20K，并且对200K进行预测，那么你假设特征的方差和分布保持不变，这并不总是正确的，因此即使你的模型在K倍CV上的平均R2为90，你也会做出一个具有相当大误差的预测。希望这能解释为什么我在寻找回归的半监督方法

为什么说它是半监督的。您有20K条记录要训练您的模型，剩余的记录应该为您执行prediction@SwaritAgarwal模型在半监督学习（例如自学习）的情况下越来越好，最重要的是，如果你只有20K，并且对200K进行预测，那么你假设特征的方差和分布保持不变，这并不总是正确的，因此即使您的模型在K倍CV上的平均R2为90，也要做出具有相当大误差的预测。希望这能解释为什么我在寻找回归的半监督方法！这是有道理的。但你的20K记录的准确度和R2是多少。我相信更多的数据确实会改善你的模型。试着做一次岭回归。希望能解决您的问题。我的K倍R2在20K数据上相当高，我正在尝试所有非线性模型，如XGBoost、神经网络等。Ridge是一个线性模型，不会有帮助。问题是什么？请您更新问题，添加您在评论中提供的所有信息，并提出有意义的问题。流形正则化半监督学习分类可以在LapSVM的基础上重新编码简单的回归算法（例如，回归的kmean）。