Machine learning 表格数据回归任务的半监督学习?

Machine learning 表格数据回归任务的半监督学习?,machine-learning,regression,data-science,tabular,non-linear-regression,Machine Learning,Regression,Data Science,Tabular,Non Linear Regression,表格数据回归任务的半监督学习?我有20K标记数据和200K未标记数据 模型通过半监督学习变得越来越好,例如,自学习,最重要的是,如果你只有20K,并且对200K进行预测,那么你假设特征的方差和分布保持不变,这并不总是正确的,因此即使你的模型在K倍CV上的平均R2为90,你也会做出一个具有相当大误差的预测。希望这能解释为什么我在寻找回归的半监督方法 为什么说它是半监督的。您有20K条记录要训练您的模型,剩余的记录应该为您执行prediction@SwaritAgarwal模型在半监督学习(例如自学

表格数据回归任务的半监督学习?我有20K标记数据和200K未标记数据

  • 模型通过半监督学习变得越来越好,例如,自学习,最重要的是,如果你只有20K,并且对200K进行预测,那么你假设特征的方差和分布保持不变,这并不总是正确的,因此即使你的模型在K倍CV上的平均R2为90,你也会做出一个具有相当大误差的预测。希望这能解释为什么我在寻找回归的半监督方法


  • 为什么说它是半监督的。您有20K条记录要训练您的模型,剩余的记录应该为您执行prediction@SwaritAgarwal模型在半监督学习(例如自学习)的情况下越来越好,最重要的是,如果你只有20K,并且对200K进行预测,那么你假设特征的方差和分布保持不变,这并不总是正确的,因此即使您的模型在K倍CV上的平均R2为90,也要做出具有相当大误差的预测。希望这能解释为什么我在寻找回归的半监督方法!这是有道理的。但你的20K记录的准确度和R2是多少。我相信更多的数据确实会改善你的模型。试着做一次岭回归。希望能解决您的问题。我的K倍R2在20K数据上相当高,我正在尝试所有非线性模型,如XGBoost、神经网络等。Ridge是一个线性模型,不会有帮助。问题是什么?请您更新问题,添加您在评论中提供的所有信息,并提出有意义的问题。流形正则化半监督学习分类可以在LapSVM的基础上重新编码简单的回归算法(例如,回归的kmean)。