Machine learning 使用新数据重新训练分类器会产生大量的类变化

Machine learning 使用新数据重新训练分类器会产生大量的类变化,machine-learning,classification,xgboost,training-data,Machine Learning,Classification,Xgboost,Training Data,我每天在150k的记录上训练XGBoost二进制分类器。 每天,大约有500条记录添加到列车组中。 测试集(推理)没有标签。 我注意到连续几天训练的两个模型在相同的记录上产生了根本不同的预测(高达10%的推断数据)。 我现在尝试的是: 设置相同的种子和参数 不同的分类器 我担心的是,该模型没有得到足够的推广,因此每天的预测有很大的变化。 我很想听听解决这个问题的可能方法

我每天在150k的记录上训练XGBoost二进制分类器。 每天,大约有500条记录添加到列车组中。 测试集(推理)没有标签。 我注意到连续几天训练的两个模型在相同的记录上产生了根本不同的预测(高达10%的推断数据)。 我现在尝试的是:

  • 设置相同的种子和参数
  • 不同的分类器
  • 我担心的是,该模型没有得到足够的推广,因此每天的预测有很大的变化。 我很想听听解决这个问题的可能方法