Machine learning 在BigQuery ML中,有没有一种方法可以将样本权重用于XGBoost和DNN模型?

Machine learning 在BigQuery ML中,有没有一种方法可以将样本权重用于XGBoost和DNN模型?,machine-learning,deep-learning,google-bigquery,xgboost,Machine Learning,Deep Learning,Google Bigquery,Xgboost,我有一个数据集,其中每个实例都有不同的权重。在我的例子中,权重相差达几个数量级。 我想训练一个可以考虑这些权重的回归模型模型。 作为研究的一部分,我尝试了以下模型:“boost_树分类器”、“boost_树回归器”、“DNN_分类器”、“DNN_回归器”。 在文档(,)中,似乎无法定义权重列。 (可以为分类器定义“类权重”,这是完全不同的事情) 作为我研究的一部分,我没有使用权重,而是创建了一个向上采样的数据集。然而,这种方法有两个巨大的缺点: 它极大地增加了数据集的大小,这转化为模型培训的成本

我有一个数据集,其中每个实例都有不同的权重。在我的例子中,权重相差达几个数量级。 我想训练一个可以考虑这些权重的回归模型模型。 作为研究的一部分,我尝试了以下模型:“boost_树分类器”、“boost_树回归器”、“DNN_分类器”、“DNN_回归器”。 在文档(,)中,似乎无法定义权重列。 (可以为分类器定义“类权重”,这是完全不同的事情)

作为我研究的一部分,我没有使用权重,而是创建了一个向上采样的数据集。然而,这种方法有两个巨大的缺点:

  • 它极大地增加了数据集的大小,这转化为模型培训的成本
  • 由于权重的显著差异,我被迫移除权重较低的样本,以保持“合理大小”的上采样数据集(大约比原始数据集大10-20倍)。因此,信号的一个重要部分丢失
  • 我看到大多数DNN和XGBoost库都支持示例_权重参数,包括分类和回归模型类型()


    有没有办法在BigQuery ML中使用XGBoost和DNN模型(回归器/分类器模型类型)的样本权重?

    自2020-12-02起,BigQuery ML中不支持每个样本权重