Machine learning Sagemaker XG Boost(目标=reg:logistic)不处理高度不平衡的数据集

Machine learning Sagemaker XG Boost(目标=reg:logistic)不处理高度不平衡的数据集,machine-learning,logistic-regression,xgboost,amazon-sagemaker,Machine Learning,Logistic Regression,Xgboost,Amazon Sagemaker,我正在研究AWS Sagemaker上的信用欺诈数据集。数据集高度不平衡。它只有0.1732%的欺诈交易。我想使用sagemaker的XG Boost预测给定交易是否为欺诈(1)或非欺诈(0)。当我将hyperparameter中的目标函数设置为“multi:softmax”且类数=2时,它给出了85%召回率的良好结果。当我将目标函数设置为“reg:logistic”时,我的召回率为0。它只是将每一笔交易都标记为非欺诈性交易。两个类的logistic和multi-softmax不应该给出相同的答

我正在研究AWS Sagemaker上的信用欺诈数据集。数据集高度不平衡。它只有0.1732%的欺诈交易。我想使用sagemaker的XG Boost预测给定交易是否为欺诈(1)或非欺诈(0)。当我将hyperparameter中的目标函数设置为“multi:softmax”且类数=2时,它给出了85%召回率的良好结果。当我将目标函数设置为“reg:logistic”时,我的召回率为0。它只是将每一笔交易都标记为非欺诈性交易。两个类的logistic和multi-softmax不应该给出相同的答案吗?此外,在处理不平衡的数据集时,是否有任何超参数的默认值应该更改?
谢谢

对于不平衡数据集,首先要确保少数标签示例的过度表示。XGBoost使用参数
scale\u pos\u weight
对此做出了规定

有关详细信息,请参阅
对于不平衡数据集,第一件事是确保少数标签示例的过度表示。XGBoost使用参数
scale\u pos\u weight
对此做出了规定

有关详细信息,请参阅