SAS数据平衡良好&;坏的
我有一个数据集,其中BAD的百分比非常低。有谁能建议一种方法来平衡使用SAS的数据集,以便逻辑回归运行提供更好的结果?下面是一个例子。提前谢谢SAS数据平衡良好&;坏的,sas,logistic-regression,proc,Sas,Logistic Regression,Proc,我有一个数据集,其中BAD的百分比非常低。有谁能建议一种方法来平衡使用SAS的数据集,以便逻辑回归运行提供更好的结果?下面是一个例子。提前谢谢 ID X1 X2 X3 X4 X5 Target 1 87 400 2 0 0 0 2 70 620 1 0 0 0 3 66 410 3 0 0 0 4 85 300 1 0 0 0 5 100 200 4 0 0 0 6 201 110 1 0
ID X1 X2 X3 X4 X5 Target
1 87 400 2 0 0 0
2 70 620 1 0 0 0
3 66 410 3 0 0 0
4 85 300 1 0 0 0
5 100 200 4 0 0 0
6 201 110 1 0 0 0
7 132 513 3 0 0 0
8 98 417 4 0 0 0
9 397 620 1 0 0 1
10 98 700 5 0 0 1
您可以对不良百分比进行过采样,然后使用
proc logistic
的score
语句中的priorevent
选项来纠正过采样。网上有很多例子可以帮助你进一步了解这一点。谢谢你的建议Keith。我在过去几天里试着寻找一些合适的方法,但无法找出过度采样的原因,因此发布了问题,以便找到解决方法。如果你能提些建议,那就太好了?提前谢谢