Python 过采样会导致模型过拟合吗?
目标属性分布当前如下所示:Python 过采样会导致模型过拟合吗?,python,model,classification,oversampling,Python,Model,Classification,Oversampling,目标属性分布当前如下所示: mydata.groupBy("Churn").count().show() +-----+-----+ |Churn|count| +-----+-----+ | 1| 483| | 0| 2850| +-----+-----+ 我的问题是: 过采样方法,如:manully、smote、adasyn是否将使用可用数据创建新的数据点 如果我们使用这些数据来训练分类模型,它会不会是一个过度拟合的模型 我的问题是任何过采样方法(manully、smo
mydata.groupBy("Churn").count().show()
+-----+-----+
|Churn|count|
+-----+-----+
| 1| 483|
| 0| 2850|
+-----+-----+
我的问题是:
- 过采样方法,如:manully、smote、adasyn是否将使用可用数据创建新的数据点
- 如果我们使用这些数据来训练分类模型,它会不会是一个过度拟合的模型
- 数据不平衡问题主要分三步处理:
- 对少数民族阶级进行过度抽样
- 在大多数班级中
- 综合新的少数民族阶级