Python 机器学习中因变量值的正确分割？_Python_Python 3.x_Machine Learning_Oversampling

Python 机器学习中因变量值的正确分割？

python python-3.x machine-learning

Python 机器学习中因变量值的正确分割？,python,python-3.x,machine-learning,oversampling,Python,Python 3.x,Machine Learning,Oversampling,我正在用Python制作一个机器学习模型，数据集中只有分类变量。我希望精度至少为90%（对于因变量中的值1）在原始数据（我从数据库中提取的原始YTD数据）中，1:0的比率为61:39，但这有所不同。两个月前，这个比例是75:25。我没有用这些数据得到我想要的精度。经过反复试验，我意识到如果1:0的比例是85:15，那么我可以得到1和0的精度都在90%以上。换句话说，1和0的预测正确率都超过90%。请注意，我没有做过过度采样或采样不足。我只是删除了一些因变量值为0的行，以得到1:0的比率，即85

我正在用Python制作一个机器学习模型，数据集中只有分类变量。我希望精度至少为90%（对于因变量中的值1）

在原始数据（我从数据库中提取的原始YTD数据）中，1:0的比率为61:39，但这有所不同。两个月前，这个比例是75:25。我没有用这些数据得到我想要的精度。经过反复试验，我意识到如果1:0的比例是85:15，那么我可以得到1和0的精度都在90%以上。换句话说，1和0的预测正确率都超过90%。请注意，我没有做过过度采样或采样不足。我只是删除了一些因变量值为0的行，以得到1:0的比率，即85:15

我想知道这种方法是否正确

谢谢