Python 机器学习中因变量值的正确分割?
我正在用Python制作一个机器学习模型,数据集中只有分类变量。我希望精度至少为90%(对于因变量中的值1) 在原始数据(我从数据库中提取的原始YTD数据)中,1:0的比率为61:39,但这有所不同。两个月前,这个比例是75:25。我没有用这些数据得到我想要的精度。经过反复试验,我意识到如果1:0的比例是85:15,那么我可以得到1和0的精度都在90%以上。换句话说,1和0的预测正确率都超过90%。请注意,我没有做过过度采样或采样不足。我只是删除了一些因变量值为0的行,以得到1:0的比率,即85:15 我想知道这种方法是否正确 谢谢Python 机器学习中因变量值的正确分割?,python,python-3.x,machine-learning,oversampling,Python,Python 3.x,Machine Learning,Oversampling,我正在用Python制作一个机器学习模型,数据集中只有分类变量。我希望精度至少为90%(对于因变量中的值1) 在原始数据(我从数据库中提取的原始YTD数据)中,1:0的比率为61:39,但这有所不同。两个月前,这个比例是75:25。我没有用这些数据得到我想要的精度。经过反复试验,我意识到如果1:0的比例是85:15,那么我可以得到1和0的精度都在90%以上。换句话说,1和0的预测正确率都超过90%。请注意,我没有做过过度采样或采样不足。我只是删除了一些因变量值为0的行,以得到1:0的比率,即85