Machine learning 将数字目标转换为二进制有帮助吗?

Machine learning 将数字目标转换为二进制有帮助吗?,machine-learning,Machine Learning,我试图解决一个ML问题,目标变量是数字,比如说城市的污染水平。但客户对预测污染物的实际数量不感兴趣,他们只想根据商定的阈值了解污染水平是高还是低。(如果PM2.5水平高于200,则为高,否则为低) 我应该将其视为一个回归问题,并将数值PM2.5水平作为目标,还是将其视为一个分类问题,在该问题中,我根据阈值确定高/低污染水平的另一个特征,并使用该二元变量作为目标?这两种方法的优缺点是什么?如果有的话,会对准确性产生什么影响?如果您的客户对了解实际值不感兴趣,我建议使用分类模型 使用该方法将目标变量

我试图解决一个ML问题,目标变量是数字,比如说城市的污染水平。但客户对预测污染物的实际数量不感兴趣,他们只想根据商定的阈值了解污染水平是高还是低。(如果PM2.5水平高于200,则为高,否则为低)


我应该将其视为一个回归问题,并将数值PM2.5水平作为目标,还是将其视为一个分类问题,在该问题中,我根据阈值确定高/低污染水平的另一个特征,并使用该二元变量作为目标?这两种方法的优缺点是什么?如果有的话,会对准确性产生什么影响?

如果您的客户对了解实际值不感兴趣,我建议使用分类模型

使用该方法将目标变量转换为二进制值,并遵循分类路径


由于模型更多地关注分类边界,而回归模型可能倾向于尝试正确预测异常值/噪声数据点,因此分类将有更高的准确率

这个问题与编程无关,应该发布在Stack exchange()的数据科学网站上