Machine learning 预测销售量是回归问题还是分类问题?

Machine learning 预测销售量是回归问题还是分类问题?,machine-learning,supervised-learning,Machine Learning,Supervised Learning,我是一名机器学习初学者,目前正在Coursera上学习Andrew Ng的机器学习课程。在讲座中,他问了一个简单的问题:你会把下面的问题称为分类问题还是回归问题 您有大量相同物品的库存。你想预测有多少 这些商品中的一种将在未来3个月内售出 我之所以选择分类,是因为我认为我们只是预测会卖出1或不会卖出0。但他说,这是一个回归问题,因为有数千个相同的项目,这是一个连续的输出。我不明白它是如何连续输出的。在我看来,这是一个具有数千个值的离散输出。有人能给我解释一下吗 我不明白它是如何连续输出的。在我看

我是一名机器学习初学者,目前正在Coursera上学习Andrew Ng的机器学习课程。在讲座中,他问了一个简单的问题:你会把下面的问题称为分类问题还是回归问题

您有大量相同物品的库存。你想预测有多少 这些商品中的一种将在未来3个月内售出

我之所以选择分类,是因为我认为我们只是预测会卖出1或不会卖出0。但他说,这是一个回归问题,因为有数千个相同的项目,这是一个连续的输出。我不明白它是如何连续输出的。在我看来,这是一个具有数千个值的离散输出。有人能给我解释一下吗

我不明白它是如何连续输出的。在我看来,这是一个具有数千个值的离散输出

这里的连续输出没有形式上的数学意义;严格地说,输出的某些整数值是离散的,这是正确的,但这不是本文的重点

使其成为回归问题而不是分类问题的关键区别在于,在分类中,输出仅限于一些通常很少的预定义值/级别;很容易看出,这里的情况并非如此,因为销售的数量原则上可以是任何整数值,而将值18和19视为不同的类是毫无意义的。
尝试将分类输出视为通常可能没有顺序关系的类别也是有用的;从这个角度来看,18和19之间的差异可以被认为是相同的,18和856之间的差异只是不同的类别;直觉上,很明显,由于我们对确切的销售数量感兴趣,这些差异在他们之间是非常不同的,我们更愿意错误地预测18是19,而不是856…

谢谢!我现在明白了。请注意,问题是你想预测在未来3个月内这些商品的销量。这只是预测总数。这就是回归。它没有对每个库存项目进行单独的1/0预测。