Machine learning 这个问题是分类还是回归? 在Andrew Ng的一次讲座中,他问下面的问题是分类还是回归问题。答:这是一个回归问题

Machine learning 这个问题是分类还是回归? 在Andrew Ng的一次讲座中,他问下面的问题是分类还是回归问题。答:这是一个回归问题,machine-learning,regression,classification,Machine Learning,Regression,Classification,您有大量相同物品的库存。你想预测怎么做 其中许多商品将在未来3个月内售出 看来我错过了什么。根据我的理解,这应该是分类问题。原因是我们必须将每个项目分为两类,即它是否可以出售,这是离散值而不是连续值 不确定我的理解差距在哪里。你的想法是,你有一个物品数据库,其中有各自的特点,并希望预测每件物品是否会被出售。最后,您只需计算可以销售的商品数量。如果你用这种方式来描述这个问题,那么它实际上就是一个分类问题 但是,请注意问题中的以下句子: 您有大量相同物品的库存 相同的项目意味着所有项目将具有完全相同

您有大量相同物品的库存。你想预测怎么做 其中许多商品将在未来3个月内售出

看来我错过了什么。根据我的理解,这应该是分类问题。原因是我们必须将每个项目分为两类,即它是否可以出售,这是离散值而不是连续值


不确定我的理解差距在哪里。

你的想法是,你有一个物品数据库,其中有各自的特点,并希望预测每件物品是否会被出售。最后,您只需计算可以销售的商品数量。如果你用这种方式来描述这个问题,那么它实际上就是一个分类问题

但是,请注意问题中的以下句子:

您有大量相同物品的库存

相同的项目意味着所有项目将具有完全相同的功能。如果你想出一个二元分类器来判断一个产品是否可以出售,因为所有的特征值都是完全相同的,你的分类器会把所有的项目放在同一个类别中

我猜,为了解决这个问题,你可能会访问过去5年每月售出商品的时间序列。然后,你将不得不处理这些数据并对未来进行插值。您不会单独对每个项目进行分类,而是实际计算一个数值,该数值指示未来1、2和3个月的已售出项目数

根据:

例如数字识别示例,其目的是将每个输入向量分配给有限个离散类别中的一个,这种情况称为分类问题。如果期望的输出由一个或多个连续变量组成,则该任务称为回归

除此之外,重要的是要理解统计数据中定义的:

分类变量(有时称为名义变量)是指具有两个或两个以上类别的变量,但这些类别没有内在的顺序。例如,性别是一个分类变量,有两个类别(男性和女性),类别没有内在的顺序

(……)

序数变量类似于分类变量。两者之间的区别在于变量的顺序是明确的。例如,假设您有一个可变的经济状况,有三个类别(低、中、高)。除了能够将人们分为这三个类别之外,您还可以将类别分为低、中、高

(……)

数值变量与序数变量类似,只是数值变量值之间的间隔相等。例如,假设你有一个变量,比如以美元计量的年收入,我们有三个人,他们分别挣10000美元、15000美元和20000美元

尽管最终结果将是一个整数(一组离散的数字),但请注意它仍然是一个整数。你可以用数学方法处理数值(例如,计算下一年的平均销售数量,找出未来3个月的峰值销售数量…),但你不能用离散类别(例如,手机和电话的平均销售数量是多少?)

分类问题是指输出是分类的或有序的(根据Bishop,离散类别)。回归问题输出数值(根据Bishop,连续变量)


您的系统可能被限制为输出整数,而不是实数,但不会改变变量的数值性质。因此,您的问题是一个回归问题。

在问题陈述中,“这些项中有多少项”意味着结果应该是真实值[0,inf]。所以,这是一个回归问题,而不是分类问题。@twcmchange这是否意味着如果我要求单个项目可以出售或不出售,那么这将是分类问题?
多少
意味着确定金额,这意味着这是一个回归问题。分类问题会说明类似于
是否
或类似于
什么类型的
@stackoverflowuser2010您所说的
多少意味着确定一个金额,这意味着这是一个分类问题
我希望您的意思不是分类问题?@user3198603:修复了它。应该是“回归问题”谢谢Matheus。但是如果我按照你所说的克里斯托弗回归定义,这里的输出将是离散值,也就是说,在接下来的3个月里,每个月可以卖出多少商品?@user3198603主要的一点是,分类器预测的是离散类别,而不是数值。我用一个链接更新了我的答案,更详细地解释了分类值、序数值和数值之间的区别,这是一个来自统计学的概念,对于理解分类和回归之间的区别至关重要。是的,你说得对。实际上,为了更好地理解,我们可以说分类器预测离散值(或类)从预定义的类中,但对于回归结果,可以是任何无法预定义的连续值。
的一个相关问题是,您可能可以访问已售出商品的时间序列…
我的问题是,告诉回归模型选择特定特征(如销售月、节日、经济放缓)是否可行预测的月份。我相信我们可以指定功能,但如果我们不指定,它会自动选择它认为相关的任何功能。对吗?