Machine learning 我可以通过对类进行编码将分类问题转化为回归问题吗？_Machine Learning_Regression_Classification

Machine learning 我可以通过对类进行编码将分类问题转化为回归问题吗？

machine-learning

Machine learning 我可以通过对类进行编码将分类问题转化为回归问题吗？,machine-learning,regression,classification,Machine Learning,Regression,Classification,如果所有分类标签都可以用数值表示，这是否意味着我可以通过将分类标签编码为数字来在任何分类任务上使用回归模型我最近正在研究一个二进制分类问题，它有两种输出类型：“0”表示正，而“1”表示负。我使用了随机森林分类器来解决这个问题，但我看到其他人使用随机森林回归器来解决同样的问题。经过思考，这对我来说是有意义的——最终的期望输出是连续值，我可以训练一个回归模型来获得代表输出类的预测连续值这让我想到是否有可能在其他分类任务中使用回归模型。例如：为了对“猫”和“狗”的两幅图像进行分类，我使用Labe

如果所有分类标签都可以用数值表示，这是否意味着我可以通过将分类标签编码为数字来在任何分类任务上使用回归模型

我最近正在研究一个二进制分类问题，它有两种输出类型：“0”表示正，而“1”表示负。我使用了随机森林分类器来解决这个问题，但我看到其他人使用随机森林回归器来解决同样的问题。经过思考，这对我来说是有意义的——最终的期望输出是连续值，我可以训练一个回归模型来获得代表输出类的预测连续值

这让我想到是否有可能在其他分类任务中使用回归模型。例如：

为了对“猫”和“狗”的两幅图像进行分类，我使用LabelEncoder将其编码为0和1，然后它就变成了一个回归问题

希望我的问题很清楚，谢谢你的帮助

不，你不能。不能定义猫<狗或狗<猫。回归就是基于这个假设。当您使用回归进行二元分类时，如逻辑回归，它实际上是预测一个连续变量类的概率。

标记为一个问题，应该在stats.stackexchange.com上提问为什么？如果在一个二元因变量上建立一个正则回归会发生什么？线性回归模型基于一个假设，即结果Y是连续的，并且存在正态分布的误差（在消除因协变量X_{1}，…，X_{p}导致的系统平均变化后）。如果结果变量是二进制的，那么这个假设显然是违反的，因此，一般来说，我们可能认为我们的推断是无效的。我明白了，所以对于二进制分类任务，输出是离散的，通过梯度下降优化模型是没有意义的。类“1”不应大于类“0”，这就是我们不应在分类任务上使用回归模型的原因。我刚刚看到有人在二元分类任务中使用随机森林回归树，所以我有这个问题。谢谢