Machine learning 监督学习与分类同义吗?无监督学习与聚类同义吗?

Machine learning 监督学习与分类同义吗?无监督学习与聚类同义吗?,machine-learning,classification,cluster-analysis,supervised-learning,unsupervised-learning,Machine Learning,Classification,Cluster Analysis,Supervised Learning,Unsupervised Learning,我是机器学习的初学者,最近读到了有监督和无监督的机器学习。看起来监督学习与分类同义,而非监督学习与聚类同义,是吗?否 监督学习是当你知道正确的答案(目标)时。根据它们的类型,可能是(分类目标),(数字目标)或(顺序目标)(此列表并不完整,可能还有其他类型我忘记或不知道) 相反,在无监督的学习环境中,我们不知道正确的答案,我们试图从数据中推断、学习一些结构。无论是簇数还是低维近似(实际上,人们可能会认为簇化是维度缩减的极端1D情况)。同样,这可能离完整性还很远,但总体思路是关于隐藏的结构,我们试图

我是机器学习的初学者,最近读到了有监督和无监督的机器学习。看起来监督学习与分类同义,而非监督学习与聚类同义,是吗?

监督学习是当你知道正确的答案(目标)时。根据它们的类型,可能是(分类目标),(数字目标)或(顺序目标)(此列表并不完整,可能还有其他类型我忘记或不知道)

相反,在无监督的学习环境中,我们不知道正确的答案,我们试图从数据中推断、学习一些结构。无论是簇数还是低维近似(实际上,人们可能会认为簇化是维度缩减的极端1D情况)。同样,这可能离完整性还很远,但总体思路是关于隐藏的结构,我们试图从数据中发现它。

监督学习是当你知道正确的答案(目标)时。根据它们的类型,可能是(分类目标),(数字目标)或(顺序目标)(此列表并不完整,可能还有其他类型我忘记或不知道)


相反,在无监督的学习环境中,我们不知道正确的答案,我们试图从数据中推断、学习一些结构。无论是簇数还是低维近似(实际上,人们可能会认为簇化是维度缩减的极端1D情况)。同样,这可能离完整性还有很远的距离,但总体思路是关于隐藏的结构,我们试图从数据中发现它。

监督学习是指当您标记了训练数据时。换句话说,您有一个明确的目标来优化您的方法

典型的(有监督的)学习任务是分类和回归:学习预测分类(分类)、数值(回归)值或等级(学习等级)

无服务学习是一个奇怪的术语。因为大多数时候,这些方法并没有“学习”任何东西。因为他们会从中学到什么?你没有训练数据吗

有很多无监督的方法不适合“学习”范式。这包括降维方法,如PCA(它比任何“机器学习”都要早——PCA是1901年提出的,比计算机早得多!)。其中许多只是数据驱动的统计(与参数化统计相反)。这包括大多数聚类分析方法、离群点检测。。。为了理解这些,最好走出“学习”心态。许多人难以理解这些方法,因为他们总是以学习中常见的“最小化目标函数f”的心态思考

以DBSCAN为例。最流行的聚类算法之一。它不适合学习范式。它可以很好地解释为图论构造:(密度)连通分量。但它没有优化任何目标函数。它计算关系的传递闭包;但没有最大化或最小化的功能

类似地,APRIORI发现频繁项集;出现次数超过minsupp的项目组合,其中minsupp是用户参数。这是一个非常简单的定义;但是,当你有大量数据时,搜索空间会非常大。暴力手段无法在可接受的时间内完成。所以APRIORI使用了一种聪明的搜索策略来避免不必要的硬盘访问、计算和内存。但在学习中没有“更坏”或“更好”的结果。要么结果是正确的(完整的),要么不正确-结果上没有要优化的内容(仅在算法运行时)

将这些方法称为“无监督学习”是在将它们挤压到一种不属于它们的心态中。他们没有“学习”任何东西。既不优化函数,也不使用标签,也不使用任何类型的反馈。它们只是从数据库中选择一组特定的对象:APRIORI选择经常同时具有1的列;DBS可以在密度图中选择连接的组件。要么结果正确,要么不正确


一些(但并非所有)无监督方法可以形式化为优化问题。在这一点上,它们变得类似于流行的监督学习方法。例如,k-均值是一个最小化问题。PCA是一个最小化问题,实际上与线性回归关系太密切。但情况正好相反。许多机器学习任务转化为优化问题;并且可以用通用的统计工具来解决,这恰好在机器学习中非常流行(例如线性规划)。然后,所有“学习”部分被包装成数据转换的方式,然后再将其输入优化器。在某些情况下,比如PCA,找到了一种计算最优解的非迭代方法(1901年)。因此,在这些情况下,您根本不需要通常的优化锤。

监督学习是指您标记了训练数据。换句话说,您有一个明确的目标来优化您的方法

典型的(有监督的)学习任务是分类和回归:学习预测分类(分类)、数值(回归)值或等级(学习等级)

无服务学习是一个奇怪的术语。因为大多数时候,这些方法并没有“学习”任何东西。因为他们会从中学到什么?你没有训练数据吗

有很多无监督的方法不适合“学习”范式。这包括降维方法,如PCA(它比任何“机器学习”都早),PCA被提出