Machine learning 监督学习与分类同义吗？无监督学习与聚类同义吗？_Machine Learning_Classification_Cluster Analysis_Supervised Learning_Unsupervised Learning

Machine learning 监督学习与分类同义吗？无监督学习与聚类同义吗？

machine-learning

Machine learning 监督学习与分类同义吗？无监督学习与聚类同义吗？,machine-learning,classification,cluster-analysis,supervised-learning,unsupervised-learning,Machine Learning,Classification,Cluster Analysis,Supervised Learning,Unsupervised Learning,我是机器学习的初学者，最近读到了有监督和无监督的机器学习。看起来监督学习与分类同义，而非监督学习与聚类同义，是吗？否监督学习是当你知道正确的答案（目标）时。根据它们的类型，可能是（分类目标），（数字目标）或（顺序目标）（此列表并不完整，可能还有其他类型我忘记或不知道）相反，在无监督的学习环境中，我们不知道正确的答案，我们试图从数据中推断、学习一些结构。无论是簇数还是低维近似（实际上，人们可能会认为簇化是维度缩减的极端1D情况）。同样，这可能离完整性还很远，但总体思路是关于隐藏的结构，我们试图

我是机器学习的初学者，最近读到了有监督和无监督的机器学习。看起来监督学习与分类同义，而非监督学习与聚类同义，是吗？

否

监督学习是当你知道正确的答案（目标）时。根据它们的类型，可能是（分类目标），（数字目标）或（顺序目标）（此列表并不完整，可能还有其他类型我忘记或不知道）

相反，在无监督的学习环境中，我们不知道正确的答案，我们试图从数据中推断、学习一些结构。无论是簇数还是低维近似（实际上，人们可能会认为簇化是维度缩减的极端1D情况）。同样，这可能离完整性还很远，但总体思路是关于隐藏的结构，我们试图从数据中发现它。

否

相反，在无监督的学习环境中，我们不知道正确的答案，我们试图从数据中推断、学习一些结构。无论是簇数还是低维近似（实际上，人们可能会认为簇化是维度缩减的极端1D情况）。同样，这可能离完整性还有很远的距离，但总体思路是关于隐藏的结构，我们试图从数据中发现它。

监督学习是指当您标记了训练数据时。换句话说，您有一个明确的目标来优化您的方法

典型的（有监督的）学习任务是分类和回归：学习预测分类（分类）、数值（回归）值或等级（学习等级）

无服务学习是一个奇怪的术语。因为大多数时候，这些方法并没有“学习”任何东西。因为他们会从中学到什么？你没有训练数据吗

有很多无监督的方法不适合“学习”范式。这包括降维方法，如PCA（它比任何“机器学习”都要早——PCA是1901年提出的，比计算机早得多！）。其中许多只是数据驱动的统计（与参数化统计相反）。这包括大多数聚类分析方法、离群点检测。。。为了理解这些，最好走出“学习”心态。许多人难以理解这些方法，因为他们总是以学习中常见的“最小化目标函数f”的心态思考

以DBSCAN为例。最流行的聚类算法之一。它不适合学习范式。它可以很好地解释为图论构造：（密度）连通分量。但它没有优化任何目标函数。它计算关系的传递闭包；但没有最大化或最小化的功能

类似地，APRIORI发现频繁项集；出现次数超过minsupp的项目组合，其中minsupp是用户参数。这是一个非常简单的定义；但是，当你有大量数据时，搜索空间会非常大。暴力手段无法在可接受的时间内完成。所以APRIORI使用了一种聪明的搜索策略来避免不必要的硬盘访问、计算和内存。但在学习中没有“更坏”或“更好”的结果。要么结果是正确的（完整的），要么不正确-结果上没有要优化的内容（仅在算法运行时）

将这些方法称为“无监督学习”是在将它们挤压到一种不属于它们的心态中。他们没有“学习”任何东西。既不优化函数，也不使用标签，也不使用任何类型的反馈。它们只是从数据库中选择一组特定的对象：APRIORI选择经常同时具有1的列；DBS可以在密度图中选择连接的组件。要么结果正确，要么不正确

一些（但并非所有）无监督方法可以形式化为优化问题。在这一点上，它们变得类似于流行的监督学习方法。例如，k-均值是一个最小化问题。PCA是一个最小化问题，实际上与线性回归关系太密切。但情况正好相反。许多机器学习任务转化为优化问题；并且可以用通用的统计工具来解决，这恰好在机器学习中非常流行（例如线性规划）。然后，所有“学习”部分被包装成数据转换的方式，然后再将其输入优化器。在某些情况下，比如PCA，找到了一种计算最优解的非迭代方法（1901年）。因此，在这些情况下，您根本不需要通常的优化锤。

监督学习是指您标记了训练数据。换句话说，您有一个明确的目标来优化您的方法
典型的（有监督的）学习任务是分类和回归：学习预测分类（分类）、数值（回归）值或等级（学习等级）
无服务学习是一个奇怪的术语。因为大多数时候，这些方法并没有“学习”任何东西。因为他们会从中学到什么？你没有训练数据吗
有很多无监督的方法不适合“学习”范式。这包括降维方法，如PCA（它比任何“机器学习”都早），PCA被提出