Statistics 机器学习和统计学有什么区别?

Statistics 机器学习和统计学有什么区别?,statistics,machine-learning,Statistics,Machine Learning,在谈到机器学习正在经历一场革命时,因为统计学正被应用于机器学习算法 但是就像所有的机器学习算法都是统计算法一样。。这两者的真正区别是什么?为什么在大多数大学里它们是分开的课程?两者之间没有太大的区别,主要是文化差异。机器学习起源于计算机科学,而统计学更像是数学。布兰登·奥康纳(Brendan O'Connor)写了一篇很好的博客文章,谈到了这一点 至于机器学习的非统计方法,有几种基于规则的方法(决策树、规则归纳、ILP),也有类似于控制问题强化学习的方法。这些对我来说不是很统计,但你可以说它们是

在谈到机器学习正在经历一场革命时,因为统计学正被应用于机器学习算法


但是就像所有的机器学习算法都是统计算法一样。。这两者的真正区别是什么?为什么在大多数大学里它们是分开的课程?

两者之间没有太大的区别,主要是文化差异。机器学习起源于计算机科学,而统计学更像是数学。布兰登·奥康纳(Brendan O'Connor)写了一篇很好的博客文章,谈到了这一点


至于机器学习的非统计方法,有几种基于规则的方法(决策树、规则归纳、ILP),也有类似于控制问题强化学习的方法。这些对我来说不是很统计,但你可以说它们是。。。如果你愿意的话,你可能会声称所有的生命都属于统计决策理论(事实上是这样的)。

统计学把一切都建立在概率模型的基础上。一个典型的分析首先假设您的数据是来自具有某种分布的随机变量的样本,然后对分布的参数进行推断


机器学习可能使用概率模型,当它使用概率模型时,它与统计学重叠。但是机器学习并不是那么致力于概率。它也愿意使用其他不基于概率的方法来解决问题。

也许值得指出的是,类似的问题正在

中得到解决和讨论,我可以看到一些重要的区别:

#范围:机器学习使用统计模型,但也使用其他模型,如动态规划、强化学习、人工智能或优化技术

#观点:统计学通常关注估计量的属性(无偏性、联想行为),机器学习主要关注现实世界问题的解决

#研究领域:虽然统计学可以被视为应用数学的一个分支,但机器学习可以被视为计算机科学的一个分支


#代码开发和应用:虽然从事统计工作的人通常对R(或SAS、STATA、EVIEWS)有一定的偏好,但从事机器学习的人通常选择Python(或另一种结构化编程语言)

统计侧重于数据分析的各个方面,如描述性、探索性、,推理性、预测性和因果性。但是,机器学习只关注预测建模。

机器学习是

  • 一种无需依赖基于规则的编程就能从数据中学习的算法

  • 计算机科学和人工智能的一个分支领域,研究如何建立能够从数据而不是明确编程指令中学习的系统

统计建模是

  • 以数学方程的形式对变量之间的关系进行形式化

  • 数学的一个分支领域,研究发现变量之间的关系以预测结果


如果机器学习系统不是编程为执行任务,而是编程为学习执行任务,那么它就是真正的学习系统。这是一个数据驱动的练习。现代机器学习并不依赖于一套丰富的算法技术。几乎所有这种机器学习形式的应用都基于深度神经网络。这是我们现在倾向于称之为深度学习的领域,它是机器学习的一种专门化,经常应用于人工智能较弱的应用程序中,机器执行人工任务。

在ML中,其思想是为这种情况建立一个单独的模型,在这种情况下,你有数据,而你没有数据

另一方面,统计学是关于保存您拥有的数据并从中获得最佳结果的

不同之处在于哲学会影响你如何对待异常值。 在ML中,您可以找到足够多的异常值,这些异常值可以成为您实际培训的对象

有了统计数据,你会说,“我已经收集到了所有我能收集到的数据。”所以,你扔掉了异常值。这是一个哲学上的差异,因为使用ML和statistic的场景不同

统计数据通常用于有限的数据区域,或者ML处理大量数据。

机器学习: 机器学习是一门使计算机像人类一样学习和行动的科学,它通过输入数据和信息而无需明确编程

例如: 当我们来到电脑前,写一段平静的代码或程序,并告诉电脑一步一步地去做。但如果我们不这样做,系统会自行学习。我们只提供过去的数据(称为标签数据),系统在这个过程中学习所谓的训练过程,我们告诉系统结果是对的还是错的,反馈由系统接收,它会自我纠正,这就是它学习的对象,它会给出大多数情况下的正确输出。显然这不是100%正确,但目标是尽可能准确

统计数字: 这是一个数学领域,用来找出不同变量之间的关系

主要区别: 统计学:以数学方程的形式关注变量之间关系的形式化


机器学习:由不依赖基于规则的编程就能从数据中学习的算法组成

机器学习是由计算机科学家开发的,而统计学是由数学家开发的。 机器学习是建立在统计框架之上的。 统计学是在17世纪发展起来的,机器学习是在1959年发展起来的。