Apache spark 为什么我们需要一个虚拟机来安装和使用ApacheSpark?

Apache spark 为什么我们需要一个虚拟机来安装和使用ApacheSpark?,apache-spark,Apache Spark,我是大数据生态系统的新手。我正在尝试安装ApacheSpark,但我在网上找到的教程要求我首先安装虚拟机。有人能解释一下为什么我的Windows机器上需要虚拟机吗?你不需要 Spark使用Java。Java在所有操作系统上运行 教程可能会使用Hortonworks或Cloudera虚拟机,因为所有内容都是预先配置的,但这只是您可以在自己的操作系统上进行的优化 Apache Spark不要求您在虚拟机上运行它。你可以在自己的本地计算机上运行它。然而,通常在运行apachespark之类的软件时,

我是大数据生态系统的新手。我正在尝试安装ApacheSpark,但我在网上找到的教程要求我首先安装虚拟机。有人能解释一下为什么我的Windows机器上需要虚拟机吗?

你不需要

Spark使用Java。Java在所有操作系统上运行


教程可能会使用Hortonworks或Cloudera虚拟机,因为所有内容都是预先配置的,但这只是您可以在自己的操作系统上进行的优化


Apache Spark不要求您在虚拟机上运行它。你可以在自己的本地计算机上运行它。然而,通常在运行apachespark之类的软件时,您要处理大量的数据,因此需要在集群中运行大量的软件实例。这种类型的需求,即拥有大型数据集的效果,意味着在虚拟机上运行它们更有意义,您可以在一台服务器上运行多个虚拟机,而不是在每台物理服务器上运行一个实例。

Hi Rietty,感谢您解释其背后的原因。我对Spark是个新手,我觉得我现在对Spark有了更好的理解。再次感谢,阿伦。@Arunkumar如果回答了问题(绿色复选标记),请按预期标记答案。嗨,cricket_007,我是spark新手,我在网上找到的大多数教程都使用Hortonworks或cloudera,但现在我明白了原因。非常感谢。