Hadoop 非mapreduce应用程序如何在纱线中工作?

Hadoop 非mapreduce应用程序如何在纱线中工作?,hadoop,mapreduce,yarn,bigdata,Hadoop,Mapreduce,Yarn,Bigdata,通过使用纱线,我们可以运行非mapreduce应用程序 但是它是如何工作的呢 在HDFS中,所有数据都存储在块中。对于每个块,一个mapper任务将获得create来处理整个数据集 但是非mapreduce应用程序,在不使用mapreduce的情况下,如何处理不同数据节点中的数据集 请解释。不要将Map reduce范例与其他应用程序(例如Spark)混淆。Spark可以在纱线下运行,但不使用映射器或减速器 相反,它使用执行器,这些执行器知道数据局部性,与mapreduce相同 spark驱动程

通过使用纱线,我们可以运行非mapreduce应用程序

但是它是如何工作的呢

在HDFS中,所有数据都存储在块中。对于每个块,一个mapper任务将获得create来处理整个数据集

但是非mapreduce应用程序,在不使用mapreduce的情况下,如何处理不同数据节点中的数据集


请解释。

不要将Map reduce范例与其他应用程序(例如Spark)混淆。Spark可以在纱线下运行,但不使用映射器或减速器

相反,它使用执行器,这些执行器知道数据局部性,与mapreduce相同

spark驱动程序将启动数据节点上的执行器,并在执行时尽量记住数据的位置

另外,不要将Map Reduce默认行为与标准行为混淆。您不需要为每个输入拆分设置一个映射器

此外,HDFS和Map Reduce是两种不同的东西。HDFS只是存储层,而Map Reduce处理处理