Scala聚合函数与Spark RDD聚合函数_Scala_Apache Spark_Aggregate Functions_Lazy Evaluation - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/arduino/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Scala聚合函数与Spark RDD聚合函数_Scala_Apache Spark_Aggregate Functions_Lazy Evaluation - Fatal编程技术网

Scala聚合函数与Spark RDD聚合函数

scala apache-spark

Scala聚合函数与Spark RDD聚合函数,scala,apache-spark,aggregate-functions,lazy-evaluation,Scala,Apache Spark,Aggregate Functions,Lazy Evaluation,以下是该函数的定义：斯卡拉： aggregate[B](z: => B)(seqop: (B, A) => B, combop: (B, B) => B): B Spark RDD： aggregate[B](z: B)(seqop: (B, A) => B, combop: (B, B) => B): B 我知道Scala聚合函数设计用于并行集合，Spark RDD聚合函数设计用于分布式集合但是，为什么Scala中的z参数是惰性格式，而Spark RDD中

以下是该函数的定义：

斯卡拉：

aggregate[B](z: => B)(seqop: (B, A) => B, combop: (B, B) => B): B

Spark RDD：

aggregate[B](z: B)(seqop: (B, A) => B, combop: (B, B) => B): B

我知道Scala聚合函数设计用于并行集合，Spark RDD聚合函数设计用于分布式集合

但是，为什么Scala中的z参数是惰性格式，而Spark RDD中的z参数是渴望格式？首先，这是Scala中的一个按名称调用的参数。这意味着每次使用它们时都会对其进行求值，这与lazy不同，后者在第一次使用时只对其求值一次，并且所有后续调用都使用该结果。（）

因此spark依赖于分布式数据集，这意味着可以在多个节点上进行计算。我认为他们选择了零元素，一个按值调用的参数（你称之为“渴望”），避免在执行此计算的每个节点上重新计算它。
可以肯定的是，所有转换都与Spark的底层架构有关。这也可能是为了简化Java的调用。我认为它不一定与Spark的底层架构有关，因为其他转换如fold在Scala和Spark RDD中具有相同的定义。那么，总的来说，有什么特别之处呢？

[apache spark]相关文章推荐

Apache spark 是否可以通过Spark进行自定义联接（而不是通过主键）？ apache-spark

Apache spark 使用StructType为Pyspark.sql设置架构时的语法 apache-spark pyspark

Apache spark 如何交叉验证随机森林模型？ apache-spark

Apache spark pyspark列不适用 apache-spark pyspark

Apache spark Datastax Cassandra Spark教程中的DSE VM在Jupyter中出现“死内核”错误 apache-spark

Apache spark 使用Spark流在Hbase/HDFS中保存protobuf apache-spark hbase protocol-buffers

Apache spark sc.parallelize和sc.textFile之间有什么区别？ apache-spark pyspark

Apache spark 添加唯一ID的Spark数据集 apache-spark

Apache spark ApacheKafka异常：org.Apache.Kafka.clients.consumer.KafkaConsumer.subscribe（Ljava/util/List；） apache-spark apache-kafka

Apache spark 优雅的迭代方式&；Spark数据帧中的比较 apache-spark

Apache spark 递归读取文件Spark wholeTextFiles apache-spark pyspark

Apache spark Spark合并两个数据帧，并通过覆盖第二个数据帧的值来创建单个数据帧 apache-spark

Apache spark HDFS中大于块大小的文件 apache-spark hadoop

Apache spark Spark结构化流式处理大型文件 apache-spark apache-kafka

Apache spark Spark JDBC并行性 apache-spark dataframe jdbc parallel-processing

Apache spark 提交给kubernetes群集中的Spark Master apache-spark kubernetes

Apache spark 如何转换一些pyspark数据帧'；将列转换为具有其列名的dict，并将它们组合为json列？ apache-spark pyspark

Apache spark 从collect_集合创建列值的唯一方式 apache-spark pyspark

Apache spark 如何在Spark中设置单个输出值的格式？ apache-spark pyspark

Apache spark 如何将不同长度的多个RDD组合成具有特定订单模式的单个RDD？ apache-spark

随机文章推荐

[scala]相关推荐

Scala 将第一个参数旋转到一个函数，使其变为第n个
Scala Haskell Functional Programming

Scala 为大型机编写自己的密钥发布程序
Scala

从Scala中终止挂起进程
Scala Process

Scala 方法何时需要（或禁止）括号？
Scala

Scala 当使用清单（或TypeTag）隐式参数时，重载失败？
Scala

Scala 如何设置离散对象实例化的顺序？
Scala Object

Scala 播放JSON不变量函子
Scala Playframework

Scala 按比例读取文件并在到达文件末尾时执行某些操作的方法
Scala Playframework

Scala 获取在中定义宏的类的字段成员
Scala Macros

async Action api在play framework 2.2.x for scala中是如何工作的？
Scala Asynchronous Playframework Playframework 2.0 Akka

Scala 递归列表逻辑中的错误
Scala Recursion

Scala 使用var筛选RDD的意外行为
Scala Apache Spark

Scala 获取spark中的hdfs文件路径
Scala Apache Spark

如何将丰富我的库模式应用于Scala集合？对于scala 2.11+；
Scala

如何在scala中获取行号、函数名、包名？
Scala Playframework

Scala 右关联运算符：
Scala

使用MVC格式的Scala中的类型不匹配
Scala Model View Controller

Scala ApacheSpark窗口化中滞后与行计算的结合
Scala Apache Spark

Scala似乎忽略了一些代码
Scala Apache Spark

Scala 如果没有匹配类型怎么办？
Scala

Scala 如何使用mapPartition或类似工具在执行器中执行涉及rdd的操作？
Scala Apache Spark

Scala 如何在应用程序级别覆盖日志级别
Scala Apache Spark Sbt

Scala Spark作为带有Hive的执行引擎
Scala Apache Spark Hadoop Hive

Scala 单眼镜斯卡拉。如何使用递归数据？
Scala

IntelliJ显示有关依赖方法类型的类型不匹配错误，即使sbt编译良好（scala）
Scala Intellij Idea

Scala 如何使用Spark内置函数转换贴图值？
Scala Apache Spark

这个返回类型在scala中的作用是什么？
Scala

Scala sbt错误：对象spark不是包org.apache的成员
Scala Apache Spark Sbt

Scala 尝试导入sbt插件时未解析的依赖项
Scala Sbt

在使用playframework和scala创建zip文件时，创建并流式传输该文件
Scala Playframework

Tags

Localization Module Terraform Coding Style Amazon S3 Opencv Sdk Linux Ruby On Rails 3 Mpi Windows Phone 8.1 Yii Maven 2 Log4j Angular6 Wolfram Mathematica Reporting Services Mono Permissions Uiview Ldap Twitter Bootstrap 3 Vector Typescript Yocto Firebase Antlr Windows Synchronization Node.js Vba Twilio Caching Google Analytics Encryption Data Structures Eclipse Plugin Centos Gdb Ios6 Redux Internet Explorer Ssis Mvvm Cookies Snowflake Cloud Data Platform Ftp Proxy Keyboard Asp.net Mvc 3 Prometheus Antlr4 .net Google Chrome Devtools Templates Sockets Vb.net Socket.io Gwt Lotus Notes Smalltalk Entity Framework Core Mercurial Hive Reflection Wpf Xamarin.android Memory Leaks Gitlab Testing Laravel Akka Xslt Select Python Jquery Ui Parallel Processing Doctrine Orm Stm32 Sencha Touch 2 Webgl Uml Speech Recognition Fortran Twitter File Object Cocos2d Iphone Codenameone Youtube Asp.net Mvc 4 Kotlin Wso2 Parse Platform Recursion Install4j Extjs Google App Engine Dialogflow Es String Bots Abap Imagemagick Apache Storm Content Management System Tcp Ajax Activerecord Ruby On Rails Frameworks Phpstorm Sencha Touch Csv Google Chrome Extension Directory Hibernate Google Cloud Dataflow Sqlite Artifactory Javafx Ethereum Exchange Server For Loop Jquery Mobile Url Rewriting Jersey Kdb Compression Exception Handling Path Http Ms Word Sass Orientdb Vagrant Opengl Es Ember.js Syntax Ipython View Loopbackjs Unit Testing Webpack Eclipse Rcp Notifications Bison Android Fragments Sbt Pandas Windows 8 Import Aurelia Discord Glassfish Windows 7 Ionic2 Jsf 2 Java Oracle10g Next.js Isabelle Visual Studio Code Cassandra Animation Linkedin Windows Installer Kibana Google Api Delphi Openshift Ansible Com Character Encoding Exception Project Management Visual Studio 2013 Windows Phone 8 Pagination Less Charts Bazel Datetime Powerbi Visual C++ Jms Programming Languages Sugarcrm Linux Kernel Udp Entity Framework C# 3.0 Talend Azure Hyperledger Fabric Logstash Vim Geolocation Gtk Azure Functions Vue.js Express

Copyright © 2024. All Rights Reserved by - Fatal编程技术网