Spark使用过滤条件Scala在另一个RDD上迭代RDD_Scala_Apache Spark_Spark Streaming_Rdd_Mapr - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Spark使用过滤条件Scala在另一个RDD上迭代RDD_Scala_Apache Spark_Spark Streaming_Rdd_Mapr - Fatal编程技术网

Spark使用过滤条件Scala在另一个RDD上迭代RDD

scala apache-spark

Spark使用过滤条件Scala在另一个RDD上迭代RDD,scala,apache-spark,spark-streaming,rdd,mapr,Scala,Apache Spark,Spark Streaming,Rdd,Mapr,我想用一些附加的过滤条件迭代一个大RDD和一个小RDD。下面的代码工作正常，但进程仅使用驱动程序运行，而不是分布在节点上。那么，请建议其他方法 val cross = titlesRDD.cartesian(brRDD).cache() val matching = cross.filter{ case( x, br) => ((br._1 == "0") && (((br._2 ==((x._4))) && ((br._3 ex

我想用一些附加的过滤条件迭代一个大RDD和一个小RDD。下面的代码工作正常，但进程仅使用驱动程序运行，而不是分布在节点上。那么，请建议其他方法

val cross = titlesRDD.cartesian(brRDD).cache()
 val matching = cross.filter{ case( x, br) => 
    ((br._1 == "0") && 
   (((br._2 ==((x._4))) &&
    ((br._3 exists (x._5)) || ((br._3).head=="")) 
}

谢谢，

madhu

您可能不想缓存

交叉。我相信，不缓存它会让笛卡尔积根据过滤器的需要“在运行中”发生，而不是实例化内存中笛卡尔积可能产生的大量组合
此外，在使用标题RDD进行笛卡尔积之前，您可以执行brRDD.filter（u.\u 1==“0”）
，例如
val cross = titlesRDD.cartesian(brRRD.filter(_._1 == "0"))

然后适当修改用于创建匹配的过滤器。
小RDD有多大？你能把它改成广播变量吗？是的，我试过用广播变量。。相同的性能..：（考虑使用迭代和MapPartitions方法，如下面的URL[link]（）对于初学者，您可以提供关于输入数据和/或示例输入类型的信息吗？这两个数据集有多大？另外，为什么您认为该进程只使用驱动程序运行？




[apache spark]相关文章推荐



                                                        
                                       





随机文章推荐



                                                        
Android studio Android Studio中用于操作系统的代码格式化快捷方式
android-studio 
Android studio 单击鼠标展开树中的所有条目
android-studio 
Android studio '；未能密封apk'；在'；项目运行'；在安卓工作室
android-studio 
Android studio Android Studio编辑器中的屏幕方向
android-studio 
Android studio Android Studio支持子风格吗？
android-studio 
Android studio 避免Android Studio和SDK下载
android-studio 
Android studio 编辑配置中没有调试器选项卡（Android Studio 2.3）
android-studiodebugging 
Android studio Kotlin REPL:由于可能的重新分配，捕获的成员值初始化被禁止
android-studiokotlin 
Android studio Launch.apk文件
android-studio 
Android studio Android Studio中的仿真器存在问题。小屏幕和应用程序将无法运行
android-studiokotlinandroid-emulator 
Android studio 如何从apk恢复用Kotlin编写的Android Studio项目
android-studiokotlin 
Android studio 如何准确显示时间？我需要那个零件代码
android-studio 
Android studio Can'；t在脱机模式下运行或构建我的简单应用程序
android-studiogradle 
Android studio Android Studio不断重命名模块
android-studiointellij-idea 
Android studio 安卓工作室14。为什么activity_main.xml布局设计器中有两个相同的屏幕（白色和绿色）？
android-studio 
Android studio 我想为places制作一个自动完成适配器，但我'；我不知道怎么做。我使用的教程很复杂或过时
android-studioautocomplete 
Android studio 类型不匹配：推断类型为FragmentManager，但应为FragmentActivity
android-studiokotlin 
Android studio 模拟器没有出现
android-studioflutter 
Android studio 如何在运行firebase查询后将电话联系人添加到sqlite数据
android-studio 
Android studio 在Android Studio的材质设计中，密码切换图标被反转
android-studio


                                        

                                        
                                        


                                                
                                                        [scala]相关推荐
                                                        
Scala请求-响应消息传递设计中的类型继承误解
									Scala
							 									Design Patterns
							 									Generics
							 									Inheritance
							 
Scala 马文找到了；org.foo.Bar“；及；org.（其他一些）foo.Bar“构建失败了
									Scala
							 									Maven
							 									Build
							 
Scala 指定下限约束还允许您使用在下限上定义的成员？
									Scala
							 									Types
							 
Scala 我可以使用折叠功能来实现打包功能吗？
									Scala
							 									Functional Programming
							 
Scala apachespark共享计数器
									Scala
							 									Apache Spark
							 
在使用Scala.js为Screep生成逻辑时，如何解决此错误？
									Scala
							 
Scala json4s xpath报告java.lang.NoSuchMethodError
									Scala
							 
Scala-为什么我要用关键字lazy定义流？
									Scala
							 									Stream
							 
如何在Scala中将Dataframe转换为H2O？
									Scala
							 
Scala中的广义惰性置换
									Scala
							 
Scala 联接RDD上的随机分区器行为
									Scala
							 									Apache Spark
							 
了解scala中的列表/集合
									Scala
							 									Collections
							 
Scala 如何在响应中删除Future选项Future的许多层
									Scala
							 									Playframework
							 
Scala 为什么Foo[C]是Foo[B]的一个亚型？
									Scala
							 
Scala 要在全局spark rdd上写入的映射函数
									Scala
							 									Apache Spark
							 
Scala SparkSubmit异常（NoClassDefFoundError），即使SBT编译和打包成功
									Scala
							 									Apache Spark
							 									Sbt
							 
Scala 如何在RDD数据类型的开头和结尾加上引号？
									Scala
							 									Apache Spark
							 
Scala 如何在加入操作之前转换数据帧？
									Scala
							 									Apache Spark
							 
Scala 根据Spark中对PCA的贡献选择最重要的变量
									Scala
							 									Apache Spark
							 
scala-for循环中的if/else
									Scala
							 									Loops
							 									For Loop
							 									If Statement
							 
Scala play框架中的重定向
									Scala
							 									Playframework
							 									Playframework 2.0
							 
从地图到csv scala的优雅方式（展平地图）
									Scala
							 									Dictionary
							 
Scala 如何从地图中获取最接近的值？
									Scala
							 									Maps
							 
Scala 如何保持与websocket服务器的连接打开？
									Scala
							 									Akka
							 
使用Scala中的单个函数在列表和向量中求整数元素之和
									Scala
							 
Scala 如何将一个大型拼花文件拆分为多个拼花，并按时间列保存在不同的hadoop路径中
									Scala
							 									Apache Spark
							 
Scala 使用partitionBy并在spark中合并在一起
									Scala
							 									Apache Spark
							 
Scala 如何从CSV文件返回
									Scala
							 									Csv
							 
Scala 表不包括'；不能用hibernate创建
									Scala
							 									Hibernate
							 
Spark Scala-确定跨多行的日期之间的间隔
									Scala
							 									Date
							 									Apache Spark
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Amazon Ec2
System Verilog
Sprite Kit
Ionic Framework
Ajax
Linux Kernel
Resharper
Geolocation
Localization
Serialization
Events
Image
Django
Ide
Android Layout
Google Maps
Apache Camel
Google Chrome Devtools
Haskell
Prometheus
Compilation
Macos
Wordpress
Kdb
Jupyter Notebook
Google Maps Api 3
Youtube Api
Jboss
Proxy
For Loop
Inheritance
Exception Handling
Gatsby
Random
Maps
Appium
Ftp
Openssl
Docker Compose
Core Data
Programming Languages
Gridview
Ag Grid
Select
Web Services
Yaml
Statistics
Aurelia
Logstash
Webgl
Drupal 7
Usb
Ibm Mq
Redirect
User Interface
Ms Access
Wpf
Properties
Url
Sharepoint 2007
Asp.net Mvc 3
Gruntjs
Cakephp
Asp.net Core
Sap
Log4net
Botframework
Gradle
Pytorch
Drupal
Lua
Debugging
Subsonic
Dart
Download
Telegram
Swagger
Intellij Idea
C++11
Flash
Exception
Dependency Injection
Javafx 2
Amazon Web Services
Join
Chef Infra
Gmail
Jar
Windows Phone 7
Crystal Reports
Jsp
Gps
Ldap
Cygwin
Xpath
Google Colaboratory
Vb6
Ios5
Gtk
Jquery Ui
Google Plus
Azure Sql Database
Django Rest Framework
Microservices
Vagrant
Ocaml
Charts
Bootstrap 4
Sml
Sorting
Angular6
X86
Sockets
Postgresql
Model View Controller
Lisp
Spring
Iis
Graphics
Apache Kafka
Microsoft Graph Api
Stream
Tree
Ios7
Node.js
Ansible
Cocos2d Iphone
Scheme
Centos
Hbase
Openlayers
Alfresco
Stripe Payments
Netlogo
Moodle
Awk
Entity Framework 4
Vuejs2
Spring Mvc
Lotus Notes
Aws Lambda
Breeze
C
Report
Keras
Active Directory
Zend Framework
Mapreduce
String
Oauth
Mpi
Actionscript 3
Ibm Cloud
Phantomjs
Sas
Nativescript
Asp Classic
Coq
Sharepoint 2010
Glassfish
Directx
Logic
Reference
Tomcat
Parallel Processing
Arrays
Osgi
Twilio
Dotnetnuke
Computer Science
Testing
Big O
Ios8
Android Studio
Plsql
Google Chrome Extension
Sparql
Groovy
Video Streaming
Csv
Puppet
Open Source
Quickbooks
Monitoring
Iframe
Snmp
Identityserver4
Airflow
Xampp
Python Sphinx
3d
Influxdb
Nest
Drools
Dialogflow Es
Content Management System
Mono
Zend Framework2
Llvm
Batch File
Methods


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网