Lambda 使用pyspark交叉组合两个RDD_Lambda_Apache Spark_Rdd_Pyspark - Fatal编程技术网

Lambda 使用pyspark交叉组合两个RDD

lambda apache-spark pyspark

Lambda 使用pyspark交叉组合两个RDD,lambda,apache-spark,rdd,pyspark,Lambda,Apache Spark,Rdd,Pyspark,我如何交叉组合（这是正确的描述方式吗？）两个RDD 输入： rdd1 = [a, b] rdd2 = [c, d] 输出： rdd3 = [(a, c), (a, d), (b, c), (b, d)] 我尝试了rdd3=rdd1.flatMap（lambda x:rdd2.map（lambda y:（x，y）），它抱怨说，似乎您试图广播一个RDD或引用一个动作或转换中的RDD。。我猜这意味着您不能像列表理解那样嵌套动作，一条语句只能执行一个动作，因此您已经注意到无法执行转换nsformat

我如何交叉组合（这是正确的描述方式吗？）两个RDD

输入：

rdd1 = [a, b]
rdd2 = [c, d]

输出：

rdd3 = [(a, c), (a, d), (b, c), (b, d)]

我尝试了

rdd3=rdd1.flatMap（lambda x:rdd2.map（lambda y:（x，y））

，它抱怨说，

似乎您试图广播一个RDD或引用一个动作或转换中的RDD。

。我猜这意味着您不能像列表理解那样嵌套

动作

，一条语句只能执行一个

动作

，因此您已经注意到无法执行

转换nsformation

在另一个

转换

（注意

flatMap

和

map

是

转换

，而不是

操作

，因为它们返回RDD）。谢天谢地，Spark API中的另一个转换（即

笛卡尔（见附件）
因此，您需要执行rdd1。笛卡尔（rdd2）
您可以使用笛卡尔变换。文档中的示例：
>>> rdd = sc.parallelize([1,2])
>>> sorted(rdd.cartesian(rdd).collect())
[(1, 1), (1, 2), (2, 1), (2, 2)]

以你的情况来说，你会做的
rdd3=rdd1.笛卡尔（rdd2）




[apache spark]相关文章推荐



                                                        
Apache spark Spark—在JavaPairRDD中的每个元素上操作非序列化方法
apache-spark 
Apache spark 为什么Spark job会在Mesos上失败；hadoop:找不到“；？
apache-spark 
Apache spark 将Golang unix时间戳转换为Spark SQL格式
apache-spark 
Apache spark 数据帧/数据集Apache spark的逻辑计划
apache-spark 
Apache spark Spark和Hbase客户端中的版本兼容性
apache-sparkhbase 
Apache spark Spark单个操作是否需要持久性？
apache-spark 
Apache spark ApacheSpark：基于UI输入构建动态日期和时间过滤器
apache-spark 
Apache spark 在pyspark中对列表进行排序的udf
apache-sparkpyspark 
Apache spark 如何获得spark工作'；从日志中完成作业后，是否保留沿袭/dag信息？不是从web UI
apache-spark 
Apache spark apachespark中reduce和reduceByKey的区别
apache-spark 
Apache spark 在群集中运行spark作业时，Getting BoneCP plugin not found错误如下。
apache-sparkhive 
Apache spark 如何在运行时将google cloud项目传递给SHC BigTable连接器？
apache-spark 
Apache spark 将文件保存到拼花地板时，分区列将移动到行的末尾
apache-spark 
Apache spark 纱线应用程序主管日志位置
apache-spark 
Apache spark 如何使用Spark编写128MB拼花文件
apache-spark 
Apache spark 配置单元在选择数据时是否保留文件顺序
apache-sparkhadoophive 
Apache spark 运行几次后，Databricks群集上计划的Spark作业出现间歇性故障
apache-spark 
Apache spark 除了collect（）之外，还有其他方法可以从Pyspark中的列中获取最大值吗？
apache-sparkpyspark 
Apache spark 如何确定一个数据集将有多少个分区？
apache-spark 
Apache spark Apache Spark AttributeError:FileFormat，ValueError:&x27；文件格式'；不在列表数据框中
apache-sparkpyspark 
                                       





随机文章推荐



                                                        
Google maps 绘制可调整大小（不相交）的多边形
google-maps 
Google maps markerclusterer.js中的问题
google-maps 
Google maps 在谷歌地图上添加透明覆盖
google-maps 
Google maps 标记群集未正确加载-Google maps V3
google-mapsgoogle-maps-api-3 
Google maps 谷歌地图上传照片作为标记
google-mapsgoogle-maps-api-3 
Google maps 给定半径内的周边城镇列表
google-mapsgoogle-maps-api-3 
Google maps 如何使用geturl（）显示来自google place api的照片？
google-mapsgoogle-maps-api-3 
Google maps 在Objective C中的Google地图上显示多个标记
google-maps 
Google maps 在Google Map V3中获取两个端点之间的所有地理点
google-mapsgoogle-maps-api-3 
Google maps 谷歌地图在小窗口中显示错误，无法展开
google-maps 
Google maps 如何找到Google Maps V3上当前可见的所有标记？
google-maps 
Google maps 在谷歌地图上剪下圆圈
google-maps 
Google maps 我怎样才能把数字放在地图上而不是一般的标记？
google-maps 
Google maps 根据缩放级别更改谷歌地图自定义图像标记
google-mapsgoogle-maps-api-3 
Google maps 如何禁用滚动缩放。谷歌地图嵌入API
google-maps 
Google maps 谷歌地图和在数据库中写地址
google-mapssymfonygoogle-maps-api-3 
Google maps 谷歌地图KML中图标旁边的显示标签
google-mapsgoogle-maps-api-3 
Google maps 仅当用户完成键入时调用google地图自动完成服务
google-mapsgoogle-maps-api-3 
Google maps 使用谷歌API搜索服务区业务
google-mapsgoogle-maps-api-3 
Google maps Google提升api状态消息
google-mapsgoogle-api


                                        

                                        
                                        


                                                
                                                        [lambda]相关推荐
                                                        
Linq到XML中的lambda方法是什么？
									Lambda
							 
这个lambda表达式的C#2.0等效代码是什么
									Lambda
							 									C# 3.0
							 
rust中lambda表达式的生存期
									Lambda
							 									Rust
							 
Lambda omnet++M/M/1队列长度
									Lambda
							 									Omnet++
							 
放置「；定义；“内部”；lambda“；计划中的机构
									Lambda
							 									Scheme
							 
Lambda 套索回归族中的最大和最小惩罚
									Lambda
							 
lambda表达式是否真正实现了java接口？
									Lambda
							 									Java 8
							 
使用JDK8和lambda（java.util.stream.streams.zip）压缩流
									Lambda
							 									Functional Programming
							 									Java 8
							 
Lambda 链接初始化和函数c+时获取对对象的引用+；
									Lambda
							 
java 8 lambda toMap显示类型转换错误
									Lambda
							 									Java 8
							 
您可以使用Lambda在使用Cloudformation创建的RDS上创建模式吗？
									Lambda
							 									Amazon Cloudformation
							 
Lambda 类型为的引用构造函数，不包括可选参数
									Lambda
							 									Kotlin
							 
AWS Lambda Promise.all is never Return或Wait不适用于它
									Lambda
							 
&引用；如果最后一个参数lambda传递给括号外的函数调用，则不允许传递默认参数的值；
									Lambda
							 									Kotlin
							 
正在从方法传递lambda表达式。。。什么'；代码有什么问题？
									Lambda
							 									Java 8
							 
是否允许将参数移到Lambda项的右侧或左侧？
									Lambda
							 									Functional Programming
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Dns
Ignite
Nginx
Silverlight 4.0
Wpf
Sap
Arangodb
Extjs4
Navigation
Django Rest Framework
Amazon Dynamodb
Office365
Jira
Google Colaboratory
Tcl
Blockchain
Dotnetnuke
Phantomjs
Kubernetes
Qt4
Gps
Julia
Assembly
Jquery Mobile
Terraform
Signalr
Subsonic
Documentation
Gitlab
Google Apps Script
Fullcalendar
Lambda
Jwt
Graphics
Class
Xml
Sql Server 2008 R2
Appium
Jquery
Xmpp
Layout
Unit Testing
Ravendb
Sockets
Vaadin
.net
Sublimetext3
Windows
Aem
Woocommerce
Oracle11g
Mongoose
Symfony
Openerp
Facebook Graph Api
Odata
Xaml
Rust
Browser
Weblogic
Z3
Quickbooks
Google Sheets
Datetime
Install4j
Django
Python 2.7
Server
Macos
Grep
C
React Native
Maven
X86
Scala
Spring Boot
Directory
Serial Port
Flutter
Localization
Rss
Ibm Midrange
Office Js
Crystal Reports
Routing
.htaccess
C# 4.0
Visual Studio 2015
Tridion
Database
Mediawiki
Sorting
Azure Cosmosdb
Outlook
C++
Sapui5
Wordpress
Compression
Azure Sql Database
Objective C
If Statement
Ibm Cloud
Docker
Identityserver4
Sharepoint 2007
Redux
Jsf
Model
Ruby On Rails 3.2
Perforce
Less
Google Chrome Devtools
Programming Languages
Keycloak
List
Formatting
Autodesk Forge
Linq To Sql
Networking
Jersey
Debian
Odoo
Netty
Automated Tests
Exception
Windows 8
Replace
Netbeans
Build
Gtk
Svn
Search
.net Core
Wix
Jsp
Spring Mvc
Twig
Types
Postman
Grails
Hyperledger Fabric
Microsoft Graph Api
Checkbox
Ssl
Libgdx
Android
Angularjs
Eclipse
Cloud Foundry
Asp.net Web Api
D3.js
Flask
Prolog
Events
Openid
Windows Store Apps
Apache Flink
Django Models
Nlp
Download
Selenium
Mdx
Gcc
Testing
Activemq
Module
Protractor
Seo
Drupal 6
Rxjs
Playframework
Map
Graph
Inheritance
Methods
Internet Explorer 8
Join
Cookies
Microservices
Opencl
Sql Server 2008
Colors
Curl
Listview
Bazel
.net 4.0
Codenameone
Linux Kernel
Pytorch
Linker
Ldap
Functional Programming
Wxpython
Teamcity
Neural Network
Sqlalchemy
Permissions
Installation
Smtp
Typescript
Visual Studio 2010


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网