Apache spark 引用聚合会导致Spark不执行任何操作_Apache Spark_Pyspark - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark 引用聚合会导致Spark不执行任何操作_Apache Spark_Pyspark - Fatal编程技术网

Apache spark 引用聚合会导致Spark不执行任何操作

apache-spark pyspark

Apache spark 引用聚合会导致Spark不执行任何操作,apache-spark,pyspark,Apache Spark,Pyspark,在Spark中，如果我进行聚合，是否有任何方法可以在不强制执行操作的情况下使用这些结果我试图构建一个具有中间阶段的图，这些中间阶段聚合，然后根据结果有条件地进行分支。据我所知，做到这一点的唯一方法是单独执行每个阶段例如，在下面的人造代码中，我希望根据聚合的值执行条件语句，但我能想到的唯一方法是操作聚合： df = spark.range(5) df = df.withColumn('flag', when(col('id') < 10, 0).otherwise(1)) df = df

在Spark中，如果我进行聚合，是否有任何方法可以在不强制执行操作的情况下使用这些结果

我试图构建一个具有中间阶段的图，这些中间阶段聚合，然后根据结果有条件地进行分支。据我所知，做到这一点的唯一方法是单独执行每个阶段

例如，在下面的人造代码中，我希望根据聚合的值执行条件语句，但我能想到的唯一方法是操作聚合：

df = spark.range(5)
df = df.withColumn('flag', when(col('id') < 10, 0).otherwise(1))
df = df.withColumn('test', when(df.agg({'flag': 'max'}).first()[0] < lit(1), True).otherwise(False))
... Do more stuff ...

df=spark.range（5）
df=df.withColumn（'flag'，当（col（'id'）<10,0）时。否则（1））
df=df.withColumn（'test'，when（df.agg（{'flag'：'max'}）。first（）[0]


理想情况下，我希望这是一个转换，而不是一个动作，但我找不到任何证据证明这是可能的。
如果不计算最大值，就无法评估条件。要获得最大值，您需要搜索所有行，因此您需要执行一个操作。好的，我希望所有操作都可以惰性地进行评估。对我来说，可以懒散地评估聚合的结果是有意义的，尤其是返回一行的聚合，但如果不是这样，那就太酷了




[pyspark]相关文章推荐



                                                        
Pyspark SaveAsTable未从SQL推断架构
pyspark 
Pyspark Pypark每周事件的计算
pyspark 
Pyspark 列表的最小值
pyspark 
如何监视由pyspark启动的任务
pyspark 
Pyspark 在某些匹配条件下如何左反连接
pyspark 
Pyspark Spark 2.2.0在将表格加载到DF时无法连接到Phoenix 4.11.0版本
pysparkhbase 
在pyspark中将时间戳转换为特定日期
pyspark 
绘制一个非常巨大的pyspark柱的柱状图
pyspark 
Pyspark 使用Python在Databricks中增强XGBoost
pyspark 
我可以通过pyspark在Spark中使用L-BFGS优化器吗？
pyspark 
Pyspark 如何筛选语言的Wikidata转储？
pysparkrdf 
pyspark数据帧的数据类型中的不同计数
pyspark 
如何使用Pyspark将flatmap与Dataframe中的多列一起使用
pyspark 
如何检查RDD在pyspark中是否包含列表元素？
pyspark 
使用PySpark中的pandas\u udf平均分配组任务
pyspark 
Pyspark基于时间差的计算场
pyspark 
从同一pyspark数据帧的键数组中获取值数组
pyspark 
在pyspark中如何从出生日期计算年龄？
pyspark 
Pyspark 在Spark数据帧中执行MapReduce
pysparkmapreduce 
在PySpark中插值lat/lon列以获得轨迹中的等间距点
pyspark 
                                       





随机文章推荐



                                                        
Visual studio 2015 如何使global.json查找两个文件夹
visual-studio-2015asp.net-core 
Visual studio 2015 如何更改Web性能测试执行路径
visual-studio-2015 
Visual studio 2015 在VS 2013中构建的编码UI测试在VS 2015中未运行
visual-studio-2015 
Visual studio 2015 如何将Apache Cordova应用程序转换为Web应用程序？
visual-studio-2015 
Visual studio 2015 visual studio 2015通信将自动关闭
visual-studio-2015 
Visual studio 2015 修复Anaconda Python 2.7.11符号混合调试器Visual Studio？
visual-studio-2015anaconda 
Visual studio 2015 目标为'的通用应用程序；发布'；失败，出现编译器错误ILT0021方法Windows.Graphics.Display.DisplayInformation未找到
visual-studio-2015windows-10 
Visual studio 2015 无法在Windows 8.1操作系统上安装Visual Studio 2015社区版
visual-studio-2015 
Visual studio 2015 web部署-不允许IIS管理器用户IISWMSVC\u授权\u服务器\u
visual-studio-2015 
Visual studio 2015 Can’；t为Windows Server 2012 R2安装DotNetCore VS2015工具预览2
visual-studio-2015asp.net-core 
Visual studio 2015 Visual Studio 2015安装时是否附带.Net核心命令行（CLI）？
visual-studio-2015.net-core 
Visual studio 2015 windows phone 10模拟器没有internet
visual-studio-2015 
Visual studio 2015 用于x64平台的VS2015命令行工具msbuild失败
visual-studio-2015msbuild 
Visual studio 2015 使用安装项目将配置转换为app.release.config
visual-studio-2015 
Visual studio 2015 如何执行Visual Studio Extension的快捷键命令
visual-studio-2015 
Visual studio 2015 VS2015在从工作区打开解决方案时冻结
visual-studio-2015tfs 
Visual studio 2015 SonarLint/Visual Studio：解决方案中所有项目的单一规则集
visual-studio-2015sonarqube 
Visual studio 2015 裸体，还是包装破损？
visual-studio-2015nuget 
Visual studio 2015 CStdioFile.open是否更改文件运行时错误的路径？
visual-studio-2015mfc 
Visual studio 2015 表格模型度量未填充
visual-studio-2015ssas


                                        

                                        
                                        


                                                
                                                        [apache spark]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Flutter
Keras
Templates
Network Programming
Weblogic
Ubuntu
Linux
Angular Material
Validation
Instagram
Jaxb
Deep Learning
Ios4
Jwt
Emacs
Stripe Payments
Dictionary
Core Data
Asp.net Mvc 3
Oauth
Parse Platform
Robotframework
Windows Installer
Jakarta Ee
Apache Nifi
Jsf 2
Google Api
Spring Batch
Sql Server 2008 R2
Quickbooks
Firefox Addon
Opencl
Transactions
Iframe
Sap
Keyboard
Adobe
Date
Leaflet
Streaming
Java Me
Compiler Construction
Version Control
Common Lisp
Mule
Asp.net Core
Datetime
Windows Phone 8
Content Management System
Command Line
Compiler Errors
Stored Procedures
Jupyter Notebook
Doctrine
Prometheus
Devexpress
Wpf
Design Patterns
Excel
Stanford Nlp
.net
Openlayers 3
Autocomplete
Makefile
Tkinter
Redux
Redirect
Graphviz
Notifications
User Interface
Powerbi
Antlr4
C++
Ios5
Node.js
Clang
Fluent Nhibernate
Data Binding
Visual Studio 2017
Ios8
Sqlite
Fullcalendar
Tcl
Azure Devops
Embedded
Sass
.net 4.0
Yii2
List
Animation
Artificial Intelligence
Reactjs
Ibm Cloud
Google Cloud Storage
Svn
Unity3d
Flash
Http
Webgl
Laravel
Django Rest Framework
Unit Testing
Dns
Ipad
Iphone
Oracle Apex
Arangodb
Firebase
String
Object
Drupal
Single Sign On
Macros
Air
Exception
Input
Protractor
Time
Bazel
Nest
Grafana
Machine Learning
Language Agnostic
Xmpp
Sapui5
Apache Spark
Windows Phone 8.1
Struts2
Apache Kafka
Apache2
Image Processing
Utf 8
Java 8
Logstash
Openerp
Primefaces
C#
Filesystems
Nhibernate
Crystal Reports
Inno Setup
Git
Maps
Swiftui
Jqgrid
Socket.io
Ruby
Azure Cosmosdb
Ios6
Push Notification
Button
Redis
Logic
Ipython
Asp Classic
Multithreading
Mercurial
Active Directory
Visual Studio 2012
Yocto
Mono
Aurelia
Pentaho
Npm
Orchardcms
Android
Javafx
Visual Studio 2013
Automated Tests
Rspec
Ios
Twitter Bootstrap
Types
Ionic2
Notepad++
Kubernetes
Sql Server 2012
Razor
Encoding
Ionic Framework
Jms
Replace
Random
Certificate
Nativescript
Cocoa Touch
Jquery
Scrapy
Binary
Json
Math
Pointers
Reference
Facebook Graph Api
Sorting
Virtual Machine
Coq
Neural Network
Cygwin
Microsoft Graph Api
Visual Studio 2008


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网