Apache spark Spark数据帧过滤器和选择，为什么它们的位置无关紧要？_Apache Spark - Fatal编程技术网

Apache spark Spark数据帧过滤器和选择，为什么它们的位置无关紧要？

apache-spark

Apache spark Spark数据帧过滤器和选择，为什么它们的位置无关紧要？,apache-spark,Apache Spark,给定一个spark数据帧df，我发现df.filter（col（“label”）==1.select（“user”）等于df.select（“user”）.filter（col（“label”）==1 谁能告诉我过滤器的位置无关紧要的原因吗？为什么第二个表达式不抛出异常 spark版本是2.3.4，scala版本是2.11.8有趣的问题。。。可能是因为执行计划的优化？可能在这两种情况下都是先进行筛选。这是因为优化的查询计划在这两种情况下都是相同的。两种情况下，您都可以使用explain（true

给定一个spark数据帧

df

，我发现

df.filter（col（“label”）==1.select（“user”）

等于

df.select（“user”）.filter（col（“label”）==1
谁能告诉我过滤器的位置无关紧要的原因吗？为什么第二个表达式不抛出异常
spark版本是2.3.4，scala版本是2.11.8
有趣的问题。。。可能是因为执行计划的优化？可能在这两种情况下都是先进行筛选。这是因为优化的查询计划在这两种情况下都是相同的。两种情况下，您都可以使用explain（true）进行检查。@koiralo@ernest_k谢谢！我使用explain（true）进行检查，发现它们都在物理计划中先进行筛选
，然后再进行选择
。




[aurelia]相关文章推荐



                                                        
子文件夹中的Aurelia应用程序位置
aurelia 
Aurelia 如何在文档标题上不显示父|子路由
aurelia 
Aurelia:在main.js中配置并使用fetch
aurelia 
Aurelia:单击调用多个函数
aurelia 
Aurelia 如何在ES6中创建插件（无构建系统）
aurelia 
Aurelia 单向绑定模式，反之亦然
aurelia 
Aurelia 无法获取“的”行；路由器导航“；
aurelia 
Aurelia au build抱怨找不到或无法访问文件
aurelia 
Aurelia 奥雷莉亚：翻译+；参数来自值转换器
aurelia 
Aurelia:从视图更改app.js中的导航
aurelia 
Aurelia自定义元素从子视图模型访问数据到父视图模型
aurelia 
在Aurelia路由器中，当用户试图导航到同一页面时，是否可能收到通知？
aurelia 
如何在Aurelia中创建全局函数
aurelia 
Aurelia剑道网格-搜索栏未显示
aurelia 
在模块内部创建子路由器，Aurelia
aurelia 
                                       





随机文章推荐



                                                        
Eclipse plugin 如何向EclipseRCP工具栏添加间隔符？
eclipse-plugin 
Eclipse plugin 如何使用多个<；instanceof>；条件在<；何时可见>；？
eclipse-plugineclipse-rcp 
Eclipse plugin 在执行操作之前检查项目错误
eclipse-plugin 
Eclipse plugin 通过eclipse插件访问项目构建路径
eclipse-plugin 
Eclipse plugin 快速搜索视图部件
eclipse-plugin 
Eclipse plugin 如何在Aptana studio 3中为Behave BDD工具安装xGherkin编辑器？
eclipse-plugin 
Eclipse plugin 如何在eclipse RCP中使用draw2d在编辑器上绘制一些图形？
eclipse-plugineclipse-rcp 
Eclipse plugin org.eclipse.search.internal.ui.searchpreferencepage.java在eclipse 3.7.2上不可用
eclipse-plugin 
Eclipse plugin 无法在eclipse中运行Genymotion向导
eclipse-plugin 
Eclipse plugin 安装工件时出现Rascal错误缺少工件
eclipse-plugin 
Eclipse plugin 在启动时更改启动配置'；她在跑步
eclipse-plugineclipse-rcp 
Eclipse plugin Can'；t在Eclipse中安装ERMaster插件
eclipse-plugin 
Eclipse plugin EclipseRCP：将Eclipse产品转换为openSUSe的rpm
eclipse-plugineclipse-rcp 
Eclipse plugin 如何打印修改后的AST而不实际执行更改？
eclipse-plugin 
Eclipse plugin 加载的类的类型不正确：应为（org.eclipse.ui.menus.WorkbenchWindowControlContribution）Get（de.blub.menu.ToolbarContributionItem）
eclipse-plugin 
Eclipse plugin 找不到http://master.dl.sourceforge.net/project/red-robot-editor/repository 在ubuntu中
eclipse-plugin


                                        

                                        
                                        


                                                
                                                        [apache spark]相关推荐
                                                        
Apache spark 奇怪的org.apache.spark.SparkException：由于阶段再次失败，作业中止
									Apache Spark
							 
Apache spark 如何更新RDD？
									Apache Spark
							 
Apache spark Tachyon:在copyFromLocal命令期间重命名失败
									Apache Spark
							 
Apache spark 将数据框另存为Pyspark中不工作的拼花地板
									Apache Spark
							 									Pyspark
							 
Apache spark 减少Spark和HBase节点之间的延迟
									Apache Spark
							 									Hbase
							 
Apache spark 为什么org.apache.spark.ml.param.shared包中的大多数trait都是私有的
									Apache Spark
							 
Apache spark Spark 2.0 Cassandra Scala Shell错误：java.lang.NoClassDefFoundError:Scala/collection/GenTraversableOnce$class
									Apache Spark
							 									Cassandra
							 
Apache spark gziped文件的RDD到"；“未压缩”；数据帧
									Apache Spark
							 									Pyspark
							 
Apache spark 火花1.6落柱基于数值
									Apache Spark
							 									Dataframe
							 
Apache spark 当我使用spark streaming将消息写入kafka主题时，它只是写入一个分区
									Apache Spark
							 									Apache Kafka
							 
Apache spark 火花流：“火花流”；错误JobScheduler:为时间生成作业时出错“；在Python进程中
									Apache Spark
							 									Pyspark
							 
Apache spark 确定日期和时间
									Apache Spark
							 									Pyspark
							 
Apache spark 在迭代Spark数据集的记录时向其添加多列
									Apache Spark
							 
Apache spark Spark应用程序中的持久计数器
									Apache Spark
							 									Pyspark
							 
Apache spark 蜂巢上火花堆叠溢出错误
									Apache Spark
							 									Hive
							 
Apache spark 将s3键映射到Spark中的值的正确方法
									Apache Spark
							 									Amazon S3
							 
Apache spark SparkContext.getOrCreate（）用途
									Apache Spark
							 									Pyspark
							 
Apache spark spark Sql中最小值的最大值
									Apache Spark
							 									Dataframe
							 									Join
							 
Apache spark spark sql在Cassandra表之间传输数据
									Apache Spark
							 									Cassandra
							 
Apache spark 从多列数据帧批量写入Kafka主题
									Apache Spark
							 									Apache Kafka
							 
Apache spark 如何在Spark scala的window PartitionBy中应用多列
val partitionsColumns=“idnum，monthnum”
val partitionsColumnsList=partitionsColumns.split（“，”）.toList
val loc=“/data/omega/published/invoice”
val df=sqlContext.read.parquet（loc）
val windowFunction=Window.partitionBy（p
									Apache Spark
							 
Apache spark 将spark版本升级到2.4.3:java.lang.ClassNotFoundException:org.apache.hadoop.fs.StorageStatistics
									Apache Spark
							 
Apache spark spark submit与hive shell中的查询性能
									Apache Spark
							 									Pyspark
							 									Hive
							 									Amazon Dynamodb
							 
Apache spark 火花拼花模式演变
									Apache Spark
							 
Apache spark Spark SQL选择在至少5天内发推特的人
									Apache Spark
							 
Apache spark 为什么在minikube/kubernetes上运行spark时无法实例化外部调度程序？
									Apache Spark
							 									Kubernetes
							 
Apache spark 如何在PySpark中将RDD列表转换为RDD行
									Apache Spark
							 									Pyspark
							 
Apache spark 使用crontab运行Spark作业
									Apache Spark
							 									Hadoop
							 									Cron
							 
Apache spark S3Guard和拼花地板魔术师，用于EMR 6.x上的S3A
									Apache Spark
							 									Pyspark
							 
Apache spark 如果Spark evaluator仅返回1个值，为什么它具有avgMetrics属性？
									Apache Spark
							 									Pyspark
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Sbt
Unix
Network Programming
Arm
Stanford Nlp
Indexing
Jsp
Mongoose
Ipython
Seo
Rspec
Tfs
Image
Mongodb
Floating Point
File Upload
Video
Visual Studio
Swagger
Apache Spark
Visual Studio 2013
Vector
Sql Server 2008
Security
Triggers
Pdf
Graphviz
Google Chrome
Usb
Dll
Influxdb
Language Agnostic
Sqlite
Azure Functions
Terraform
Dask
Entity Framework
Utf 8
Jenkins
Office365
Stata
Blazor
Ocaml
Jestjs
Sencha Touch
Multithreading
Wxpython
Sublimetext3
Pentaho
Resharper
Nhibernate
Mariadb
Kentico
Menu
Actions On Google
Hadoop
Artificial Intelligence
Arangodb
Linq To Sql
Libgdx
Azure Data Factory
Syntax
Gremlin
Python 3.x
Windows 7
Video Streaming
Arduino
Cocoa Touch
Elixir
X86
Drupal 7
Elm
Spring
Office Js
Wolfram Mathematica
Functional Programming
Speech Recognition
Phantomjs
Sencha Touch 2
Symfony1
Awk
Spring Cloud
Path
List
Exception Handling
Sip
Encoding
Transactions
Visual Studio 2015
Log4net
Excel Formula
Cors
Doctrine
Interface
Opencv
Scheme
Smalltalk
Coldfusion
Azure Service Fabric
Ssl
Delphi
Gps
Wso2
Backbone.js
Bazel
.htaccess
Windows Phone 7
Windows Phone 8
Yii2
Google App Maker
Jetty
Filesystems
Yaml
Unit Testing
Go
Xampp
Navigation
Cron
Coq
Octave
Jqgrid
Cmake
Windows Installer
Primefaces
Coding Style
Phpunit
Azure Ad B2c
Firebase
Amp Html
Sml
Binary
System Verilog
Ssas
Process
Visual Studio 2010
Asterisk
Jms
Dependencies
Erlang
Objective C
Bash
Ruby On Rails 3
Composer Php
Collections
Combobox
Apache
Cloud
View
Wicket
Flash
Jvm
Autohotkey
Latex
Ecmascript 6
Emacs
Twitter Bootstrap
Scrapy
Oracle10g
Jquery Ui
Ethereum
Automation
Devexpress
Polymer
Binding
Layout
Opengl
Amazon Redshift
Html
Plot
Autocomplete
Gitlab
Parsing
Alfresco
Haskell
Spring Security
Facebook
Cygwin
Opencl
Identityserver4
String
Cobol
Makefile
Jsf 2
Kernel
Compiler Errors
Calendar
Browser
Geometry
Codenameone
Youtube
Graphql
Gatsby
Gtk
Qt
Log4j
Jekyll
Telerik
Terminal
Cloud Foundry
Svn
Pycharm


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网