Spark-SQL联接是否创建了所有组合？_Sql_Apache Spark_Apache Spark Sql - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/angular/29.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Spark-SQL联接是否创建了所有组合？_Sql_Apache Spark_Apache Spark Sql - Fatal编程技术网

Spark-SQL联接是否创建了所有组合？

sql apache-spark

Spark-SQL联接是否创建了所有组合？,sql,apache-spark,apache-spark-sql,Sql,Apache Spark,Apache Spark Sql,这个问题是针对Spark的，但我假设（？）它可能更通用于任何SQL表联接假设我们有表A和表B。然后我们发出以下命令： select a.* from a inner join b on a.col1 - b.col1 <= 0.5 从a.col1-b.col1上的内部联接b中选择a.*Yes。不能优化不基于值相等（用户定义函数调用的结果、在不同表的列上计算的值以及非相等比较运算符）的联接条件，并将其作为笛卡尔乘积和选择进行计算如果检查结果执行计划，很容易确认这一点。例如： impor

这个问题是针对Spark的，但我假设（？）它可能更通用于任何SQL表联接

假设我们有表A和表B。然后我们发出以下命令：

select a.* from a inner join b on a.col1 - b.col1 <= 0.5

从a.col1-b.col1上的内部联接b中选择a.*Yes。不能优化不基于值相等（用户定义函数调用的结果、在不同表的列上计算的值以及非相等比较运算符）的联接条件，并将其作为笛卡尔乘积和选择进行计算
如果检查结果执行计划，很容易确认这一点。例如：
import org.apache.spark.sql.functions_
spark.range（1000）。选择（rand（）作为“col1”）。createOrReplaceTempView（“a”）
spark.range（1000）。选择（rand（）作为“col1”）。createOrReplaceTempView（“b”）
spark.sql("从a.col1-b.col1上的内部联接b中选择a.*，因此，如果联接条件为b.col1==b.col1，则不会创建笛卡尔积并对联接进行优化？如上所述，结果实际上与执行两个步骤相同-笛卡尔积后接过滤器？是的，可以优化相等联接。第二个问题的答案是肯定的-请检查附加的执行计划。我了解到，关闭广播连接是处理此类查询的最佳方法。根据数据大小，它可能会提高或降低实际性能，但从总体上看，无论您选择哪个选项，它仍然是O（N^2）。




[apache spark]相关文章推荐



                                                        
                                       





随机文章推荐


                                        

                                        
                                        


                                                
                                                        [sql]相关推荐
                                                        
复制数据库后SQL Server速度减慢
									Sql
							 									Sql Server
							 									Database
							 									Performance
							 
VB.NET应用程序的SQL数据库部署
									Sql
							 									Vb.net
							 									Deployment
							 
SQL查询汇总了今年迄今的实际值和年初至今的平均值
									Sql
							 
Sql 设置声明值，以防
									Sql
							 									Sql Server
							 
Sql 如何在Postgres函数中使用正则表达式替换？
									Sql
							 									Regex
							 									Postgresql
							 
Sql 使用其他表中的所有记录更新或插入表
									Sql
							 									Sql Server
							 
Sql 我的cte和insert命令有什么问题
									Sql
							 									Join
							 									Oracle11g
							 
Sql &引用；缺少右括号“；“我的视图”语句出错（Oracle）
									Sql
							 									Oracle
							 									View
							 
将SQL查询转换为Laravel 4
									Sql
							 									Laravel
							 									Laravel 4
							 
Sql orientDB映射键列表
									Sql
							 									Orientdb
							 
Sql 加入时如何报告所有行？
									Sql
							 									Oracle
							 
Sql 如何从一个SELECT语句插入多个表
									Sql
							 									Sql Server
							 									Sql Server 2008
							 									Tsql
							 
Sql 如何在此查询中获取每天的最大（小时）和最小（小时）？
									Sql
							 									Sql Server
							 
Sql 如何在Rails+；博士后
									Sql
							 									Ruby On Rails
							 									Ruby
							 									Postgresql
							 
Sql 仅使用一个主键创建一对一关系
									Sql
							 									Sql Server
							 									Sql Server 2008 R2
							 
Sql 在插入过程中跳过只读字段/列
									Sql
							 									Doctrine Orm
							 
Sql 在where子句中使用currval
									Sql
							 									Oracle
							 
Sql 将宏字符串转换为SAS数字日期
									Sql
							 									Date
							 									Sas
							 
Sql 询问切换用户密钥字段的想法
									Sql
							 									Sql Server
							 
Sql SSIS派生列主键创建
									Sql
							 									Sql Server
							 									Ssis
							 
Sql 动态地将列转换为行，然后与其他表联接
									Sql
							 									Sql Server
							 
Sql WHERE和UPDATE SET子句的pg PROMITE格式化程序
									Sql
							 
我的数据是分区的，我想使用一个循环来检索SQL Oracle中的数据
									Sql
							 									Oracle
							 									Loops
							 
用于在aws athena（presto）中创建数组映射的sql查询
									Sql
							 
Sql 用户定义数据类型的用户定义规则不'；行不通
									Sql
							 									Sql Server
							 
Sql 使用hana Export命令导出具有2.2亿条记录的hana表
									Sql
							 
如何优化Oracle SQL查询
									Sql
							 									Oracle
							 									Replace
							 
Sql Postgres ts_查询匹配链接给出语法错误
									Sql
							 									Postgresql
							 
Sql 使用select查询更新表
									Sql
							 									Postgresql
							 									Select
							 
Sql 本地验证某人'；s仅使用Oauth2.0
是否可以对仅使用Oauth 2（可能使用Google或Facebook）登录我的网站的用户进行本地身份验证？
									Sql
							 									Database
							 									Postgresql
							 									Oauth
							 									Oauth 2.0
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Prometheus
Events
Logstash
C++
Map
Virtual Machine
Gmail
Webrtc
Leaflet
Webstorm
Uitableview
Replace
Properties
Here Api
Abap
Google Api
Processing
Data Binding
Pointers
Variables
Xamarin
Javafx 2
Amazon Redshift
Sublimetext3
Next.js
Jquery
Pandas
Bash
Rabbitmq
Actionscript 3
Backbone.js
Swagger
Scrapy
Jsf
Cloud Foundry
Floating Point
Rspec
Google Bigquery
Core Data
Excel
Phpmyadmin
Oracle11g
Graph
Qt
Wso2
Data Structures
Apache Storm
Pine Script
Kibana
Iis 7
Project Management
Vbscript
Debugging
Aframe
Magento2
Unix
Devexpress
Sprite Kit
Operating System
Xamarin.android
Pagination
Jaxb
Google Visualization
Blackberry
Ant
Odata
Firebase
Sql Server 2008 R2
Xaml
Qml
Hive
Google Maps Api 3
Sql Server 2012
Atom Editor
Paypal
Com
Phpstorm
Random
Ember.js
Ms Office
Class
Apache Spark
Openshift
Gitlab
Extjs4
Asp.net
Neo4j
Go
Sip
Serial Port
Ruby On Rails 4
Plugins
Websphere
Ecmascript 6
Elixir
Blazor
Mule
Google Cloud Storage
Sails.js
Ios5
Hyperlink
.net Core
Shell
Visual Studio 2017
Ssas
E Commerce
Delphi
Sugarcrm
Visual Studio 2015
Fullcalendar
Animation
Session
Google Plus
Kendo Ui
C++ Cli
Compiler Errors
Gradle
Ubuntu
.net 4.0
Cygwin
Highcharts
Azure Data Factory
Sqlite
Opengl Es
Utf 8
Sql
Android Fragments
Sdk
Lucene
Opencl
Swift3
Ruby On Rails 3.2
Url
Inno Setup
Numpy
Nservicebus
Grails
Clang
Amazon Web Services
Orientdb
Azure Cosmosdb
Jquery Mobile
Coding Style
Cmake
Lambda
Pip
Passwords
Collections
Arangodb
Elm
Reference
Google Drive Api
Internationalization
Sms
Stored Procedures
Browser
Time
Doxygen
Tensorflow
Typescript
Fluent Nhibernate
Oracle Apex
Asp.net Core
Tinymce
Ipython
Youtube
Sql Server 2005
Anaconda
Documentation
Oop
Sharepoint 2010
Nativescript
Vagrant
Visual Studio 2013
Web Scraping
Ssh
Npm
Gstreamer
Yocto
Reflection
Stripe Payments
Css
.htaccess
Hazelcast
Android Ndk
Drupal 6
Cassandra
Teamcity
Google Calendar Api
Maven
Gulp
Cron
C# 4.0
Safari
Dns
Terraform
Keycloak
Mongoose
Node.js
Service
Puppet


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网