Apache spark 是否存在使用spark中的计数强制进行急切评估的性能问题？_Apache Spark - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark 是否存在使用spark中的计数强制进行急切评估的性能问题？_Apache Spark - Fatal编程技术网

Apache spark 是否存在使用spark中的计数强制进行急切评估的性能问题？

apache-spark

Apache spark 是否存在使用spark中的计数强制进行急切评估的性能问题？,apache-spark,Apache Spark,我通常在3种场景中看到整个代码库中的Dataset.count：日志log.info（“此ds有${dataset.count}行”）分支if（dataset.count>0）do x else do y 强制缓存dataset.persist.count 它是否会通过强制查询优化器在这些场景中过早地渴望来阻止查询优化器创建最高效的dag？TL；DR1）和2）通常可以避免，但不应该伤害你（忽略评估成本），3）通常是有害的做法不带缓存单独调用count几乎是浪费。虽然日志记录并不总是简单的

我通常在3种场景中看到整个代码库中的

Dataset.count

：

日志

log.info（“此ds有${dataset.count}行”）

分支

if（dataset.count>0）do x else do y

强制缓存

dataset.persist.count

它是否会通过强制查询优化器在这些场景中过早地渴望来阻止查询优化器创建最高效的dag？

TL；DR1）和2）通常可以避免，但不应该伤害你（忽略评估成本），3）通常是有害的做法

不带
缓存

单独调用

count

几乎是浪费。虽然日志记录并不总是简单的，但是可以用从监听器（）检索到的信息来代替，并且控制流需求通常（并非总是）可以通过更好的管道设计来调节

单独使用它不会对执行计划产生任何影响（count的执行计划通常与父级的执行计划不同。一般情况下，Spark尽可能少做工作，因此它将删除执行计划中不需要计算count的部分）

使用

缓存：
count
withcache
是从RDDAPI使用的模式中天真地复制出来的糟糕做法。对于RDD
，它已经存在争议，但是对于DataFrame
can（选择和谓词下推），从技术上讲，.
Count不会改变缓存的工作方式，但缓存会改变Count的工作方式。dataset.persist.Count仍然是触发缓存的好方法，对吗？




[jquery plugins]相关文章推荐



                                                        
Jquery plugins 如何使用jQuery'；是否设置.autocomplete的formatItem、formatMatch和formatResult选项？
jquery-plugins 
Jquery plugins 任何人都可以编辑jQueryLocalScroll插件，让它在onAfter回调和onBefore回调时都可以使用吗？
jquery-plugins 
Jquery plugins 与'有关的问题；数据表'；jquery插件和两个表（与ajax相关）
jquery-pluginsjquerydatatables 
Jquery plugins tinymce jquery插件错误tinymce不是函数
jquery-pluginstinymce 
Jquery plugins 无论何时调用插件，都要调用jquery插件
jquery-plugins 
Jquery plugins 在AngularJS中集成jQuery插件的正确方法
jquery-pluginsangularjs 
Jquery plugins 应用程序框架是否与JQMobi有连接？
jquery-pluginsframeworks 
Jquery plugins 爱奥尼亚、cordova、phonegap、jquery蓝牙插件
jquery-pluginsionic-framework 
                                       





随机文章推荐



                                                        
Python 2.7 Python 2.7.2中不同导入样式的问题
python-2.7 
Python 2.7 如何将字典从一种格式更改为另一种格式？
python-2.7dictionary 
Python 2.7 在python中根据需要逐行延迟读取文件
python-2.7pandas 
Python 2.7 向每行添加多年平均值列
python-2.7pandas 
Python 2.7 Python PIL每个字符的宽度相同
python-2.7 
Python 2.7 将类对象彼此嵌套为属性是否有害？
python-2.7objectrecursion 
Python 2.7 通过使用splash，Portia是否可以支持JS？
python-2.7scrapy 
Python 2.7 使用scikit learn进行光谱聚类的预计算距离
python-2.7scikit-learn 
Python 2.7 从Py2.7到Py3.4，相同的代码会产生不同的结果。错在哪里？
python-2.7python-3.x 
Python 2.7 Python中每一小时执行一次函数
python-2.7 
Python 2.7 TypeError:flow_from_clientsecrets（）获取了意外的关键字参数“include_grated_scopes”
python-2.7google-app-engine 
Python 2.7 scrapy:请求url必须是str或unicode，获取选择器
python-2.7scrapy 
Python 2.7 Maya接收数据的Python套接字为“无”
python-2.7sockets 
Python 2.7 Python属性错误：Cookie
python-2.7google-app-engine 
Python 2.7 如何在导航栏中添加图标？“之后”；对话；偶像
python-2.7 
Python 2.7 IOError:[Errno 13]权限被拒绝：导出到.csv时
python-2.7csv 
Python 2.7 Kivy-使用Python寻址用KV语言创建的椭圆小部件
python-2.7 
Python 2.7 使用彭博API时未获取名为_的模块内部错误
python-2.7 
Python 2.7 Cisco设备的Python脚本
python-2.7scripting 
Python 2.7 flask jwt extended始终为/login请求提供相同的令牌
python-2.7jwt


                                        

                                        
                                        


                                                
                                                        [apache spark]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Angular
Artifactory
Fiware
Scikit Learn
Xpath
Azure Ad B2c
Memory Leaks
Django
Vim
Botframework
Synchronization
Perforce
Memory
Dataframe
Smtp
Swagger
Twilio
Login
Apache Camel
Api
Machine Learning
Oauth
Highcharts
Struct
.net
Oracle11g
Odoo
Teradata
Dynamic
Mqtt
Sql Server 2005
Cluster Computing
Doxygen
Google Compute Engine
Applescript
C++ Cli
Testng
Eclipse Rcp
Tfs
Python
Maven
Matplotlib
Vbscript
Wpf
Google App Maker
Swiftui
Binding
Gstreamer
Openlayers
Bootstrap 4
Notifications
Mapreduce
Http
Windows 8
Nginx
Ftp
Keyboard
Jquery Ui
Cryptography
Automated Tests
Verilog
Sencha Touch 2
Fonts
Ibm Mq
Permissions
Networking
Twitter
Visual Studio 2013
Air
Opengl Es
.htaccess
Laravel 4
Spring
Sbt
Salesforce
Aem
Coding Style
Telerik
Asp.net Mvc 5
Openstack
Mvvm
Jasmine
Azure Functions
Azure Devops
Caching
Map
Graph
Cloud Foundry
Couchdb
Nservicebus
Raspberry Pi
Math
Grep
Coq
Loopbackjs
3d
Merge
Hazelcast
Soap
Sml
Selenium
Php
Wordpress
Search
Kibana
Svg
Windbg
Primefaces
Lambda
Gitlab
Opencv
Amazon Dynamodb
Timer
Office365
Image
Glsl
Protocol Buffers
Migration
Aurelia
Compiler Errors
Yocto
Jsf
Rss
Jsf 2
Ibm Midrange
Activerecord
Go
Xamarin
Mediawiki
Facebook
Windows 10
Xna
Blockchain
Gis
Netty
Wso2
Cakephp
Qt4
Ruby
Ada
Azure
Google Maps
Javascript
Xml
Grid
Ios8
Rabbitmq
Abap
Serialization
Opengl
Camera
Adobe
Mariadb
Mobile
Influxdb
Shiny
Architecture
Openlayers 3
Ios5
Performance
Jms
Google Analytics
Vuejs2
Phpmyadmin
Data Binding
Kentico
Service
Gradle
Numpy
Activemq
Kubernetes
Streaming
Web Crawler
Marklogic
Excel Formula
Gruntjs
Concurrency
Continuous Integration
Tcp
Sparql
Parameters
Lua
Razor
Workflow
Certificate
Asp.net
Xpages
Pytorch
Ms Word
Sdk
Unit Testing
Phpunit
Asp.net Web Api
Jwt
View
Docker
Mongodb
Sencha Touch
Pointers
Robotframework
Fortran


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网