Apache spark Spark-DF缓存表方法。它会将数据保存到磁盘吗？_Apache Spark_Apache Spark Sql_Spark Dataframe - Fatal编程技术网

Apache spark Spark-DF缓存表方法。它会将数据保存到磁盘吗？

apache-spark

Apache spark Spark-DF缓存表方法。它会将数据保存到磁盘吗？,apache-spark,apache-spark-sql,spark-dataframe,Apache Spark,Apache Spark Sql,Spark Dataframe,我正在做一个spark项目，我们将从数据库中读取1亿条记录我们正在从JDBC读取数据并创建DF。我想缓存DF，因为它将用于多次迭代和计算我的问题是，如果使用DF cachetable（），数据将只保存在内存中。由于数据库读取是昂贵的，我不想再次读取失败的情况下在RDD持久化功能中，我们可以选择将RDD保存到磁盘？我们可以在Dataframe cachetable中这样做吗？我也不想失去对cachetable的优化它将使用内存和磁盘： def cache（）：Dataset.this.typ

我正在做一个spark项目，我们将从数据库中读取1亿条记录

我们正在从JDBC读取数据并创建DF。我想缓存DF，因为它将用于多次迭代和计算

我的问题是，如果使用DF cachetable（），数据将只保存在内存中。由于数据库读取是昂贵的，我不想再次读取失败的情况下

在RDD持久化功能中，我们可以选择将RDD保存到磁盘？我们可以在Dataframe cachetable中这样做吗？我也不想失去对cachetable的优化

它将使用

内存和磁盘

：

def cache（）：Dataset.this.type

使用默认存储级别（内存和磁盘）持久化此数据集

它将使用

内存和磁盘：
def cache（）：Dataset.this.type
使用默认存储级别（内存和磁盘）持久化此数据集
我正在考虑使用cachetable，它有一些优化。但这是指定保存在内存中的。def cacheTable（tableName:String）：单元在内存中缓存指定的表。从1.3.0开始，我就考虑使用cachetable，它有一些优化。但这是指定保存在内存中的。def cacheTable（tableName:String）：单元在内存中缓存指定的表。从1.3.0开始




[tinymce]相关文章推荐



                                                        
在覆盖中使用TinyMCE（jQuery工具覆盖）
tinymce 
Tinymce 硒2.0b3，处理IE9中的锡
tinymceselenium-webdriver 
J在TinyMce.js中为空
tinymce 
集成AngularJS和tinyMCE
tinymceangularjs 
TinyMCE 4：如何强制Tiny editor为p标记应用单个类？
tinymce 
࿽；在Enter键按tinymce编辑器后追加
tinymce 
Tinymce t禁用web字体下载时不显示YMCE4图标
tinymce 
Tinymce 如何防止自动添加mailto属性
tinymce 
tinyMCE-是否可以防止在文本框中剪切和粘贴图像（base64）？
tinymce 
Tinymce-如何让用户知道快捷方式
tinymce 
使特定的TinyMCE文本区域为只读或设计
tinymce 
                                       





随机文章推荐



                                                        
让lucene只返回唯一的线程（为线程和帖子编制索引）
lucene 
使用Lucene搜索时使用FieldSelector
lucene 
ehcache与lucene的比较
lucene 
lucene 4.0快照中缺少包
lucene 
Lucene hibernate搜索数值范围查询<；浮动>；不处理用@NumericField定义的字段
lucene 
Lucene 使用PDFBox提取不带页眉和页脚的文本
lucene 
使用Lucene.net的短语和单词建议
lucene 
使用Tika解析流（读卡器），同时使用Lucene对其进行索引
lucenestreaming 
如何使用Term或QueryParser从Lucene索引中删除文档
luceneindexing 
Lucene Elasticsearch：何时将“忽略”选项设置为false
luceneindexing 
使用Cloudant/Lucene进行的模糊搜索没有结果
lucene 
Lucene Elasticsearch查询多个类型并按类型分组？
lucene 
可以对Kibana/Lucene查询进行简单的演算吗？
lucenekibana 
Lucene contextsField做什么
lucene 
如何在Lucene中存储多种不同类型的文档
lucene 
查询elasticsearch返回计数
lucene 
是否可以使用lucene查询语法在ElasticSearch中搜索嵌套对象？
lucene 
Elasticsearch 具有边界盒地理定位的弹性搜索渗流在Lucene中引发NullPointerException
lucenegeolocation 
应用程序是否打算使用特定的Lucene类？
lucene 
用Lucene 7 OpenNLP查询词性标签
lucenenlp


                                        

                                        
                                        


                                                
                                                        [apache spark]相关推荐
                                                        
Apache spark 如何在一个字符串中读取整个文件
									Apache Spark
							 
Apache spark 拼花文件是否保留Spark数据帧的行顺序？
									Apache Spark
							 
Apache spark Apache Spark DAG创建者
									Apache Spark
							 
Apache spark 保存到hdfs时AvroSchema的ClassNotFoundException
									Apache Spark
							 
Apache spark 重新分区是否不会将数据洗牌到所有节点？
									Apache Spark
							 
Apache spark Spark：创建每项窗口功能
									Apache Spark
							 
Apache spark AWS EMR-将文件上载到应用程序主机
									Apache Spark
							 
Apache spark java.lang.NoClassDefFoundError:org/slf4j/impl/StaticLoggerBinder启动spark2时出错
									Apache Spark
							 
Apache spark 如何加载logistic回归模型？
									Apache Spark
							 
Apache spark 如何在spark中将数据帧转换为csv
									Apache Spark
							 									Machine Learning
							 									Pyspark
							 
Apache spark 使用数组修改Dataframe列
									Apache Spark
							 									Pyspark
							 
Apache spark 使用「；在“中”；在2个Spark数据帧列之间
									Apache Spark
							 									Pyspark
							 
Apache spark 当不再检查状态数据时，Spark结构化流如何刷新内存状态？
									Apache Spark
							 
Apache spark Spark dataframe-SizeEstimator的计算大小给出了意外的结果
									Apache Spark
							 
Apache spark Apache Spark 2.1中缺少LinearSVC？Spark 2.2中的非线性内核？
									Apache Spark
							 									Machine Learning
							 
Apache spark PySpark在失败时重新启动SparkContext
									Apache Spark
							 									Pyspark
							 
Apache spark 使用union（）组合按不同字段分区的历史数据和实时数据
									Apache Spark
							 
Apache spark 写/读中间数据帧比缓存工作得更好。。这是预期的行为吗？
									Apache Spark
							 
Apache spark Pyspark、groupBy和嵌套列前缀
									Apache Spark
							 									Pyspark
							 
Apache spark spark中的默认洗牌分区值
									Apache Spark
							 
Apache spark 什么'；ApacheSpark中ExternalSorter和ExternalAppendOnlyMap之间的区别是什么？
									Apache Spark
							 
Apache spark 如何获得Spark Streaming运行时间
									Apache Spark
							 
Apache spark 获取Apache Spark数据帧（Scala）中列的最大值
									Apache Spark
							 
Apache spark java中的火花，由以下原因引起：com.fasterxml.jackson.databind.JsonMappingException:不兼容的jackson版本：2.9.4
									Apache Spark
							 
Apache spark spark decimal issue-自动将第10位小数舍入或截断
									Apache Spark
							 
Apache spark spark sql查询如何转变为多个阶段
									Apache Spark
							 									Pyspark
							 
Apache spark 如何在AWS databricks上设置spark.task.maxFailures？
									Apache Spark
							 
Apache spark 在达到最新偏移量之前，卡夫卡消息不会写入拼花地板文件
									Apache Spark
							 									Apache Kafka
							 
Apache spark 纱线上的哪个目录spark应用程序将其日志输出到哪个目录？每个节点中的spark.eventLog.dir或var/log/？
									Apache Spark
							 									Hadoop
							 
Apache spark 如何在EMR中向任务节点添加自定义节点标签
									Apache Spark
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Visual C++
Nhibernate
Azure Cosmosdb
Jekyll
Phpstorm
Bluetooth
Ionic Framework
Kotlin
Opencv
Orm
Asp.net Core Mvc
Rdf
Less
Google Drive Api
Webrtc
Ant
Report
Snmp
Logic
Mobile
Azure
Wcf
Neural Network
Matrix
Jenkins
Ios6
Odata
Loops
Xmpp
Sapui5
Jquery Plugins
Couchbase
Keycloak
Sequelize.js
Ruby On Rails 3.1
Variables
Visual Studio 2017
Sugarcrm
Stanford Nlp
Dns
Twitter
Android Emulator
Yii2
Select
Azure Sql Database
Ruby On Rails 3
Resharper
Identityserver4
Linker
Canvas
Jestjs
Methods
Mapreduce
Colors
Jboss
Windbg
Netbeans
Join
Time Complexity
Apache Flex
Api
Single Sign On
Clang
Crystal Reports
Influxdb
Azure Functions
Html
Google App Engine
Fiware
Jupyter Notebook
If Statement
Entity Framework Core
Sharepoint 2013
Sphinx
Vhdl
Ssl
Pandas
Modelica
Sql Server 2005
Silverstripe
Datatables
For Loop
Here Api
Google Analytics
Three.js
Filesystems
Matlab
Glsl
Imagemagick
Google Sheets
Functional Programming
Internet Explorer 8
Vector
Model
Automation
Pointers
Rspec
Random
Tinymce
Cocoa
Iphone
Rust
Jakarta Ee
Ibm Mobilefirst
Eclipse
Twitter Bootstrap 3
Shopify
Instagram
Laravel 5
Mule
Tabs
Inheritance
Next.js
Autocomplete
E Commerce
Scripting
Drupal 6
Character Encoding
Jar
Session
Cucumber
Inno Setup
Xpages
Db2
Arm
Csv
Ftp
Sqlite
Jasper Reports
Antlr4
Tsql
.net 4.0
Transactions
Artificial Intelligence
Kdb
Notepad++
Gmail
Azure Service Fabric
Wordpress
Jetty
Pdf
Entity Framework
Twig
Language Agnostic
Gruntjs
Import
Amazon Web Services
Puppet
Perl
Compiler Errors
Rally
Deep Learning
Protocol Buffers
Database Design
Tree
Sms
Actionscript
Visual Studio
Mod Rewrite
Alfresco
Windows Runtime
Image
Ibm Midrange
Embedded
Sbt
Gdb
Streaming
Ms Access
Cookies
Extjs4
Templates
3d
Geometry
Continuous Integration
Database
Mariadb
Content Management System
Multithreading
Virtual Machine
Udp
Npm
Flask
Talend
Gnuplot
Opencl
Plone
Netty
Unity3d
Coq
Data Binding
Mongoose
Orchardcms
Github
Indexing
Zurb Foundation
Wix
Cocos2d X
Swift
Isabelle
Redis
Formatting


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网