Scala Spark.csv可变列数_Scala_Csv_Apache Spark - Fatal编程技术网

Scala Spark.csv可变列数

scala csv apache-spark

Scala Spark.csv可变列数,scala,csv,apache-spark,Scala,Csv,Apache Spark,我有这样一个案例课： case class ResultDays (name: String, number: Double, values: Double*) 我想把它保存到一个.csv文件中 resultRDD.toDF() .coalesce(1) .write.format("com.databricks.spark.csv") .option("header", "true") .save("res/output/result.csv") 不幸的是，我有这个错误：

我有这样一个案例课：

case class ResultDays (name: String, number: Double, values: Double*)

我想把它保存到一个

.csv

文件中

resultRDD.toDF()
  .coalesce(1)
  .write.format("com.databricks.spark.csv")
  .option("header", "true")
  .save("res/output/result.csv")

不幸的是，我有这个错误：

java.lang.UnsupportedOperationException: CSV data source does not support array<double> data type.

java.lang.UnsupportedOperationException:CSV数据源不支持数组数据类型。

那么，我如何插入一个数量可变的

值

并将其保存到

.csv

中呢？

如果可以假设

resultRDD

中的所有记录在

值

中的列数相同，那么可以先读取

记录，然后使用它来确定数组中的值数，并将这些数组转换为单独的列：
// determine number of "extra" columns:
val extraCols = resultRDD.first().values.size

// create a sequence of desired columns:
val columns = Seq($"name", $"number") ++ (1 to extraCols).map(i => $"values"(i - 1) as s"col$i")

// select the above columns before saving:
resultRDD.toDF()
  .select(columns: _*)
  .coalesce(1)
  .write.format("com.databricks.spark.csv")
  .option("header", "true")
  .save("res/output/result.csv")

示例CSV结果如下所示：
name,number,col1,col2
a,0.1,0.01,0.001
b,0.2,0.02,0.002
c,0.3,0.03,0.003

CSV作为一种格式，不支持可变数量的值，因为所有记录必须具有相同的列。您知道预期值的数量吗？可能是values
成员可能具有的最大值数？我必须为每行写入相同数量的值，但我不知道在运行之前有多少值。好的-但是一旦有了resultRDD
，您可以假设所有记录都具有相同数量的值？是的，但是使用ResultDays
类，它包含Double*
，似乎我不能使用它




[csv]相关文章推荐



                                                        
Csv 清管器使用PigStorage（'；，'；）加载地图
csvmapapache-pig 
加载csv文件并将其与Scilab中的其他文件进行比较
csv 
Csv 查询Win32\u目录时WMI查询返回空集合
csvvbscript 
Csv 使用python 3比较2个文件
csvpython-3.xtabs 
在批量CSV文件中添加缺少的文本
csv 
Csv JMeter：有没有办法注入值；病人1077，ELLA（161号药房地址）；在输入字段中
csvtestingjmeter 
从CSV文件导入关系时失败
csvneo4j 
Csv 当源为gzip时，Vertica COPY拒绝所有数据
csv 
SSIS-使用脚本任务在csv输出文件中将null值保留为null
csvssis 
Neo4j将属性从CSV添加到节点
csvneo4j 
Neo4j LOAD CSV错误：查询无法以LOAD CSV结束
csvneo4j 
CSV行的第一个字母移动到字段末尾
csvsed 
从我的服务器下载*.csv
csvhttpgo 
Csv Spark：没有输入文件名
csvapache-spark 
Csv 删除最后一个（\n）符号
csvawk 
使用Spark内置函数或方法解析Pyspark中的csv文件
csvapache-sparkpyspark 
将数据帧写入CSV-Spark 1.6
csvapache-sparkpyspark 
如何使用akka stream alpakka编写带有标题的CSV文件？
csv 
Csv 需要在Jmeter中生成大容量文件，并上载带有| |符号的UUID文件名格式的文件
csvjmeter 
如何阅读不同的'；通过在Go中使用CSV创建字段行？
csvgo 
                                       





随机文章推荐



                                                        
Prestashop模块已安装，但无法按预期工作
prestashop 
prestashop 1.5中的多存储
prestashop 
模块配置工具栏按钮不'；在Prestashop 1.6中未显示
prestashop 
Prestashop 适用于更多类别的过滤前置产品
prestashop 
用于Prestashop 1.6的appixia cartapi
prestashop 
Prestashop 未保存授权.Net事务详细信息
prestashop 
使用ngResource连接prestashop
prestashop 
在PrestaShop中在何处注册全局smarty修改器？
prestashop 
根目录中Prestashop中的文件'modules.txt'是用于什么的？
prestashop 
Prestashop 我想选择一个属性为“无库存”的产品
prestashop 
Prestashop Buy now链接/按钮在静态网站中-无高级插件
prestashop


                                        

                                        
                                        


                                                
                                                        [scala]相关推荐
                                                        
如何使用Scala中的函数映射2个映射？
									Scala
							 									Mapping
							 
如何更改生成定义的Scala版本？
									Scala
							 									Sbt
							 
Scala 宏获取类主体，消除显式新运算符？
									Scala
							 									Macros
							 
Scala编译器错误：只有类可以有已声明但未定义的成员
									Scala
							 
在Scala 2.10或更高版本中，如何提供；“空的”；挡块
									Scala
							 
Scala 滑动升降台类型错误
									Scala
							 									Sbt
							 
Scala:仅使用指定的路径相关类型参数调用函数
									Scala
							 
Scala 如何从枚举器/迭代对象获取结果？
									Scala
							 									Playframework
							 									Playframework 2.0
							 
从scala中的泛型类继承
									Scala
							 									Generics
							 									Inheritance
							 
Scala可变集：奇怪的行为
									Scala
							 
Scala /：函数的作用点是什么？
									Scala
							 
有关scala.tools/scala.tools.asm的问题
									Scala
							 
Scala 错误处理程序中喷洒的内容协商
									Scala
							 
Scala 重写在编写单元测试用例时返回单元的方法
									Scala
							 									Unit Testing
							 
Scala sbt策略不起作用
									Scala
							 									Sbt
							 
如何在播放框架scala应用程序中显示S3私有访问图像/视频
									Scala
							 									Amazon S3
							 									Playframework
							 									Playframework 2.0
							 
Scala泛型单子函数？
									Scala
							 									Functional Programming
							 
Scala 如何获取当前的配置文件名
									Scala
							 
Scala Spark中的高效级联
									Scala
							 									Optimization
							 									Apache Spark
							 
Scala 使用spark将RDD保存到hbase时，输出目录未设置异常
									Scala
							 									Apache Spark
							 									Hbase
							 
Scala Spark-CSV文本加载解析错误
									Scala
							 									Csv
							 									Apache Spark
							 
Scala 在Intellij Idea中调试外部库的代码
									Scala
							 									Intellij Idea
							 									Sbt
							 
Scala 带有Lagom的多部分表单错误
									Scala
							 									Playframework
							 
Scala ADT类型不匹配
									Scala
							 
Scala 使用play swagger repository在localhost中看不到swagger json
									Scala
							 									Playframework
							 									Swagger
							 
Scala 如何正确编写可能失败的foldLeft函数？
									Scala
							 									Functional Programming
							 
Scala 检查集合中包含的所有元组中的给定元素是否相等
									Scala
							 									Collections
							 
Scala 何时对递归函数/方法使用辅助递归函数/方法
									Scala
							 									Recursion
							 
Scala 无法删除存根控制器组件
									Scala
							 									Playframework
							 
Scala 如何基于case类动态重命名Spark DF中的列
									Scala
							 									Apache Spark
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Import
Marklogic
Processing
Opencart
Json
Dll
Ruby On Rails 3.2
Stm32
Architecture
Functional Programming
Mongoose
Mercurial
Python Sphinx
Generics
Apache Flink
Python 2.7
Button
Hazelcast
Sas
Uiview
Docusignapi
Types
Hadoop
Authentication
Migration
Outlook
Spring Cloud
Grails
Dynamics Crm
Ios8
Tcl
Ios4
Sms
Uitableview
Erlang
View
Coldfusion
Clang
Javafx
Activemq
Acumatica
Pip
Asp.net Mvc 3
Plugins
Validation
Logstash
Spring
Gradle
Amp Html
Perl
Ldap
Events
Swift3
Web Scraping
Binary
Makefile
Xmpp
Rest
Grep
Mqtt
Optimization
Pyspark
Eclipse Rcp
Iframe
Redux
Webgl
Windows Phone 8
Indexing
Netlogo
Xcode
Node.js
Typo3
Groovy
Twilio
Macros
Sharepoint 2007
Doxygen
Typescript
Ajax
Dotnetnuke
Cocos2d X
Visual Studio 2017
Geometry
Collections
Regex
Extjs4
Drupal 7
Primefaces
Azure Cosmosdb
Vb.net
Nativescript
Amazon Cloudformation
Ionic2
Grid
Angular Material
Tridion
Vmware
Isabelle
Asp.net Mvc
C# 4.0
Amazon Redshift
Yaml
Testing
Robotframework
Scripting
File Upload
String
Nlp
Discord
Testng
Orm
System Verilog
Quickbooks
Yii2
Xamarin.forms
Active Directory
Pdf
Url Rewriting
Azure Data Factory
Apache Kafka
Sugarcrm
Wordpress
Ibm Midrange
Calendar
Hive
Path
Compression
Mapping
Webstorm
Orientdb
Flash
Animation
C# 3.0
Floating Point
Websocket
Jsf
Encryption
Silverlight
Arm
Cocoa Touch
Gremlin
Telegram
Asp.net Mvc 4
Antlr4
Android Layout
Windows Phone 8.1
Opencv
Content Management System
Artifactory
Io
Csv
Jwt
Version Control
Asp.net Mvc 5
Terminal
Sitecore
Keycloak
Struct
Twitter Bootstrap
Matplotlib
C++
Post
Big O
Memory Management
Menu
Fonts
Sails.js
Zend Framework
Webview
Hybris
Safari
Bison
Java 8
Ipad
Doctrine Orm
Eclipse Plugin
Unicode
Openerp
Deep Learning
Logging
Google Calendar Api
Google Analytics
Ipython
Compiler Errors
Asp Classic
Kotlin
Vhdl
Asp.net Core Mvc
Reference
Linux
Session
Build
Jaxb
D
Xamarin
Docker
Rdf
Tabs
Chart.js
Nginx
Xampp


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网