为什么在Sparkr中创建CSV文件会显示错误？_R_Apache Spark_Sparklyr - Fatal编程技术网

为什么在Sparkr中创建CSV文件会显示错误？

r apache-spark

为什么在Sparkr中创建CSV文件会显示错误？,r,apache-spark,sparklyr,R,Apache Spark,Sparklyr,介绍我已经通过引用编写了以下R代码。在这里，SparkyR包用于R编程，从JSON文件中读取大量数据。但是，在创建CSV文件时，它显示了错误 R代码 sc <- spark_connect(master = "local", config = conf, version = '2.2.0') sample_tbl <- spark_read_json(sc,name="example",path="example.json", header = TRUE,

介绍

我已经通过引用编写了以下R代码。在这里，SparkyR包用于R编程，从JSON文件中读取大量数据。但是，在创建CSV文件时，它显示了错误

R代码

sc <- spark_connect(master = "local", config = conf, version = '2.2.0')
sample_tbl <- spark_read_json(sc,name="example",path="example.json", header = TRUE, 
                              memory = FALSE, overwrite = TRUE)
sdf_schema_viewer(sample_tbl) # to create db schema
sample_tbl %>% spark_write_csv(path = "data.csv") # To write CSV file

sc您的数据帧似乎具有数组数据类型，CSV不支持该类型。在这种情况下，CSV文件似乎不可能包含数组或其他嵌套结构
因此，如果您希望您的数据是人类可读的文本，请将其写为Excel文件
请注意，Excel CSV（尽管非常特殊）支持使用“\n”的CSV数组
内引号，但您必须将行“\r\n”（Windows EOL）用作下线。
还需要指出的是，这里不仅仅是数组。OPs数据（，）包含一个深度嵌套的结构，实际上没有CSV等价物。@rani另一个问题仍然有点不清楚，但据我所知，这是不够的。要写入csv，您只需要原子类型（字符串、整数、小数、双精度、浮点、布尔）-不允许使用structs
或数组。这意味着您必须使用分解访问器和嵌套访问器（可能是编写Scala扩展）的组合来定义数据的形状，或者对字段进行序列化。模式本身是不明确的，所以您应该真正提供示例输入和预期输出。




[apache spark]相关文章推荐



                                                        
Apache spark 内存集群计算系统的比较
apache-sparkredisapache-storm 
Apache spark 为在workers中运行的代码导入模块
apache-sparkpyspark 
Apache spark Spark进程在客户端模式下无法从Kafka队列接收数据
apache-spark 
Apache spark 连接一个大型和巨大的spark数据帧
apache-spark 
Apache spark 为什么LogisticAggregator（Spark mllib.ml）不使用z-score规范化？
apache-spark 
Apache spark Spark pyspark vs Spark提交
apache-sparkpyspark 
Apache spark spark中每个工作节点运行多少个executor进程？
apache-spark 
Apache spark 后生存回归
apache-spark 
Apache spark 带AWS胶水的Spark目录：未找到数据库
apache-spark 
Apache spark 我可以在cosmosdb中保留嵌套模式以触发连接器吗？
apache-sparkpysparkazure-cosmosdb 
Apache spark 使用Spark结构化流媒体将csv文件转换为s3上的拼花地板
apache-spark 
Apache spark 纱线上的火花不释放资源内存（Cloudera Manager）
apache-spark 
Apache spark 使用pyspark读取Elasticsearch失败，异常为java.lang.NoClassDefFoundError:org/apache/commons/httpclient/ProtocolSocketFactory
apache-sparkexception 
Apache spark 在IP而不是主机名上启动Spark master
apache-spark 
Apache spark 在spark数据帧的不同行上应用不同的过滤器
apache-sparkpyspark 
Apache spark pyspark作业的性能问题
apache-sparkpyspark 
Apache spark 使用spark作为配置单元执行引擎的最佳参数？
apache-sparkhadoophive 
Apache spark 有没有一种方法可以使用spark结构化流读取ActiveMQ中先前排队的消息？
apache-sparkactivemq 
Apache spark 外部非分区配置单元表显示0条记录，即使拼花文件中有数据，当使用spark.read.parquet读取时，也会显示正确的数据
apache-sparkhive 
Apache spark 通过事件中心处理spark structure streaming中json文件某些属性的模式更改
apache-spark 
                                       





随机文章推荐



                                                        
Module 终止ejabberd模块中的钩子处理
module 
Module “在哪里？”；“整洁”；位于；斜纹呢；？
module 
Module 使用'时放松类型检查；类型为'；模块化构造
moduletypesocaml 
Module 测试播放模块
moduleseleniumautomated-testsplayframework 
Open Module_name给出了一个编译器错误
modulecompiler-errorsocaml 
Module 闭包按需编译加载模块
module 
Module 不显示色盒图像效果
moduledrupal-7 
Module DNN-添加安全文件夹
moduledotnetnuke 
Module 我什么时候需要三个斜杠引用？
moduletypescript 
Module DNN-自定义模块设置中的图像使用什么控件？
moduledotnetnuke 
Module 在Rust中，mod.rs文件的用途是什么？
modulerust 
Module 需要创建Vtiger 6.1自定义模块
module 
Module 将物联网模块连接至互联网服务器
module 
Module Joomla 3根据切换开关在同一位置显示不同的模块
module 
Module 尝试构建消息接收模块时发生ejabberd钩子执行错误
module 
Module 将多个OCaml签名归属于一个模块
moduleocaml 
Module u-blox M8N不'；t保存波特率，不可能进行fw更新
modulegps 
Module Discord.JS Purge.JS命令问题
modulediscord.js 
Module 在什么情况下，您会使用；模块程序“；在创建单独的模块过程时是否在子模块中？
modulefortran 
Module 由于周期性依赖关系，模块不工作的单独ansible角色dnf enablerepo
moduleansible


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
缩小了GGR图的长轴线和CI
									R
							 
R:{ggplot2}：如何/可以独立调整镶嵌面网格图上的x轴限制？
									R
							 
R 如何将日期和时间转换为数值
									R
							 									Datetime
							 
R 如何使用已计算的值在ggplot2图上绘制95%和5%的坐标？
									R
							 
对于R中的向量运算符，将drop永久设置为FALSE
									R
							 									Matrix
							 
循环上R中的列表索引
									R
							 									List
							 
使用r将因子变量随机分配到不同的组中
									R
							 
R 如何绘制时间点的一维散点图？
									R
							 									Time
							 									Plot
							 
R：将gdroplist的svalue保存到向量
									R
							 									Vector
							 
R 最近邻平均值标记（空间点模式）标记平均值
									R
							 
R plot删除旧的plot循环
									R
							 									Plot
							 
R 带有函数gmv_opt的端口组合分析错误
									R
							 
日期时间格式，TZ用R中的日期时间指定（ISO 8601）
									R
							 
R 将DEoptim中的几个参数固定为整数
									R
							 									Optimization
							 
R非数值参数误差的极大似然估计
									R
							 									Statistics
							 
如何将R中具有类别值的df与另一个具有相应值的df合并？
									R
							 									Merge
							 
安装错误"；dplyr“；在r
									R
							 
R从自动完成中隐藏包中的内部对象
									R
							 
R 按条件合并多个列
									R
							 									Merge
							 									Mapping
							 
R 如何将分组后的数据帧转换为向量列表
									R
							 									List
							 									Dataframe
							 
Rcpp矩阵行-列置换
									R
							 
如何求R中包含M和B的列的值之和
									R
							 
R 导入xlsx文件-输出错误
									R
							 
R 两组变量之间的相关性
									R
							 
R 如何在Shining中下载可编辑的数据表
									R
							 									Shiny
							 
R-按行查找第一、第二和第三大值
									R
							 									Dataframe
							 
在r脚本中记录函数
									R
							 
在ShinyDashboard中调整方框内DataTable的高度
									R
							 									Shiny
							 
R：插入符号包：Brier分数
									R
							 
R 和x27中规定的S4出口；名称空间'；但未在包中定义
									R
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Talend
Odata
Parallel Processing
Excel Formula
Redux
Hive
Dependency Injection
Resharper
Cygwin
Permissions
Windows Mobile
Swift2
Merge
Verilog
Apache Pig
Ftp
Cassandra
Encoding
Jdbc
Mpi
Jwt
Windows
Sql
Ant
Swagger
Asp.net
Sql Server 2008 R2
Performance
Login
Markdown
Makefile
Azure Ad B2c
Silverlight 4.0
Azure Cosmosdb
EmptyTag
Dynamics Crm 2011
Web
Joomla
Apache Nifi
Grails
Clojure
Lua
Core Data
Servlets
Compiler Construction
Influxdb
Google Chrome Devtools
Vba
Ethereum
Operating System
Class
Osgi
Polymer
Puppet
Nhibernate
Extjs4
Telegram
Ffmpeg
Node.js
Angular
Asterisk
Maps
Interface
Tfs
Phpunit
Fonts
React Native
Scrapy
Forms
Nestjs
Sass
Ios6
Apache
Terminal
Tcp
Sonarqube
Session
Discord.py
Vb6
Google Cloud Storage
R
Junit
Fiware
Kibana
Lotus Notes
Mule
X86
Glassfish
Gatsby
Yocto
Jestjs
Plot
Geometry
Random
Visual Studio 2012
Csv
Web Services
Windows 8
Android
Methods
Pip
Google Maps
Ssh
Symfony1
Arm
Aframe
Composer Php
Wolfram Mathematica
Jetty
Streaming
Entity Framework Core
Xml
Module
Sphinx
Octave
Testng
Ruby On Rails
Ajax
Windows Services
Angular Material
Object
Xamarin.android
Oauth
Php
Solr
Anaconda
Batch File
Automated Tests
Xcode4
Ocaml
Google App Maker
Coding Style
Entity Framework
Windows Phone 8
Memory
Xamarin.ios
Nlp
Sip
Jquery
Video Streaming
Neural Network
Passwords
Qt4
Validation
Google Analytics
Nunit
Opencv
Jira
Ckeditor
Redirect
Nest
Drupal 6
Sugarcrm
Utf 8
Perl
Google Cloud Dataflow
Clearcase
Isabelle
C++ Cli
Canvas
Linker
Vmware
Sencha Touch 2
Zsh
Graphics
Ssl
Jsp
Logging
Nativescript
Matlab
Templates
Asynchronous
Collections
Visual Studio 2017
Rest
Apache Kafka
Directory
Content Management System
Graphviz
Service
Url
Mapbox
D
Mapreduce
Virtual Machine
Visual Studio Code
Kdb
Google Maps Api 3
Dojo
Entity Framework 4
Wxpython
Hyperledger Fabric
Postgresql
Objective C
Math
Version Control
Yaml
Vagrant
Winforms
Python Sphinx
Ios7


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网