如何在pyspark中使用多行选项将数据帧保存到json文件中_Json_Pyspark_Pyspark Dataframes - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/json/15.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何在pyspark中使用多行选项将数据帧保存到json文件中_Json_Pyspark_Pyspark Dataframes - Fatal编程技术网

如何在pyspark中使用多行选项将数据帧保存到json文件中

json pyspark

如何在pyspark中使用多行选项将数据帧保存到json文件中,json,pyspark,pyspark-dataframes,Json,Pyspark,Pyspark Dataframes,在Pyspark中，我想将数据帧保存为json文件，但格式如下假设这是我的数据帧 >>> rdd1.show() +----------+-----+ | f1| f2| +----------+-----+ |AAAAAAAAAA|99999| | BBBBBBBBB|99999| | CCCCCCCCC|99999| +----------+-----+ 如果我将上面的数据帧保存为json文件，它将给出如下输出 >>>rdd1.coa

在Pyspark中，我想将数据帧保存为json文件，但格式如下

假设这是我的数据帧

>>> rdd1.show()
+----------+-----+
|        f1|   f2|
+----------+-----+
|AAAAAAAAAA|99999|
| BBBBBBBBB|99999|
| CCCCCCCCC|99999|
+----------+-----+

如果我将上面的数据帧保存为json文件，它将给出如下输出

>>>rdd1.coalesce(1).write.json("file:///test_directory/sample4")
{"f1":"AAAAAAAAAA","f2":"99999"}
{"f1":"BBBBBBBBB","f2":"99999"}
{"f1":"CCCCCCCCC","f2":"99999"}

但我希望它像下面一样

[{"f1":"AAAAAAAAAA","f2":"99999"},{"f1":"BBBBBBBBB","f2":"99999"},{"f1":"CCCCCCCCC","f2":"99999"}]

我已经尝试过选项（“multiLine”、“true”）和lineSep=“，”似乎都不起作用，这些选项只适用于读而不适用于写。请建议此问题的解决方案

使用收集列表
函数使用收集json
并以.text（）的形式编写示例： df.show() #+-----+-----+ #| f1| f2| #+-----+-----+ #|AAAAA| 9999| #| BBB|99999| #| CCCC| 9999| #+-----+-----+ from pyspark.sql.functions import * df.agg(to_json(collect_list(struct(col("f1"),col("f2")))).alias("d")).\ write.\ mode("overwrite").\ text("<path>") #output #[{"f1":"AAAAA","f2":"9999"},{"f1":"BBB","f2":"99999"},{"f1":"CCCC","f2":"9999"}] df.show（） #+-----+-----+ #|f1 | f2| #+-----+-----+ #|AAAA | 9999| #|BBB | 99999| #|中交| 9999| #+-----+-----+ 从pyspark.sql.functions导入* agg（to_json（collect_list（struct（col（“f1”）、col（“f2”）））））.alias（“d”））\ 写\ 模式（“覆盖”）\ 正文（“”） #输出 #[{“f1”：“AAAA”，“f2”：“9999”}，{“f1”：“BBB”，“f2”：“99999”}，{“f1”：“CCCC”，“f2”：“9999”}]

[pyspark]相关文章推荐

Pyspark 多列上的Spark数据帧聚合 pyspark

pyspark.sql.dataframe.dataframe在对1000万条记录应用操作时崩溃 pyspark

在pyspark中将列内容拆分为行 pyspark

Pyspark 数据帧'；对象没有属性'；添加后缀'； pyspark

使用pyspark聚合另一列时，从单个列中查找多个值的计数、通过和失败百分比 pyspark

解析jsons pyspark的字符串 pyspark

在Pyspark中选择其他列时对RDD列应用转换 pyspark

正在转换pyspark数据帧列，但圆函数不起作用（pyspark） pyspark

在pyspark数据帧中rdd是什么意思 pyspark

Pyspark 连接两个管道DRDD pyspark jupyter-notebook

Pyspark数据帧/Spark SQL中中间有间隙的滑动窗口 pyspark

Pyspark RDD元素和广播变量之间的欧氏距离 pyspark

将apachehudi与Python/Pyspark结合使用 pyspark

Pyspark 数组交集上的连接 pyspark hive

Glue PySpark作业：调用o73.save时出错。ThreadPoolExecutor已关闭 pyspark

如何在pyspark dataframe上执行行数据规范化？ pyspark

如何从pyspark中与上一年相同的列中减去行值？ pyspark

如何在pyspark数据帧上使用forEachPartition？ pyspark

Pyspark：从结构中标识arrayType列，并调用udf将数组转换为字符串 pyspark

随机文章推荐

Error handling lua递归repl on错误？ error-handling lua

Error handling 订户单击时发生致命错误# error-handling asterisk

Error handling Quartz.net作业未处理的异常行为 error-handling

Error handling com.google.android.voicesearch.speechservice.ConnectionException:无法建立连接 error-handling speech-recognition

Error handling 检测SSI中的部分行 error-handling ssis

Error handling 无法在axis 1.4中维护多个会话 error-handling netsuite

Error handling 重新指定异常，除非它们属于某种类型 error-handling smalltalk

Error handling 检查自定义错误的类型 error-handling go

Error handling Firebase简单登录仅抛出'；无效的电子邮件'；错误 error-handling firebase

Error handling 在环回资源管理器中添加错误描述 error-handling

Error handling 何时调用RTCDataChannel.onerror？ error-handling webrtc

Error handling DataStage-将失败消息捕获到sql表中 error-handling

Error handling 400对422，用于客户端错误请求 error-handling

Error handling 尝试获取输出消息时发生ADF错误 error-handling azure-data-factory

Error handling 带有errorChannel标头的异步消息流以异常结束 error-handling spring-integration

Error handling _在FreeRTOS上展开不同上下文的\u回溯 error-handling embedded

Error handling 如何使用Serde解析可能无法反序列化的字段，而不会导致整个反序列化失败？ error-handling rust

Error handling 密钥派生上的OpenSSL AES对称错误 error-handling openssl

[json]相关推荐

Tags

Cloud Foundry Visual Studio 2010 Pagination .net 4.0 Gstreamer Scala .htaccess Uiview Gremlin Playframework Networking Nativescript Reference Smalltalk Kubernetes Asynchronous Facebook Graph Api Sharepoint 2010 Tfs Composer Php Snmp Installation Gridview Google Apps Script Curl Javascript Calendar Sails.js Jvm Llvm Apache2 Visual C++ Deep Learning Hibernate Smtp Jwt Url Process Java 8 Ibm Cloud Google Cloud Dataflow Azure Devops Mediawiki Office365 Jsp Asp.net Core Grid Spring Mvc Bison User Interface Vim Datetime Keyboard Android Ndk Antlr4 Phantomjs Usb Data Binding Log4net Paypal X86 Ecmascript 6 Appium Outlook Jqgrid Openlayers 3 Image Processing Import Dart Mapbox Tableau Api Liferay Mdx If Statement Gps Sqlite Mysql Dynamic Maven 2 Applescript Terraform Razor Swiftui Binding Julia Itext Windows 7 Apache Camel Microsoft Graph Api Exchange Server Operating System Azure Active Directory Scroll Swing Windows Phone 8.1 Discord Windows 8 Opencl Sencha Touch 2 Oauth 2.0 Continuous Integration Lambda Internationalization Google Cloud Platform Web Kentico Wpf Cloud Phpstorm Ember.js Linq Vb6 Passwords Jenkins Sublimetext3 Ssrs 2008 Localization Cordova Windows Phone Gatsby Module Visual Studio 2012 Gruntjs Angular Material Ruby On Rails 3.1 Jquery Mobile Github Navigation Lisp Cors Debian Wolfram Mathematica Actionscript Xcode4 Scrapy Sql Server Sip Timer Mvvm Iphone Ignite Facebook Colors Drools Database Design Opencv Amazon Redshift Redux Gulp Ruby Opengl Url Rewriting Notifications Debugging Object Express Odata Push Notification Twitter Shiny Protractor Arm Shopify Linker Keras Monitoring Crystal Reports Ibm Mq Ftp Svn Azure Functions Clojure Aframe Robotframework Automated Tests Docusignapi Hadoop Api Plsql Fluent Nhibernate Graphql Internet Explorer 8 Vector Telegram Typescript Dynamics Crm Speech Recognition Winapi Neo4j Wcf Tinymce Laravel 4 Optimization Antlr Bootstrap 4 System Verilog Sql Server 2008 R2 Spring Security Seo Emacs Parsing

Copyright © 2024. All Rights Reserved by - Fatal编程技术网