Python 如何使数据帧分区在S3键名中包含文字冒号而不是编码的（%3A）冒号_Python_Apache Spark_Pyspark_Apache Spark Sql_Pyspark Sql - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/337.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何使数据帧分区在S3键名中包含文字冒号而不是编码的（%3A）冒号_Python_Apache Spark_Pyspark_Apache Spark Sql_Pyspark Sql - Fatal编程技术网

Python 如何使数据帧分区在S3键名中包含文字冒号而不是编码的（%3A）冒号

python apache-spark pyspark

Python 如何使数据帧分区在S3键名中包含文字冒号而不是编码的（%3A）冒号,python,apache-spark,pyspark,apache-spark-sql,pyspark-sql,Python,Apache Spark,Pyspark,Apache Spark Sql,Pyspark Sql,在pyspark中，我有一个数据框，其中包含一个日期列，日期被截断为当天 # +-------------------+ # |d | # +-------------------+ # |2018-04-07 00:00:00| # +-------------------+ 当我这样做时： df.write.partitionBy('d')

在pyspark中，我有一个数据框，其中包含一个日期列，日期被截断为当天

# +-------------------+                                                           
# |d                  |
# +-------------------+
# |2018-04-07 00:00:00|
# +-------------------+

当我这样做时：

df.write.partitionBy('d').parquet('s3://somebucket/out/')

。。。我希望能找到名为：

s3://somebucket/out/d=2018-04-07 00:00:00/part-*-c*.snappy.parquet

。。。但是，我发现：

s3://somebucket/out/d=2018-04-07 00%3A00%3A00/part-*-c*.snappy.parquet

（请注意“%3A”而不是“：”）

这对雅典娜/hive/etc分区造成了严重破坏

有没有办法让pyspark使用实冒号而不是将其编码为%3A？

如何更改日期格式？事实上，你甚至不需要时间信息，所以你可以简单地去掉那部分…@ErnestKiwele-当然。能否在.partitionBy中指定日期格式？还是最好在写入之前在数据帧上选择？如果是时间戳，我只需更改列的数据类型，如果是字符串，则更改格式。是，在调用

之前。编写




[apache spark]相关文章推荐



                                                        
Apache spark 火花流错误-窗口化数据流窗口不工作
apache-spark 
Apache spark Spark SQL窗口/分析函数的综合参考资料在哪里？
apache-spark 
Apache spark 如何将Spark流式数据流作为SQL表
apache-spark 
Apache spark 为什么Spark streaming创建具有0个事件的批处理？
apache-spark 
Apache spark Spark是否使用HDFS集中式缓存？
apache-spark 
Apache spark 是否在不使用UDF的情况下向pyspark dataframe添加新列？
apache-sparkpyspark 
Apache spark Spark UI的executors选项卡中的输入列表示什么？
apache-sparkapache-kafka 
Apache spark 使用Spark+将一张桌子覆盖到另一张桌子的性能较低；卡桑德拉
apache-sparkcassandra 
Apache spark Spark历史记录服务器未启动
apache-spark 
Apache spark 如何在AWS EMR的Spark Thrift服务器上配置LDAP？
apache-spark 
Apache spark 为什么使用where条件进行计数查询需要对数据进行洗牌？
apache-spark 
Apache spark 如何在PySpark中将数据帧保存到Elasticsearch？
apache-sparkpyspark 
Apache spark Spark目录元数据存储在哪里？
apache-sparkhive 
Apache spark 如何验证流式处理批处理的每一行？
apache-spark 
Apache spark Spark writestream如何知道输入流中出现了新的内容，现在它必须进行写入？
apache-spark 
Apache spark 如何查找Spark群集的工作人员信息？
apache-sparkpyspark 
Apache spark 转换pandas数据帧会导致Spark数据帧为空，但不会引发错误或警告
apache-sparkpyspark 
Apache spark 在pyspark中执行partitionBy column时，消除特定列的空值行
apache-sparkpyspark 
Apache spark spark应用程序之间的通信
apache-sparkhadoopairflow 
Apache spark 如何根据多个条件过滤出RDD？
apache-sparkpyspark 
                                       





随机文章推荐



                                                        
Loops 执行嵌套循环+；foreach&x2B；csh
loopsfor-loop 
Loops 在Jmeter中更改循环中的变量
loopsjmeter 
Loops 在Makefiles中的列表上迭代-重新访问
loops 
Loops AppleScript在automator中循环工作流
loopsapplescriptworkflow 
Loops 递归循环问题
loops 
Loops 是否有一个Makefile级别；至于；环
loopsfor-loopmakefile 
Loops If-else语句，而循环中断
loopsif-statement 
Loops 按键时切换循环？
loopsautohotkey 
Loops 如何使用awk过滤目录中的多个文件？
loopsawk 
Loops navision-通过销售线中的行号循环
loops 
Loops 代码没有继续循环
loopspython-3.xindexing 
Loops 练习避免一个接一个的错误？
loopstesting 
Loops 水豚在匹配的元素上迭代并单击
loops 
Loops 平均填充数据帧列
loopspandas 
Loops 使用FPUT和for循环写入文件
loopsfor-loop 
Loops 创建循环基于列中的变量创建新的数据帧和csv文件
loops 
Loops 在循环过程中增加整数
loopselixir 
Loops JavaFXGridPane程序
loopsjavafxgrid 
Loops 在Google工作表中复制和粘贴移动范围
loopsgoogle-apps-script 
Loops 未从BizTalk业务流程中的内部循环调用Catch块
loopsexception


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Fonts
Core Data
Python 3.x
Combobox
Synchronization
Makefile
Programming Languages
Hibernate
Jekyll
Prestashop
Typo3
Migration
Grid
Reporting Services
Azure Service Fabric
Jhipster
Assembly
Common Lisp
Unit Testing
Hyperlink
Sqlalchemy
Vba
Email
Collections
Ibm Cloud
Mysql
Video Streaming
.htaccess
Mvvm
Zend Framework
Keras
Unix
Oauth 2.0
Sprite Kit
Opencl
Ruby
Jsp
Kubernetes
Apache Pig
Stanford Nlp
Nativescript
Image Processing
Npm
Cakephp
Webrtc
Coding Style
Google Analytics
Embedded
Compilation
Compiler Construction
Ms Office
Plone
Spring Batch
Elixir
Google Sheets
Osgi
Windows Installer
Netsuite
Sql Server 2012
Raspberry Pi
Sublimetext2
Events
Gps
Ibm Mq
Computer Science
Spring
Spring Integration
Aurelia
Ant
Prometheus
Yaml
Windows Phone 7
Sugarcrm
Xpath
Dependency Injection
Arduino
Encryption
Docusignapi
Fortran
Transactions
Shell
Snmp
Hbase
Gridview
Wolfram Mathematica
Tensorflow
Ios4
Stored Procedures
Variables
D
Time Complexity
Gstreamer
Amp Html
Salesforce
Ios6
Entity Framework
Less
Android Ndk
Datatables
Parallel Processing
Sitecore
Rabbitmq
Cassandra
Ffmpeg
Validation
Grafana
Colors
Couchbase
Sharepoint 2007
Gmail
Keycloak
Corda
Nestjs
Ethereum
Inno Setup
Big O
Qt4
Selenium
Antlr
Xml
C# 3.0
Pip
Mariadb
Iis 7
Jdbc
Linux
Dataframe
Wix
Twilio
Ember.js
Scripting
Twitter Bootstrap 3
Ruby On Rails 4
Netlogo
Ubuntu
Ipad
Methods
Web Applications
Gdb
Groovy
Asp.net
Functional Programming
Tabs
Powerbi
Github
Orientdb
Google Maps Api 3
Facebook Graph Api
Cryptography
Marklogic
User Interface
Glassfish
Proxy
Model
Sms
Umbraco
Qt
Telerik
Checkbox
Maps
Robotframework
Soap
Replace
Cocoa
Playframework
Asp.net Mvc
Csv
Nest
Actionscript
Odata
Iphone
Macos
Merge
Windows Runtime
Ocaml
Google Apps Script
Webview
Antlr4
Google Cloud Storage
Mobile
Firefox
Laravel 5
X86
Jqgrid
Uwp
Unicode
Phpmyadmin
Api
Cucumber
Sql
Openlayers
C
Reflection
Spring Cloud
Autohotkey
Android
Pointers
Angular
Css
Tree
Time


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网