Python 使用AWS EMR时，请提交如何使其接受带有空格的路径_Python_Amazon Web Services_Apache Spark_Amazon S3 - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/amazon-web-services/14.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 使用AWS EMR时，请提交如何使其接受带有空格的路径_Python_Amazon Web Services_Apache Spark_Amazon S3 - Fatal编程技术网

Python 使用AWS EMR时，请提交如何使其接受带有空格的路径

python amazon-web-services apache-spark amazon-s3

Python 使用AWS EMR时，请提交如何使其接受带有空格的路径,python,amazon-web-services,apache-spark,amazon-s3,Python,Amazon Web Services,Apache Spark,Amazon S3,我试图从AWS控制台使用路径中带有空格的EMR步骤，但由于某些原因，spark submit会做一些奇怪的事情，并且在引入空格时不起作用命令 spark-submit "s3://bucket/prefix with spaces/stepCode.py" spark-submit 's3://bucket/prefix with spaces/stepCode.py' spark-submit s3://bucket/prefix%with%spaces/stepCode.py 来自AWS

我试图从AWS控制台使用路径中带有空格的EMR步骤，但由于某些原因，spark submit会做一些奇怪的事情，并且在引入空格时不起作用

命令

spark-submit "s3://bucket/prefix with spaces/stepCode.py"
spark-submit 's3://bucket/prefix with spaces/stepCode.py'
spark-submit s3://bucket/prefix%with%spaces/stepCode.py

来自AWS的错误

python: can't open file '/mnt/var/lib/hadoop/steps/s-3XXXXXXXXXXXX/s3:/bucket/prefix with spaces/stepCode.py': [Errno 2] No such file or directory

然而，这是可行的

spark-submit s3://bucket/nospaces/stepCode.py

代码不知怎的被转储到下面

/mnt/tmp/spark-XXXXXX-XXXXXXXX-XXXXXXX-XXXXXXX/stepCode.py

你知道如何让spark接受一条有空格的路径吗？

谢谢

尝试用反斜杠\
转义
空格

spark-submit s3://bucket/prefix\ with\ spaces/stepCode.py

它不起作用。返回时出现错误“线程“main”org.apache.spark.sparkeexception:无法从JAR文件加载主类：/mnt/var/lib/hadoop/steps/s-xxxxxxxxxx/s3:/mybucket/prefix%5C”。这意味着文件已加载，但EMR找不到
主类
@lamanus，这听起来不正确，因为出现了错误。因为错误是file:/…/s-XX/s3:/。。。而不是文件：/…/s-XX/filename.py我认为这“可能”意味着该文件正在正确地将文件从s3复制到要运行的主核心，但它不是只将文件名传递给主核心，而是在告诉主核心实际运行复制的命令时传递整个路径。哦，我明白了。那么请试试s3a。今天有时间的时候我会测试一下。

[amazon web services]相关文章推荐

随机文章推荐

使用Bazel Build发送静态编译的特定编译标志 bazel

Bazel 如何从存储库规则调用持久工作程序？ bazel

Bazel中的全局标头暂存 bazel

Bazel运行传递主参数 bazel

Bazel 依赖项的依赖项必须在根工作区中声明？ bazel

Bazel rules_foreign_cc-在构建时使用从源代码构建的cmake二进制文件 bazel

Bazel构建文件内省 bazel

Bazel 将maven工件下载到存储库的推荐规则（maven\u安装vs jvm\u导入\u外部） bazel

如何从bazel命令行传递docker图像标记 bazel

为Bazel中的Git_存储库指定多个Git Remote bazel

如何从bazel查询并找出maven包的名称和版本？ bazel

[python]相关推荐

Python 自定义404模板上的额外变量
Python Django

Python 如何修剪文件-对于两列中具有相同值的行，仅保留另一列中具有最大值的行
Python Perl Unix Awk

Google应用程序引擎Python-使用数据存储
Python Google App Engine

Python 不使用排序函数查找中值
Python

python选择未被SIGCHLD中断
Python Select

Python：我想要两个，而循环生成两个
Python

Python UI类继承，super（）无法正常工作
Python

Python 如何在虚拟环境中使用源代码安装Django？
Python Django

Python 随着时间的推移，是否可能获得alexa信息或谷歌页面排名？
Python Google Api

python:删除列表中的多个项
Python List

当整个包已经导入时，为什么要在Python中导入特定的子包？
Python

访问Python元组中的值范围
Python

Python 如何使用matploatlib绘制多个散点图
Python Numpy Pandas Matplotlib

Python pytest不能与PySide一起工作
Python

Python Matplotlib使用更改的公式绘制图形
Python Matplotlib Plot

Python 张量流代价函数
Python Tensorflow Deep Learning

Python 使用有限的资源（RAM）创建大型数据帧
Python Pandas Dataframe

Python 针对anaconda的“conda列表”中的环境多次列出的包
Python Pip Anaconda

Python在函数之间传递变量
Python

Python 带有正则表达式的过滤器元素，仅当它们位于特定块中时
Python Regex String

未写入文本文件，python3
Python Python 3.x

Python 输入、输出和保存中没有空格
Python

在python中从用户给定的列表中查找平均值
Python

Python 用x表示x的多变量
Python Python 2.7

Python 如何删除文件夹中除一个或两个要保留的文件夹外的所有内容？
Python

Python 将字符串拆分为两个单独的列
Python Pandas Dataframe

Python 循环并检查刷新时间是否已到。。线程是解决这个问题的方法吗？
Python Multithreading Web Scraping

Python 有什么方法可以通过列表理解做到这一点吗？
Python List

Python 将两个excel文件与一些参数合并
Python Excel Pandas Merge

Python 通过“按钮”从Bokeh服务器下载excel文件
Python

Tags

Service Notifications Mapreduce Raspberry Pi Class Ag Grid Webrtc Ocaml Pyspark Eclipse Rcp Scheme Uml Cucumber Network Programming Soap Deep Learning Exception Handling Go Internet Explorer 8 Windows Phone Nuget Windows Phone 7 Sharepoint Memory Leaks Embedded File Rdf Deployment Biztalk F# Pytorch Editor Codenameone Openshift Corda Google Cloud Dataflow Amp Html Terminal Asp.net Mvc 4 Kotlin Image Gitlab Vue.js Utf 8 Opencart Django Qt4 Blackberry Svg Three.js List Core Data Database Design Opencv Postgresql Jquery Ui Dependency Injection Ipython Wcf Asp.net Mvc Rx Java Google Chrome Devtools Google Analytics Uitableview Intellij Idea Cocos2d X Racket Google App Maker Computer Vision Api Bots Validation Sbt Php Scikit Learn Redis C# 4.0 Selenium Octave Karate Phantomjs Video Streaming Directory Entity Framework 4 Stream Apache Flink Entity Framework Core Browser Asp.net Mvc 3 Appium Logging C# Mobile Android Emulator Navigation Salesforce Hybris Crystal Reports Filter Networking Ftp Mono Sapui5 Windows Store Apps Machine Learning Razor Windows Udp Interface Google Sheets Amazon Dynamodb Unix Variables Mvvm Windows Services Dll Jetty Stata Scala Liferay Jaxb Datatables Google Apps Script Ruby On Rails 3.1 Parse Platform Hibernate Stored Procedures Coq Stanford Nlp Google Api Routing Single Sign On Web Gis Less Antlr Module Cloud Foundry Quickbooks Twilio Nginx Angular Material Express String Flask Logic Spring Cloud Android Ndk Curl Woocommerce Sap Gwt Android Fragments Dynamic Asp Classic Tomcat Laravel 5 D Jenkins Ada Sugarcrm Winforms Cakephp Asynchronous Wso2 Xamarin.android Linux Charts Ssis Tcl Functional Programming Design Patterns Debian Javascript .htaccess Matrix Kentico Calendar Parallel Processing Electron Playframework Memory Meteor Moodle Titanium Zend Framework Vhdl Azure Data Factory Webview Macos Akka Ms Access Gtk Join Ionic2 Azure Functions Http Vmware Junit Dictionary Jestjs

Copyright © 2024. All Rights Reserved by - Fatal编程技术网