为Spark集群上的jupyter笔记本指定python文件_Python_Apache Spark_Pyspark_Jupyter Notebook - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/313.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
为Spark集群上的jupyter笔记本指定python文件_Python_Apache Spark_Pyspark_Jupyter Notebook - Fatal编程技术网

为Spark集群上的jupyter笔记本指定python文件

python apache-spark pyspark jupyter-notebook

为Spark集群上的jupyter笔记本指定python文件,python,apache-spark,pyspark,jupyter-notebook,Python,Apache Spark,Pyspark,Jupyter Notebook,我正在星火簇上运行一个jupyter笔记本（带纱线）。我正在使用“findspark”包来设置笔记本，它工作得非常好（我通过SSH隧道连接到集群主机）。当我写一个“自给自足”的笔记本时，它工作得非常完美，例如，以下代码运行时没有问题： import findspark findspark.init() import pyspark sc = pyspark.SparkContext(appName='myApp') a = sc.range(1000,numSlices=10) a.tak

我正在星火簇上运行一个jupyter笔记本（带纱线）。我正在使用“findspark”包来设置笔记本，它工作得非常好（我通过SSH隧道连接到集群主机）。当我写一个“自给自足”的笔记本时，它工作得非常完美，例如，以下代码运行时没有问题：

import findspark
findspark.init()

import pyspark

sc = pyspark.SparkContext(appName='myApp')
a = sc.range(1000,numSlices=10)
a.take(10)
sc.stop()

火花工作完全分配给了工人们。但是，当我想使用我编写的python包时，worker上缺少文件
当我不使用Jupyter笔记本电脑时，当我使用spark submit--master Thread--py files myPackageSrcFiles.zip时，我的spark作业工作正常，例如，以下代码正确运行：
main.py

import pyspark from myPackage import myFunc sc = pyspark.SparkContext(appName='myApp') a = sc.range(1000,numSlices=10) b = a.map(lambda x: myFunc(x)) b.take(10) sc.stop()
然后
问题是：如何从jupyter笔记本运行main.py？我尝试在SparkContext中使用pyfiles关键字指定.zip包，但出现错误
我尝试在SparkContext中使用pyfiles关键字指定.zip包，但出现了一个错误
情况是：

sc = pyspark.SparkContext(appName='myApp', pyFiles=["myPackageSrcFiles.zip"])
或者您可以
addPyFile

sc.addPyFile("myPackageSrcFiles.zip")

sc.addPyFile("myPackageSrcFiles.zip")

[apache spark]相关文章推荐

随机文章推荐

Angular Can'；无法从角度2的服务中获取数据 angular

如何确定Angular 2中组件之间通信的最佳方式？ angular

Angular Ionic2 RC0加载外部模块时出错 angular ionic2

Angular 2@types/jquery编译时出错 angular

Angular 角4根模'；导入&x27；和'；进口'； angular typescript

在dotnet core 2.0 SPA模板中向Angular 4添加测试覆盖率报告 angular typescript .net-core

Angular IONAL 2 POST请求返回422（不可处理实体） angular typescript ionic2

如何在angular 2中的新选项卡中打开路由url？ angular

Angular 角材料的单独模块 angular

为什么我的数据表没有在angular中使用*ngFor填充？ angular typescript

angular firebase获取当前用户帖子 angular typescript firebase

Angular 你似乎并不依赖于@角度/核心“；和/或；rxjs"；。这是一个错误 angular

Angular *ngIf正在添加元素，而不是替换它们 angular angular6

如何在angular4中隐藏Html表 angular

Angular Typescript：如何从类型中的泛型类获取私有属性？ angular typescript

Angular 使用javascript在可排序的mat表格标题中切换ngb工具提示 angular typescript

Angular 如何从Ngonit中的服务获取数据 angular ionic-framework service

Angular 在**build--prod时延迟加载不起作用** angular

Angular 角垫按钮样式不适用于“垫”对话框 angular angular-material

Angular 如何使用*ngFor仅显示最后5条消息 angular typescript angular6

[python]相关推荐

Tags

Lucene Arm Jenkins Log4j Charts Rspec Variables Jasmine Asp.net Mvc Firefox Web Crawler Ionic Framework Coq Algorithm C++11 Visual Studio 2012 Silverlight Rabbitmq Cassandra Url Rewriting Timer Sbt Ios6 Actionscript 3 Shiny Api Selenium Webdriver Scikit Learn Excel Formula X86 3d Java 8 Postgresql Proxy Puppet Xcode Rss Google Chrome Extension Cucumber Teamcity Woocommerce Signalr Compression Deep Learning Networking Scripting Command Line Entity Framework Vaadin Zsh Google Cloud Dataflow Antlr Office365 Maven Processing Google Visualization Drupal Azure Asp.net Mvc 3 Debian Web Services Powershell Events Qt Azure Functions Visual Studio 2017 Dart Flask Node.js Highcharts Google App Maker Sphinx Automation Wicket Angular Material Dictionary .net System Verilog Matlab Scrapy Http Computer Science Html Perforce Firefox Addon Nuget Apache Kafka Migration Perl Web Applications Windows Workflow Ipython Grid Opengl Es Reference Optimization Fortran Common Lisp Ruby Text Biztalk Ibm Midrange Express Methods Xna Virtual Machine Batch File Sql Server 2012 Browser Deployment Swiftui Servlets Adobe Windows 7 Apache Zookeeper Talend Keyboard Spring Colors Rally Keras Machine Learning Akka Doctrine Orm Rxjs Smalltalk Javafx 2 Knockout.js Datatables Sublimetext2 F# Ipad Laravel 4 Asynchronous Osgi Compiler Errors Localization Discord.py Jekyll Cron Gitlab Airflow Jquery Ui Cakephp Abap Configuration Memory Management Llvm Applescript Dialogflow Es Neural Network Cookies Wcf Stata Core Data Stripe Payments Vb6 Vmware Prometheus Facebook Graph Api Visual Studio Jhipster Object Blockchain Objective C Lambda Xpages Apache Camel Pentaho Indexing Math Sed Mapping Jboss Paypal Ldap Filter Enums Elixir Openstack Twitter Bootstrap 3 Linkedin Gulp Model View Controller Combobox Reflection Performance Lotus Notes Parse Platform Process Forms Ajax Azure Service Fabric Qt4 Actionscript Computer Vision Installation Properties Amazon Web Services Logging

Copyright © 2024. All Rights Reserved by - Fatal编程技术网