Maven 如何在GCP中向dataproc集群添加jar依赖项？_Maven_Google Cloud Platform_Pyspark_Google Cloud Dataproc - Fatal编程技术网

Maven 如何在GCP中向dataproc集群添加jar依赖项？

maven google-cloud-platform pyspark

Maven 如何在GCP中向dataproc集群添加jar依赖项？,maven,google-cloud-platform,pyspark,google-cloud-dataproc,Maven,Google Cloud Platform,Pyspark,Google Cloud Dataproc,特别是，如何添加spark bigquery连接器，以便从dataproc的Jupyter web界面中查询数据关键环节： - 目标：要能够运行以下内容： s = spark.read.bigquery("transactions") s = (s .where("quantity" >= 0) .groupBy(f.col('date')) .agg({'sales_amt':'sum'}) ) df = s.toPandas() 基本上有两种

特别是，如何添加spark bigquery连接器，以便从dataproc的Jupyter web界面中查询数据

关键环节： -

目标：要能够运行以下内容：

s = spark.read.bigquery("transactions")

s = (s
    .where("quantity" >= 0)
    .groupBy(f.col('date'))
    .agg({'sales_amt':'sum'})
     )

df = s.toPandas()

基本上有两种方法可以实现您的目标：

1在群集创建时：您必须创建一个初始化脚本（param
--初始化操作
）来安装依赖项。
2在群集创建时：您可以指定创建集群时要使用的自定义映像。
3作业运行时的：使用
--jars
参数运行作业时，可以传递其他jar文件：
如果要运行一个简单的.jar依赖项，如scoop.jar，我建议使用（3）
我建议（1）如果在运行作业之前要安装很多软件包。它给你更多的控制

选项（2）肯定会给你完全的控制权，但你必须自己维护映像（应用补丁、升级等），所以除非你真的需要，我不推荐。
我认为你可以编写一个初始化操作将jar下载到/usr/lib/spark/jars中。

[google cloud platform]相关文章推荐

Google cloud platform 如何使用存储传输服务跨不同项目中的存储桶复制数据？ google-cloud-platform google-cloud-storage

Google cloud platform 尝试使用gcloud cli创建sql用户时使用HTTP 403 google-cloud-platform

Google cloud platform 大表检查和变异原子性 google-cloud-platform

Google cloud platform DLP API的不同结果取决于输入是全部在一个字符串中还是作为子字符串的集合发送 google-cloud-platform

Google cloud platform gcloud上vCPU的RAM google-cloud-platform

Google cloud platform 谷歌云平台VPS防火墙规则 google-cloud-platform

Google cloud platform 共享VPC-仅将特定子网共享到项目 google-cloud-platform

Google cloud platform 我可以限制一些谷歌云身份用户访问谷歌网站吗？ google-cloud-platform

Google cloud platform 将spark-r作业添加到dataproc工作流模板 google-cloud-platform workflow

Google cloud platform 如何通过运算符传递动态参数？ google-cloud-platform airflow

Google cloud platform 是否使用gsutil仅上载html文件？ google-cloud-platform google-cloud-storage

Google cloud platform 谷歌云中的网络出口解释？ google-cloud-platform google-compute-engine

Google cloud platform 基于云函数定制模型的Google AutoML视频分类批量预测 google-cloud-platform

Google cloud platform GCP-服务帐户密钥-JSON下载失败 google-cloud-platform

Google cloud platform GCP元数据OSCONFIG:TRUE导致未找到yum check update失败repo google-cloud-platform google-compute-engine

Google cloud platform 谷歌语音到文本可以脱机使用吗？ google-cloud-platform speech-recognition

Google cloud platform gcloud函数部署：未能初始化区域 google-cloud-platform google-cloud-firestore

Google cloud platform 如何处理依赖于其他模块的地形模块 google-cloud-platform terraform

Google cloud platform Google API网关抛出400，带有下划线的标题的错误请求错误 google-cloud-platform

Google cloud platform 当用户从应用程序访问控制获得批准时，Google API OAuth google-cloud-platform

随机文章推荐

Playframework ：jsRoute标记未找到 playframework

Playframework 使用play发送电子邮件时出现异常 playframework

Playframework 如何使用作业异步地使用Play Framework PDF模块呈现PDF？ playframework

Playframework 分组形式错误！框架 playframework

Playframework 应用程序'；无法连接到数据库'；例外 playframework

Playframework 在功能测试中调用另一个中的控制器方法行为怪异 playframework

Playframework 如何更新Play framework 2和ebean中的多对多关系？ playframework playframework-2.0

Playframework 在我的Play 2.1.1项目中.target目录来自哪里？ playframework sbt

Playframework 游戏框架中的希伯来语角色未显示 playframework

Playframework 如何自定义play framework 1.2.x中404和500页的页面未找到错误和内部错误 playframework

Playframework 多个记录器，在logback中的每个记录器都有特定的附加器 playframework

Playframework 播放框架配置参数 playframework

Playframework Play Framework 2.2.1规范2：排除集成测试 playframework

Playframework 声纳跑步者不'；不要索引任何文件 playframework sbt sonarqube

在playframework中使用localhost/login登录时出现securesocial错误 playframework

PlayFramework 2.3发布失败 playframework

Playframework sbt web-每次执行2次源文件任务 playframework sbt

Playframework Play 2.4 JPA/Hibernate EntityManager不刷新数据库 playframework

Playframework Play Framework/ebeans上的聚合功能 playframework

Playframework Play Framework Mailer进程无法连接到GMail帐户 playframework smtp gmail

[maven]相关推荐

Maven 竹纤维集料性能
Maven Jmeter

指导Maven使用常春藤和x27；生成的类路径
Maven

如何在Maven中定义一种新的范围？
Maven

Maven本地存储库
Maven

在maven pom.xml中为用户和开发人员提供特定的访问权限
Maven

Maven 通过在Intellij Idea中单击，根据另一个WEB应用程序运行WEB应用程序
Maven Web Applications Intellij Idea

需要在Clojure中使用本地maven存储库的java类和命名空间组织
Maven Clojure Dependencies

Maven 使用CVS从已发布的版本发布
Maven

通过Jenkins和Maven获得唯一的版本号
Maven Groovy Jenkins Continuous Integration

如何使maven enforcer插件在指定阶段运行？
Maven

Maven 无法解析amazon aws工件
Maven Amazon Web Services Amazon S3

Maven 在使用tomcat7:run时，我如何说服com.sun.faces扫描我的target/classes目录中的@ManagedBeans？
Maven Jsf Jsf 2

Maven 访问放置在依赖插件中的jar中的类
Maven Eclipse Plugin

如何将最新hibernate和spring的maven依赖项添加到pom.xml文件中？
Maven Dependencies

Maven hamcrest父依赖关系解析失败
Maven

是否可以使用Maven 1部署到Nexus存储库？
Maven

Maven 多个SLF4J弹簧启动错误
Maven Log4j Spring Boot Jhipster

Maven GA发布工件akka http&；akka streams 1.0？
Maven Akka

Maven:$HOME/.m2/存储库纯粹是一个缓存吗？
Maven

将JDeveloper项目转换为Maven
Maven

未找到前缀为'；http'；在当前项目和插件组中[org.apache.maven.plugins，org.codehaus.mojo]
Maven Selenium Webdriver

messageExchange.getTimestamp（）maven覆盖值
Maven Groovy

如何在maven中只包含测试构建的插件？
Maven Testing

Maven Jenkins文件和POM版本
Maven Jenkins

Maven 为什么我不能从Archiva下载工件？理由短语：未经授权
Maven

Maven IntelliJ找不到pom.xml文件
Maven Intellij Idea

Maven jacoco排除了可能由于uber jar而无法工作的情况
Maven

使用高级降价生成Maven站点？
Maven Markdown

从NETBEANS中的maven输出中删除NETBEANS ExecEvent行
Maven Netbeans

Maven 空手道是否支持-Dsurefire.reRunningTestScont在Jenkins中重新运行失败的测试
Maven Testing Karate

Tags

Next.js Clojure Activemq Amazon Redshift Nhibernate Computer Science Ios8 Character Encoding Shiny Blockchain Asp.net Silverlight Coffeescript Sitecore Apache Camel Usb Replace Asp.net Core Design Patterns Omnet++ Random Sip Spotify Rspec Fluent Nhibernate Glsl Go Maps Cobol Google Chrome Devtools Jdbc Opengl Swagger Corda Octave Stripe Payments Pyspark C# 3.0 Windows 10 Jboss Magento Entity Framework 4 Sql Server 2008 Properties Path Ubuntu Yaml Sqlite Identityserver4 Processing Akka Discord.js Prolog View Snmp Material Ui Java Me Rest Virtualbox Azure Sql Database Url Jenkins Socket.io Instagram Gnuplot Android Fragments Dask Python 2.7 Scripting Delphi Menu Webrtc Gwt Oauth Jquery Sapui5 Ssas Content Management System Azure Cosmosdb Inheritance Drools Rdf Architecture Visual Studio 2012 Kdb Plot Npm Yii Dynamic Syntax Stream Openshift Spring Batch Windows Phone 7 Perforce Ms Word Netbeans C# Kernel Streaming Internationalization Google Cloud Storage Visual Studio 2008 C++ Cli Combobox Openlayers 3 Markdown Jupyter Notebook Interface Amazon Ec2 Clearcase Curl Hbase Frameworks Erlang Msbuild Charts Botframework Ignite Assembly Exception Handling Date Numpy Reactjs Pagination Filter Adobe Nest Python Sphinx Function Xsd Tkinter Jmeter Windows Coq Tinymce Ember.js Cryptography Bluetooth Caching Flutter Ms Access Azure Functions Openssl Backbone.js Visual Studio Python Scala Racket Installation Sas Nativescript Jar Select Automated Tests Directx Nosql Airflow Webgl Sql Passwords Install4j Arm File Tridion Zend Framework Authentication Plone Continuous Integration Jakarta Ee Mysql Windows Store Apps Rx Java Lambda Printing Stanford Nlp Google Visualization Windows Phone Memory Management Log4j Netty Types Eclipse Rcp Colors Asp.net Mvc 4 Layout Wicket Gatsby Batch File Powershell Windbg Safari Vhdl Telerik Office365 Database Design Version Control Antlr4 Apache Storm Proxy Extjs

Copyright © 2024. All Rights Reserved by - Fatal编程技术网