Google cloud platform 如何在gcp集群中运行pyspark ml代码?

Google cloud platform 如何在gcp集群中运行pyspark ml代码?,google-cloud-platform,pyspark,cluster-computing,Google Cloud Platform,Pyspark,Cluster Computing,我想在GoogleGloud集群中运行一个pyspark ml项目(增强树),以与scikit学习相同模型的精度和速度进行比较。我的代码已经准备好了,但我不知道如何在集群中运行它。谢谢 您首先需要的是Dataproc集群。创建集群后,您可以使用官方文档中列出的任何选项。但我会建议下面两个选项中的一个 使用gcloud dataproc jobs submit pyspark。详见 通过Dataproc控制台提交作业。一个详细的例子是 您首先需要的是Dataproc集群。创建集群后,您可以使用官方

我想在GoogleGloud集群中运行一个pyspark ml项目(增强树),以与scikit学习相同模型的精度和速度进行比较。我的代码已经准备好了,但我不知道如何在集群中运行它。谢谢

您首先需要的是Dataproc集群。创建集群后,您可以使用官方文档中列出的任何选项。但我会建议下面两个选项中的一个

  • 使用
    gcloud dataproc jobs submit pyspark
    。详见
  • 通过Dataproc控制台提交作业。一个详细的例子是

  • 您首先需要的是Dataproc集群。创建集群后,您可以使用官方文档中列出的任何选项。但我会建议下面两个选项中的一个

  • 使用
    gcloud dataproc jobs submit pyspark
    。详见
  • 通过Dataproc控制台提交作业。一个详细的例子是

  • 到目前为止你做了什么?您是否在本地环境中运行代码?到目前为止您做了什么?您是否在本地环境中运行代码?