Python 值在个人计算机上加载管道模型时出错_Python_Apache Spark_Pyspark

Python 值在个人计算机上加载管道模型时出错

python apache-spark pyspark

Python 值在个人计算机上加载管道模型时出错,python,apache-spark,pyspark,Python,Apache Spark,Pyspark,我的计算机上保存了一个PipelineModel，无法使用PipelineModel.load（path）加载它当我在Databricks集群中启动代码时，它就工作了path是保存在DBFS上的我的模型的路径，可通过装入点访问：path=“/DBFS/path/to/my/model 但是，在我的计算机上，调用PipelineModel.load（“C:\\Users\\path\\to\\my\\model”）会抛出ValueError（“RDD为空”）以下是模型在我的计算机上的保存方式：

我的计算机上保存了一个PipelineModel，无法使用

PipelineModel.load（path）

加载它

当我在Databricks集群中启动代码时，它就工作了

path

是保存在DBFS上的我的模型的路径，可通过装入点访问：

path=“/DBFS/path/to/my/model

但是，在我的计算机上，调用

PipelineModel.load（“C:\\Users\\path\\to\\my\\model”）

会抛出

ValueError（“RDD为空”）

以下是模型在我的计算机上的保存方式：

\---model
    +---metadata
    |       part-00000
    |       _SUCCESS
    |
    \---stages
        +---0_CountVectorizer_b92625354bf7
        |   +---data
        |   |       part-00000-tid-9156766819779394023-5cf6aecb-8959-48b3-be24-65bfa0543465-62-1-c000.snappy.parquet
        |   |       _committed_9156766819779394023
        |   |       _started_9156766819779394023
        |   |       _SUCCESS
        |   |
        |   \---metadata
        |           part-00000
        |           _SUCCESS
        |
        \---1_LinearSVC_108fa01daf43
            +---data
            |       part-00000-tid-4403060754466700849-27841dd9-de88-4015-9dfa-7854c2a15f15-65-1-c000.snappy.parquet
            |       _committed_4403060754466700849
            |       _started_4403060754466700849
            |       _SUCCESS
            |
            \---metadata
                    part-00000
                    _SUCCESS

（我刚从我的DataLake下载了模型到我的电脑上）

在本地运行代码时，如何加载此模型？

对于正在努力解决相同问题的其他人，请确保实际下载blob…我的代码中有一个输入错误，导致下载错误的blob，导致所有文件都为空。

我知道这个问题：但是我使用的是Windows个人计算机，不能/不可以“我不想使用HDF。你能试试

PipelineModel.load（“file///C:/path/to/model”）

？@SomeshwarKale:我也有同样的错误。为什么加载此路径会有不同的效果？