Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 值在个人计算机上加载管道模型时出错_Python_Apache Spark_Pyspark - Fatal编程技术网

Python 值在个人计算机上加载管道模型时出错

Python 值在个人计算机上加载管道模型时出错,python,apache-spark,pyspark,Python,Apache Spark,Pyspark,我的计算机上保存了一个PipelineModel,无法使用PipelineModel.load(path)加载它 当我在Databricks集群中启动代码时,它就工作了path是保存在DBFS上的我的模型的路径,可通过装入点访问:path=“/DBFS/path/to/my/model 但是,在我的计算机上,调用PipelineModel.load(“C:\\Users\\path\\to\\my\\model”)会抛出ValueError(“RDD为空”) 以下是模型在我的计算机上的保存方式:

我的计算机上保存了一个PipelineModel,无法使用
PipelineModel.load(path)
加载它

当我在Databricks集群中启动代码时,它就工作了
path
是保存在DBFS上的我的模型的路径,可通过装入点访问:
path=“/DBFS/path/to/my/model

但是,在我的计算机上,调用
PipelineModel.load(“C:\\Users\\path\\to\\my\\model”)
会抛出
ValueError(“RDD为空”)

以下是模型在我的计算机上的保存方式:

\---model
    +---metadata
    |       part-00000
    |       _SUCCESS
    |
    \---stages
        +---0_CountVectorizer_b92625354bf7
        |   +---data
        |   |       part-00000-tid-9156766819779394023-5cf6aecb-8959-48b3-be24-65bfa0543465-62-1-c000.snappy.parquet
        |   |       _committed_9156766819779394023
        |   |       _started_9156766819779394023
        |   |       _SUCCESS
        |   |
        |   \---metadata
        |           part-00000
        |           _SUCCESS
        |
        \---1_LinearSVC_108fa01daf43
            +---data
            |       part-00000-tid-4403060754466700849-27841dd9-de88-4015-9dfa-7854c2a15f15-65-1-c000.snappy.parquet
            |       _committed_4403060754466700849
            |       _started_4403060754466700849
            |       _SUCCESS
            |
            \---metadata
                    part-00000
                    _SUCCESS

(我刚从我的DataLake下载了模型到我的电脑上)


在本地运行代码时,如何加载此模型?

对于正在努力解决相同问题的其他人,请确保实际下载blob…我的代码中有一个输入错误,导致下载错误的blob,导致所有文件都为空。

我知道这个问题:但是我使用的是Windows个人计算机,不能/不可以“我不想使用HDF。你能试试
PipelineModel.load(“file///C:/path/to/model”)
?@SomeshwarKale:我也有同样的错误。为什么加载此路径会有不同的效果?