Python 值在个人计算机上加载管道模型时出错
我的计算机上保存了一个PipelineModel,无法使用Python 值在个人计算机上加载管道模型时出错,python,apache-spark,pyspark,Python,Apache Spark,Pyspark,我的计算机上保存了一个PipelineModel,无法使用PipelineModel.load(path)加载它 当我在Databricks集群中启动代码时,它就工作了path是保存在DBFS上的我的模型的路径,可通过装入点访问:path=“/DBFS/path/to/my/model 但是,在我的计算机上,调用PipelineModel.load(“C:\\Users\\path\\to\\my\\model”)会抛出ValueError(“RDD为空”) 以下是模型在我的计算机上的保存方式:
PipelineModel.load(path)
加载它
当我在Databricks集群中启动代码时,它就工作了path
是保存在DBFS上的我的模型的路径,可通过装入点访问:path=“/DBFS/path/to/my/model
但是,在我的计算机上,调用PipelineModel.load(“C:\\Users\\path\\to\\my\\model”)
会抛出ValueError(“RDD为空”)
以下是模型在我的计算机上的保存方式:
\---model
+---metadata
| part-00000
| _SUCCESS
|
\---stages
+---0_CountVectorizer_b92625354bf7
| +---data
| | part-00000-tid-9156766819779394023-5cf6aecb-8959-48b3-be24-65bfa0543465-62-1-c000.snappy.parquet
| | _committed_9156766819779394023
| | _started_9156766819779394023
| | _SUCCESS
| |
| \---metadata
| part-00000
| _SUCCESS
|
\---1_LinearSVC_108fa01daf43
+---data
| part-00000-tid-4403060754466700849-27841dd9-de88-4015-9dfa-7854c2a15f15-65-1-c000.snappy.parquet
| _committed_4403060754466700849
| _started_4403060754466700849
| _SUCCESS
|
\---metadata
part-00000
_SUCCESS
(我刚从我的DataLake下载了模型到我的电脑上)
在本地运行代码时,如何加载此模型?对于正在努力解决相同问题的其他人,请确保实际下载blob…我的代码中有一个输入错误,导致下载错误的blob,导致所有文件都为空。我知道这个问题:但是我使用的是Windows个人计算机,不能/不可以“我不想使用HDF。你能试试
PipelineModel.load(“file///C:/path/to/model”)
?@SomeshwarKale:我也有同样的错误。为什么加载此路径会有不同的效果?