Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/sharepoint/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/ruby-on-rails-3/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Pyspark 如何从模型中获取InputColumn名称?_Pyspark_Apache Spark Ml - Fatal编程技术网

Pyspark 如何从模型中获取InputColumn名称?

Pyspark 如何从模型中获取InputColumn名称?,pyspark,apache-spark-ml,Pyspark,Apache Spark Ml,例如,使用onehotcodermodel,但您可以使用pyspark.ml.feature包中的任何内容。使用onehotcoderestimator时,您可以选择设置inputCols。在face中,您必须在构造函数中使用输入和输出 从估计器创建相应的模型后,将无法再检索inputCols的值。没有像getInputCols()这样的方法可以从给定的模型中获得这些信息。如果使用getParam(“inputCols”)它只会给出Param描述,而不是它的值 如果查看序列化模型(元数据文件),

例如,使用
onehotcodermodel
,但您可以使用
pyspark.ml.feature
包中的任何内容。使用
onehotcoderestimator
时,您可以选择设置
inputCols
。在face中,您必须在构造函数中使用
输入
输出

从估计器创建相应的模型后,将无法再检索
inputCols
的值。没有像
getInputCols()
这样的方法可以从给定的模型中获得这些信息。如果使用
getParam(“inputCols”)
它只会给出
Param
描述,而不是它的值

如果查看序列化模型(元数据文件),则此参数(
inputCols
)的值实际上已写出。见下例:

{"class":"org.apache.spark.ml.feature.OneHotEncoderModel","timestamp":1548215172466,"sparkVersion":"2.4.0","uid":"OneHotEncoderEstimator_c5fcbebe4045","paramMap":{"inputCols":["workclass-tmp"],"outputCols":["workclass-encoded"]},"defaultParamMap":{"handleInvalid":"error","dropLast":true}}

不过,我正在寻找一种从API中获取该信息的方法。

更正我先前的回答:

正确的方法称为
getOrDefault
。例如:

model.getOrDefault("inputCols")

似乎有一种未经记录的方法可以获取这些值:

model._paramMap[model.inputCols]


更正我先前的回答:

正确的方法称为
getOrDefault
。例如:

model.getOrDefault("inputCols")

似乎有一种未经记录的方法可以获取这些值:

model._paramMap[model.inputCols]