Pyspark 如何从模型中获取InputColumn名称?
例如,使用Pyspark 如何从模型中获取InputColumn名称?,pyspark,apache-spark-ml,Pyspark,Apache Spark Ml,例如,使用onehotcodermodel,但您可以使用pyspark.ml.feature包中的任何内容。使用onehotcoderestimator时,您可以选择设置inputCols。在face中,您必须在构造函数中使用输入和输出 从估计器创建相应的模型后,将无法再检索inputCols的值。没有像getInputCols()这样的方法可以从给定的模型中获得这些信息。如果使用getParam(“inputCols”)它只会给出Param描述,而不是它的值 如果查看序列化模型(元数据文件),
onehotcodermodel
,但您可以使用pyspark.ml.feature
包中的任何内容。使用onehotcoderestimator
时,您可以选择设置inputCols
。在face中,您必须在构造函数中使用输入
和输出
从估计器创建相应的模型后,将无法再检索inputCols
的值。没有像getInputCols()
这样的方法可以从给定的模型中获得这些信息。如果使用getParam(“inputCols”)
它只会给出Param
描述,而不是它的值
如果查看序列化模型(元数据文件),则此参数(inputCols
)的值实际上已写出。见下例:
{"class":"org.apache.spark.ml.feature.OneHotEncoderModel","timestamp":1548215172466,"sparkVersion":"2.4.0","uid":"OneHotEncoderEstimator_c5fcbebe4045","paramMap":{"inputCols":["workclass-tmp"],"outputCols":["workclass-encoded"]},"defaultParamMap":{"handleInvalid":"error","dropLast":true}}
不过,我正在寻找一种从API中获取该信息的方法。更正我先前的回答: 正确的方法称为
getOrDefault
。例如:
model.getOrDefault("inputCols")
似乎有一种未经记录的方法可以获取这些值:
model._paramMap[model.inputCols]
或
更正我先前的回答: 正确的方法称为
getOrDefault
。例如:
model.getOrDefault("inputCols")
似乎有一种未经记录的方法可以获取这些值:
model._paramMap[model.inputCols]
或