Apache spark 在Pypark Logistic回归输出中,哪个概率属于哪一类?

Apache spark 在Pypark Logistic回归输出中,哪个概率属于哪一类?,apache-spark,pyspark,logistic-regression,Apache Spark,Pyspark,Logistic Regression,我的代码如下: from pyspark.ml.classification import LogisticRegression lr = LogisticRegression(featuresCol="features", labelCol="label") lrm = lr.fit(transformed) predictions = lrm.transform(transformed) predictions.select('probability') 这给了我2个概率,因为我有2个类。

我的代码如下:

from pyspark.ml.classification import LogisticRegression
lr = LogisticRegression(featuresCol="features", labelCol="label")
lrm = lr.fit(transformed)
predictions = lrm.transform(transformed)
predictions.select('probability')
这给了我2个概率,因为我有2个类。
但我不知道哪个概率属于哪个类。如何找到它。谢谢

spark预测了一个基于p>0.5的课程。因此,从预测数据帧中选择概率和预测列。检查dataframe的第一行,查看哪个元素的值高于0.5,并查看预测类。例如,元素1的值为0.56,预测值为2类。然后,概率的第0个元素属于1类概率,第1个元素属于2类。

在我的输出中,对于所有记录/行,无论预测的类别如何,概率的第1个元素始终高于第0个元素。这是否意味着第一个元素总是预测类的概率?