Java Spark:如何保存多类度量混乱矩阵
org.apache.spark.mllib.evaluation.MulticlassMetrics在执行SVM分类时使用,如下所示Java Spark:如何保存多类度量混乱矩阵,java,apache-spark,Java,Apache Spark,org.apache.spark.mllib.evaluation.MulticlassMetrics在执行SVM分类时使用,如下所示 MulticlassMetrics metrics = new MulticlassMetrics(predictionAndLabels.rdd()); System.out.println(metics.confusionMatrix()); 我想在多分类中保留一些有用的矩阵,例如精度矩阵、回忆矩阵和混淆矩阵。有人知道怎么做吗?我可以把它们打印出来,但
MulticlassMetrics metrics = new MulticlassMetrics(predictionAndLabels.rdd());
System.out.println(metics.confusionMatrix());
我想在多分类中保留一些有用的矩阵,例如精度矩阵、回忆矩阵和混淆矩阵。有人知道怎么做吗?我可以把它们打印出来,但不知道如何将它们保存到spark中的文件中
版本:spark 1.3.0,java 1.7我发现org.apache.spark.mllib.evaluation.MulticlassMetrics类可以用于此目的
MulticlassMetrics metrics = new MulticlassMetrics(predictionAndLabels.rdd());
并将结果度量(精度、召回率和混淆矩阵)写入字符串RDD
JavaRDD<String> metricsResult = sc.parallelize(Arrays.asList(
"Precision: " + metrics.precision(),
"\nRecall: " +metrics.recall(),
"\nConfusion metrics: \n" + metrics.confusionMatrix()));
JavaRDD metricsResult=sc.parallelize(Arrays.asList(
“精度:”+metrics.Precision(),
“\n调用:”+metrics.recall(),
“\n融合度量:\n”+metrics.confusionMatrix());
保存ASTEXTFILE后,结果可能在不同的part*文件中,您可以使用cat或getmerge命令一次读取完整的片段
p、 不知何故,我发现精确性和召回率并没有达到预期效果,但混淆矩阵是正确的