Java Spark：如何保存多类度量混乱矩阵_Java_Apache Spark

Java Spark：如何保存多类度量混乱矩阵

java apache-spark

Java Spark：如何保存多类度量混乱矩阵,java,apache-spark,Java,Apache Spark,org.apache.spark.mllib.evaluation.MulticlassMetrics在执行SVM分类时使用，如下所示 MulticlassMetrics metrics = new MulticlassMetrics(predictionAndLabels.rdd()); System.out.println(metics.confusionMatrix()); 我想在多分类中保留一些有用的矩阵，例如精度矩阵、回忆矩阵和混淆矩阵。有人知道怎么做吗？我可以把它们打印出来，但

org.apache.spark.mllib.evaluation.MulticlassMetrics在执行SVM分类时使用，如下所示

 MulticlassMetrics metrics = new MulticlassMetrics(predictionAndLabels.rdd());
 System.out.println(metics.confusionMatrix());

我想在多分类中保留一些有用的矩阵，例如精度矩阵、回忆矩阵和混淆矩阵。有人知道怎么做吗？我可以把它们打印出来，但不知道如何将它们保存到spark中的文件中

版本：spark 1.3.0，java 1.7

我发现org.apache.spark.mllib.evaluation.MulticlassMetrics类可以用于此目的

 MulticlassMetrics metrics = new MulticlassMetrics(predictionAndLabels.rdd());

并将结果度量（精度、召回率和混淆矩阵）写入字符串RDD

 JavaRDD<String> metricsResult = sc.parallelize(Arrays.asList(
       "Precision: " + metrics.precision(), 
       "\nRecall: " +metrics.recall(), 
       "\nConfusion metrics: \n" + metrics.confusionMatrix()));

JavaRDD metricsResult=sc.parallelize（Arrays.asList(
“精度：”+metrics.Precision（），
“\n调用：”+metrics.recall（），
“\n融合度量：\n”+metrics.confusionMatrix（））；

保存ASTEXTFILE后，结果可能在不同的part*文件中，您可以使用cat或getmerge命令一次读取完整的片段

p、不知何故，我发现精确性和召回率并没有达到预期效果，但混淆矩阵是正确的