Apache spark SPARK LR binaryclass,我无法区分整体精度和精度BYBells之间的精度

Apache spark SPARK LR binaryclass,我无法区分整体精度和精度BYBells之间的精度,apache-spark,linear-regression,precision-recall,Apache Spark,Linear Regression,Precision Recall,我有一个LR模型,并在testData上测试它。现在我应该计算结果的精度 我可以得到准确度: val precision = metrics.precision precision: Double = 0.9801503759398497 而且 // Precision by labels Precision(0.0) = 0.9979625101874491 Precision(1.0) = 0.9299655568312285 从spark MLLIB中,第一个精度定义为总体

我有一个LR模型,并在testData上测试它。现在我应该计算结果的精度

我可以得到准确度:

 val precision = metrics.precision 
 precision: Double = 0.9801503759398497
而且

 // Precision by labels
 Precision(0.0) = 0.9979625101874491
 Precision(1.0) = 0.9299655568312285
从spark MLLIB中,第一个精度定义为总体统计数据


但这也让人困惑,精度和标签精度之间的区别是什么?(精度定义为真实预测率)。

对于向量数据,您正在处理值的向量,因此您可能不仅要在正确/错误地预测整个向量时计算精度,还要对向量的每个分量(标签)计算精度

从:

总精度测量所有标签的精度-标签数量 任何类别被正确预测的次数(真阳性)由 数据点的数量。“标签精度”只考虑一个 类,并测量预测特定标签的时间 按标签在列表中出现的次数正确规格化 输出