Apache spark Spark作业的指标仅显示基本的高级信息,Spark 1.3
我一直在寻找让Spark metrics按照下面的示例工作的方法 使用Spark 1.3拥有Cloudera CDH 5.4虚拟机 所以,在我开始一个有火花的工作后,我可以看到如下的东西Apache spark Spark作业的指标仅显示基本的高级信息,Spark 1.3,apache-spark,Apache Spark,我一直在寻找让Spark metrics按照下面的示例工作的方法 使用Spark 1.3拥有Cloudera CDH 5.4虚拟机 所以,在我开始一个有火花的工作后,我可以看到如下的东西 .../metrics/json/ {“版本”:“3.0.0”,“量规”:{“app-20151203090431-0003..BlockManager.disk.diskSpaceUsed_MB:{“值”:0},“app-20151203090431-0003..BlockManager.memory.m
.../metrics/json/
{“版本”:“3.0.0”,“量规”:{“app-20151203090431-0003..BlockManager.disk.diskSpaceUsed_MB:{“值”:0},“app-20151203090431-0003..BlockManager.memory.maxMem_MB:{“值”:2385},“app-20151203090431-0003..BlockManager.memory.memory.Memoused_MB:{“值”:0},“app-20151203090431-0003..BlockManager.memory.remainingMem MB:{“值”,“app-20151203090431-0003..DAGScheduler.job.activeJobs:{“值”:1},“app-20151203090431-0003..DAGScheduler.job.allJobs:{“值”:1},“app-20151203090431-0003..DAGScheduler.stage.failedStages:{“值”:0},“app-20151203090431-0003..DAGScheduler.stage.waitingStages:{“值”:”计数器“{}”,直方图“{}”,米“{}”,计时器“{}”
但我更感兴趣的是查看特定于工作的指标,这些URL都不会返回任何内容
.../metrics/master/json/
.../metrics/worker/json/
.../metrics/applications/json/
我知道Spark 1.4有一个包含更多信息的RESTFUL API。Spark 1.3用户是否仅限于提供最基本的信息
通过metrics/json/
提前感谢您的回答无论版本如何,
./metrics
端点只会公开对象中的值,这是一个内存中的全局度量集合,不是每个作业/阶段/任务收集的……因此没有API来获取每个实体的这些度量
版本1.4中添加的Servlet与这个度量Servlet(仍然是全局的)完全不同,但是您可以使用RESTFUL API找到所需的内容