Python Spark(pyspark)中的决策树模型如何可视化?

Python Spark(pyspark)中的决策树模型如何可视化?,python,apache-spark,pyspark,decision-tree,dtreeviz,Python,Apache Spark,Pyspark,Decision Tree,Dtreeviz,我试图在pyspark中可视化决策树结构。但所有的工具都是用于数据的。我找不到任何可视化树结构的方法。或者有没有一种方法可以使用到debugstring的规则进行可视化?为了创建可视化,我尝试了以下操作: 将Spark决策树输出解析为JSON格式 使用JSON文件作为D3.js可视化的输入 有关更多代码,您可以参考我在GitHub的原型。我也是一名bigdata/ml工程师,我有很多时间需要可视化Spark的决策树 我们刚刚发布了1.1,其中包括对Spark的支持。 现在,您可以可视化树结构、叶

我试图在pyspark中可视化决策树结构。但所有的工具都是用于数据的。我找不到任何可视化树结构的方法。或者有没有一种方法可以使用
到debugstring
的规则进行可视化?

为了创建可视化,我尝试了以下操作:

  • 将Spark决策树输出解析为
    JSON
    格式
  • 使用
    JSON
    文件作为
    D3.js
    可视化的输入

  • 有关更多代码,您可以参考我在GitHub的原型。

    我也是一名bigdata/ml工程师,我有很多时间需要可视化Spark的决策树

    我们刚刚发布了1.1,其中包括对Spark的支持。 现在,您可以可视化树结构、叶信息、预测路径等。更多的例子请看这个


    是否有办法将pyspark决策树移植到scikit ad,然后使用sklearn生成graphviz点文件?