Python 以自顶向下的方法创建和遍历数据帧

Python 以自顶向下的方法创建和遍历数据帧,python,pandas,dataframe,Python,Pandas,Dataframe,我手头有一个复杂的问题要解决。 数据在数据框中,存储方式如下 对于level3中的每个值,我已经计算了一个度量,下一步是创建一个结构(输出也可以是一个简单的列表) 在这里,我们从level1遍历到level3(自上而下的方法)。 输出可以可视化为: 我们从一级的aa开始,观察到aa有3个孩子(二级)。 现在,根据该指标,我们分组并确定abc在单独和(def、ghi)可以被俱乐部化时是最好的。 基本上,为了做到这一点,我们必须尝试第2级的所有组合,然后选择最好的组合 我有一个从1级到2级的函数

我手头有一个复杂的问题要解决。 数据在数据框中,存储方式如下

对于level3中的每个值,我已经计算了一个度量,下一步是创建一个结构(输出也可以是一个简单的列表) 在这里,我们从level1遍历到level3(自上而下的方法)。 输出可以可视化为:

我们从一级的aa开始,观察到aa有3个孩子(二级)。 现在,根据该指标,我们分组并确定abc在单独和(def、ghi)可以被俱乐部化时是最好的。 基本上,为了做到这一点,我们必须尝试第2级的所有组合,然后选择最好的组合

我有一个从1级到2级的函数。但它需要递归地转到第3级

以下是我目前的逻辑:

职能1:

  • 使用level2中的所有组合创建表

  • 根据所有组合计算分数,并选择最低的(越低越好)

  • 如果最低分数<家长分数:

    go to that combination and further try to split it
    
    其他:

  • 步骤3进入循环,并将级别2拆分为所示的输出

  • 对于每个步骤4拆分,使用相同的逻辑识别并拆分其第3级子级


  • 我很难将第4步的输出传递到第5步

    请不要以图片的形式提供输出的示例。我们无法复制、编辑、修改等。这些图片会使帮助变得更加困难。请不要以图片的形式提供输出的示例。我们不能复制、编辑、修改这些图片,这会使我们更难提供帮助。
    that node is the terminal node