Data structures KD树是给定数据集的唯一顺序吗?

Data structures KD树是给定数据集的唯一顺序吗?,data-structures,machine-learning,computational-geometry,kdtree,Data Structures,Machine Learning,Computational Geometry,Kdtree,给定一组数据点,会在其上创建一个kdtree,但此kdtree是唯一的吗?它似乎取决于如何构造树。维基百科的文章提到了中点的选择如何影响生成的树是否平衡。如果选择了不同的点,则树将不平衡,但仍将是kd树。因此,您的问题的答案取决于您的树构造算法如何选择拆分平面。我不这么认为 如果您的问题回答为“是”,那么我认为这意味着每个分割的维度和值的选择是根据某种客观标准选择的。课程的价值是根据精确的算法选择的(即,计算该维度中要拆分的所有点的中值,但不是维度。大多数KD树算法仅通过交替使用可用维度来选择要

给定一组数据点,会在其上创建一个kdtree,但此kdtree是唯一的吗?

它似乎取决于如何构造树。维基百科的文章提到了中点的选择如何影响生成的树是否平衡。如果选择了不同的点,则树将不平衡,但仍将是kd树。因此,您的问题的答案取决于您的树构造算法如何选择拆分平面。

我不这么认为

如果您的问题回答为“是”,那么我认为这意味着每个分割的维度的选择是根据某种客观标准选择的。课程的价值是根据精确的算法选择的(即,计算该维度中要拆分的所有点的中值,但不是维度。大多数KD树算法仅通过交替使用可用维度来选择要拆分的维度。一些算法只是随机选择要拆分的维度


这与C4.5(决策树)非常不同,因为在C4.5中,要拆分的维度和值是由一个客观标准选择的,即熵最小化(对于分类变量)或方差(对于连续变量).

它是唯一的,或者当选择某个拆分方法时,我们称之为稳定的,无论这些数据在数据集中的顺序如何。

这个值是唯一的,但只有在指定了维度之后(我相信这包括根,以及所有“节点”);同样,即使对于根节点,我所知道的实现中维度的选择(在响应Q之前我检查了几个维度)也只是在可用维度之间循环。