Scikit learn knn（k-最近邻）在什么维度开始表现不佳？_Scikit Learn_Knn

Scikit learn knn（k-最近邻）在什么维度开始表现不佳？

scikit-learn

Scikit learn knn（k-最近邻）在什么维度开始表现不佳？,scikit-learn,knn,Scikit Learn,Knn,我知道kNN搜索会随着问题维数的增加而表现得更差。我知道对于kNN搜索，20被认为是相当高的维度。我不知道的是，在第3个（我知道kNN工作得很好）和第20个（我知道kNN工作得不太好）之间，它到底从哪里开始变得糟糕假设一个平衡良好的树，有人知道平均查询速度与大约1到20个维度之间的维度有什么关系吗就不同的kNN算法产生的结果而言，我对此很感兴趣，但您可以假设Scikit学习实现为kNN作为问题的基线。性能在很大程度上取决于您使用的数据类型（以及scicit学习使用的任何索引）。有关简短示例

我知道kNN搜索会随着问题维数的增加而表现得更差。我知道对于kNN搜索，20被认为是相当高的维度。我不知道的是，在第3个（我知道kNN工作得很好）和第20个（我知道kNN工作得不太好）之间，它到底从哪里开始变得糟糕

假设一个平衡良好的树，有人知道平均查询速度与大约1到20个维度之间的维度有什么关系吗

就不同的kNN算法产生的结果而言，我对此很感兴趣，但您可以假设Scikit学习实现为kNN作为问题的基线。

性能在很大程度上取决于您使用的数据类型（以及scicit学习使用的任何索引）。

有关简短示例，请参见。在这些示例中，对于强聚集数据集（标记为CL-P），KD树的性能比其他一些索引差100倍，而对于另一个均匀分布的数据集（CU-P），它们几乎相同。

您尝试过进行一些测量吗？性能在很大程度上取决于您使用的数据类型（以及scicit使用的任何索引）。举一个简短的例子，请参见，对于强聚集的数据集，KD树的性能比其他索引差100倍，在均匀分布的数据集中，它们几乎是相同的。该引用是对该问题的完美回答。非常感谢@TilmannZ请将其作为答案发布，以便我可以接受。