Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/angularjs/22.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Scikit learn knn(k-最近邻)在什么维度开始表现不佳?_Scikit Learn_Knn - Fatal编程技术网

Scikit learn knn(k-最近邻)在什么维度开始表现不佳?

Scikit learn knn(k-最近邻)在什么维度开始表现不佳?,scikit-learn,knn,Scikit Learn,Knn,我知道kNN搜索会随着问题维数的增加而表现得更差。我知道对于kNN搜索,20被认为是相当高的维度。我不知道的是,在第3个(我知道kNN工作得很好)和第20个(我知道kNN工作得不太好)之间,它到底从哪里开始变得糟糕 假设一个平衡良好的树,有人知道平均查询速度与大约1到20个维度之间的维度有什么关系吗 就不同的kNN算法产生的结果而言,我对此很感兴趣,但您可以假设Scikit学习实现为kNN作为问题的基线。性能在很大程度上取决于您使用的数据类型(以及scicit学习使用的任何索引)。 有关简短示例

我知道kNN搜索会随着问题维数的增加而表现得更差。我知道对于kNN搜索,20被认为是相当高的维度。我不知道的是,在第3个(我知道kNN工作得很好)和第20个(我知道kNN工作得不太好)之间,它到底从哪里开始变得糟糕

假设一个平衡良好的树,有人知道平均查询速度与大约1到20个维度之间的维度有什么关系吗


就不同的kNN算法产生的结果而言,我对此很感兴趣,但您可以假设Scikit学习实现为kNN作为问题的基线。

性能在很大程度上取决于您使用的数据类型(以及scicit学习使用的任何索引)。
有关简短示例,请参见。在这些示例中,对于强聚集数据集(标记为CL-P),KD树的性能比其他一些索引差100倍,而对于另一个均匀分布的数据集(CU-P),它们几乎相同。

您尝试过进行一些测量吗?性能在很大程度上取决于您使用的数据类型(以及scicit使用的任何索引)。举一个简短的例子,请参见,对于强聚集的数据集,KD树的性能比其他索引差100倍,在均匀分布的数据集中,它们几乎是相同的。该引用是对该问题的完美回答。非常感谢@TilmannZ请将其作为答案发布,以便我可以接受。