Scikit learn 概率是如何在kNN算法中发挥作用的?

Scikit learn 概率是如何在kNN算法中发挥作用的?,scikit-learn,probability,knn,nearest-neighbor,Scikit Learn,Probability,Knn,Nearest Neighbor,kNN似乎比较容易理解:您拥有数据点,并在要素空间中绘制它们(在尺寸为2的要素空间中,其与在xy平面图上绘制点相同)。如果要对新数据进行分类,可以将新数据放在同一个要素空间中,找到最近的k个邻居,然后查看它们的标签,最终选择投票率最高的标签 那么概率在哪里起作用呢?我所做的只是计算两点之间的距离,并获取最近邻居的标签 对于新的测试样本,您可以查看K个最近邻并查看它们的标签。 计算每个类中的K个样本的数量,然后将计数除以类的数量 例如,假设分类器中有2个类,使用K=3个最近邻,这3个最近邻样本的标

kNN似乎比较容易理解:您拥有数据点,并在要素空间中绘制它们(在尺寸为2的要素空间中,其与在xy平面图上绘制点相同)。如果要对新数据进行分类,可以将新数据放在同一个要素空间中,找到最近的k个邻居,然后查看它们的标签,最终选择投票率最高的标签


那么概率在哪里起作用呢?我所做的只是计算两点之间的距离,并获取最近邻居的标签

对于新的测试样本,您可以查看K个最近邻并查看它们的标签。 计算每个类中的K个样本的数量,然后将计数除以类的数量


例如,假设分类器中有2个类,使用K=3个最近邻,这3个最近邻样本的标签为(0,1,1)-类0的概率为1/3,类1的概率为2/3。

对于新的测试样本,您查看K个最近邻样本并查看其标签。 计算每个类中的K个样本的数量,然后将计数除以类的数量


例如,假设分类器中有2个类,使用K=3个最近邻,这3个最近邻样本的标签为(0,1,1)-类别0的概率为1/3,类别1的概率为2/3。

这如何适用于多标签分类?多标签还是多类别?多类别意味着您有几个类别(多于2个)。多标签意味着你有几个标签,每个标签可以有两个或两个以上的类(例如预测客户的年龄和性别)。多标签的后验概率是如何工作的?你可以对每个标签做同样的事情。。。取K个最近的样本,检查它们的标签,并计算这些邻居的概率。这如何适用于多标签分类?多标签还是多类别?多类别意味着您有几个类别(多于2个)。多标签意味着你有几个标签,每个标签可以有两个或两个以上的类(例如预测客户的年龄和性别)。多标签的后验概率是如何工作的?你可以对每个标签做同样的事情。。。取K个最近的样本,检查它们的标签,并计算这些邻居的概率