如何在SAS for KNN中使用Proc Discrim处理死锁?

如何在SAS for KNN中使用Proc Discrim处理死锁?,sas,knn,Sas,Knn,我有一个proc discrim语句,它运行KNN分析。当我设置k=1时,它将为所有内容分配一个类别(如预期的那样)。但当k>1时,它会保留一些未指定的观察值(将类别设置为其他类别) 我假设这是两个或更多类别的僵局投票的结果。我知道有很多方法可以解决这个问题,要么随机选择一张僵持的选票作为答案,要么选择最近的一张僵持的选票作为答案 该功能在proc discrim中可用吗?你如何告诉它如何处理死锁 干杯 当最近邻的数量为两个或两个以上时,将观测值分配给“其他”类的假设是正确的。您可以通过指定PR

我有一个proc discrim语句,它运行KNN分析。当我设置k=1时,它将为所有内容分配一个类别(如预期的那样)。但当k>1时,它会保留一些未指定的观察值(将类别设置为其他类别)

我假设这是两个或更多类别的僵局投票的结果。我知道有很多方法可以解决这个问题,要么随机选择一张僵持的选票作为答案,要么选择最近的一张僵持的选票作为答案

该功能在proc discrim中可用吗?你如何告诉它如何处理死锁


干杯

当最近邻的数量为两个或两个以上时,将观测值分配给“其他”类的假设是正确的。您可以通过指定PROC DISCRIM语句选项OUT=SASdsn来编写一个SAS输出数据集,说明过程对输入观察值的分类程度。此输出数据集包含分配给每个指定类的概率。例如,对iris数据集使用两个最近邻(K=2)会产生五个观测值,该过程将其归类为不明确,分配给Versicolor或Virginica类的概率为0.50。从输出数据集中,您可以选择这些分类模糊的观测值,并在后续数据步骤中将其随机分配给这些类。或者,您可以通过计算每个值的标准偏差标准化的平方距离+/-并将观测值分配给“最近”类别,将用于分类这些模糊分类观测值的变量值与每个类别的这些值的平均值进行比较

感谢您的支持,在单独的数据步骤中处理它是一个好主意。很高兴知道我没有错过任何选择。