Data mining 加权特征向量分类

Data mining 加权特征向量分类,data-mining,classification,weighting,Data Mining,Classification,Weighting,在任何分类算法(如KNN或J48)中使用特征之前,我想给数据集的特征赋予权重,但我不知道如何计算加权特征向量。 是否有任何分类算法接受权重作为输入,而不仅仅是“0”和“1”? 特别是,Weka的任何就绪分类功能是否能够使用权重(而不是0和1作为过滤器)?在大多数情况下,您可以根据权重缩放数据集。这对于Minkowski距离(如欧几里德距离)来说证明是微不足道的。并非所有weka的分类算法都支持权重,但有些算法支持权重 加载数据集后,需要设置权重信息,请参阅。我记得WekaJ48,决策树,在开发者

在任何分类算法(如KNN或J48)中使用特征之前,我想给数据集的特征赋予权重,但我不知道如何计算加权特征向量。
是否有任何分类算法接受权重作为输入,而不仅仅是“0”和“1”?

特别是,Weka的任何就绪分类功能是否能够使用权重(而不是0和1作为过滤器)?

在大多数情况下,您可以根据权重缩放数据集。这对于Minkowski距离(如欧几里德距离)来说证明是微不足道的。

并非所有weka的分类算法都支持权重,但有些算法支持权重

加载数据集后,需要设置权重信息,请参阅。我记得WekaJ48,决策树,在开发者版本中支持权重,但找不到引用。但也存在一个问题

在weka wiki中搜索可能会有所帮助


我建议尝试将权重添加到数据集中,并在数据中进行训练。

感谢您的帮助。那么你的意思是分类算法(例如j48)在分类时考虑了增加的权重?