Machine learning 在Mahout中寻找特征向量中的不同维数

Machine learning 在Mahout中寻找特征向量中的不同维数,machine-learning,mahout,pearson,Machine Learning,Mahout,Pearson,如果我使用基于相似性的算法,例如pearson相关分数来比较两个特征向量 我想知道这些尺寸/特征字段在特征集中非常不同,那么使用什么算法呢?我使用的是Mahout,这是一个Java机器学习库,它只是两个向量差异最大的维度,在这个维度中向量值差异的绝对值最大。这就是你的全部意思,还是你在寻找更微妙的东西?这不是一个真正的编程问题,是吗?我正在使用Mahout,它是Java中的一个机器学习库,如果你想在这里获得反馈,你应该在你的问题中提到这一点,也许还可以发布你正在编写的代码。你到底想做什么?找到两

如果我使用基于相似性的算法,例如pearson相关分数来比较两个特征向量
我想知道这些尺寸/特征字段在特征集中非常不同,那么使用什么算法呢?我使用的是Mahout,这是一个Java机器学习库,它只是两个向量差异最大的维度,在这个维度中向量值差异的绝对值最大。这就是你的全部意思,还是你在寻找更微妙的东西?

这不是一个真正的编程问题,是吗?我正在使用Mahout,它是Java中的一个机器学习库,如果你想在这里获得反馈,你应该在你的问题中提到这一点,也许还可以发布你正在编写的代码。你到底想做什么?找到两个向量中的数据之间的相似性?@Adrian-我已经在下面向Sean OwenOk详细解释过,我说fv1、fv2、fv3、fv4和fv5是应该非常“相似”的特征向量。现在,对于特征向量2=fv2(比如说),我需要找出与其他维度相比,哪些维度比较尴尬,或者有很大的不相似性变化。为此,我想将fv2与所有其他特征向量进行比较,然后得出答案。因此,我需要计算所有向量的平均绝对差,或者是否有更好的统计数据?与平均值的绝对差是合理的;我可能会建议一些更规范化的东西,比如z值——只是与平均值的标准偏差的数量。