Math 求二元特征点的平均值

Math 求二元特征点的平均值,math,binary,data-mining,binary-data,mean,Math,Binary,Data Mining,Binary Data,Mean,我有一组二进制字符串,每个位代表变量中的一个特征,例如,我有一个颜色变量,其中红色、蓝色和绿色是特征,因此,如果我有010-->我有一个蓝色对象 我需要通过计算加权平均值得到这些对象的中心,例如010权重的0.5;100权重0.4和001权重0.8[010*0.5+100*0.4+001*0.8]/[1.7] 是否有可能获得一个点,该点表示那些点的中心,这些点应具有与其他点相同的属性(3位二进制) 提前感谢您的帮助我想您可以使用聚类分析中的以下方法:您需要为对象空间(欧几里德、出租车或其他)选择

我有一组二进制字符串,每个位代表变量中的一个特征,例如,我有一个颜色变量,其中红色、蓝色和绿色是特征,因此,如果我有010-->我有一个蓝色对象

我需要通过计算加权平均值得到这些对象的中心,例如010权重的0.5;100权重0.4和001权重0.8[010*0.5+100*0.4+001*0.8]/[1.7]

是否有可能获得一个点,该点表示那些点的中心,这些点应具有与其他点相同的属性(3位二进制)


提前感谢您的帮助

我想您可以使用聚类分析中的以下方法:您需要为对象空间(欧几里德、出租车或其他)选择度量,然后为组中的所有对象选择度量(或者如果集合的基数很小,则为所有可能的对象选择)计算到组中所有对象的平均距离。然后,您可以假设平均距离最小的对象是组的中心。

我想您可以使用聚类分析中的以下方法:您需要为对象空间(欧几里德、Taxicab或其他)选择度量,然后为组中的所有对象选择度量(或者如果集合的基数很小,则为所有可能的对象选择)计算到组中所有对象的平均距离。然后,你可以假设平均距离最小的物体是一组的中心。

我不确定你到底想达到什么,但它是否简单如下(用你的例子):[010*.5+100*.4+001*.8]/1.7=3.4/1.7=2=010。因此,在这种情况下,010将是“中心”点(在线性加权平均意义上)。如果最后得到的是一个分数,则需要舍入为整数,然后转换为二进制。这就是你想要的吗?我不确定你到底想要实现什么,但它是否简单如下(用你的例子):[010*.5+100*.4+001*.8]/1.7=3.4/1.7=2=010。因此,在这种情况下,010将是“中心”点(在线性加权平均意义上)。如果最后得到的是一个分数,则需要舍入为整数,然后转换为二进制。这就是你要找的吗?