R 自组织地图可视化结果解释
使用R软件包,我得到了一个“代码”图,它显示了码本向量 我想问,相邻节点的码本向量是否应该相似?为什么左边的前两个节点如此不同 是否有一种方法可以在一个有意义的组织中组织它,如下图所示?来源于。高度贫困的国家聚集在最底层。R 自组织地图可视化结果解释,r,machine-learning,cluster-analysis,som,unsupervised-learning,R,Machine Learning,Cluster Analysis,Som,Unsupervised Learning,使用R软件包,我得到了一个“代码”图,它显示了码本向量 我想问,相邻节点的码本向量是否应该相似?为什么左边的前两个节点如此不同 是否有一种方法可以在一个有意义的组织中组织它,如下图所示?来源于。高度贫困的国家聚集在最底层。 library(“kohonen”) 数据(“葡萄酒”) wines.scMap 1是每个节点的平均向量结果。突出显示的前两个节点非常相似 图2是节点之间的一种相似性索引 如果要使用map 1结果获得此类地图,可能需要使用以下参数开发自己的绘图功能: 选择最相关或最不同的
library(“kohonen”)
数据(“葡萄酒”)
wines.scMap 1是每个节点的平均向量结果。突出显示的前两个节点非常相似
图2是节点之间的一种相似性索引
如果要使用map 1结果获得此类地图,可能需要使用以下参数开发自己的绘图功能:
选择最相关或最不同的节点(手动或自动)。然后,必须为这些节点中的每一个赋予颜色
使用每个节点中心与选定节点之间的平均距离为相邻节点指定颜色。距离越短=接近颜色,距离越大=褪色颜色
总而言之,这是一项几乎没有任何回报的大量工作。地图1更好,包含很多信息。地图2很好看…我突出显示的2个节点的码本向量不同,对吗?对于非flav,左侧节点具有非常高的权重。酚类和色素,而右淋巴结的酒精、苹果酸和非黄素含量较高。酚类,颜色和色调。我的理解错了吗?这些节点之间的真正区别是灰的级别
library("kohonen")
data("wines")
wines.sc <- scale(wines)
set.seed(7)
wine.som <- som(data = wines.sc, grid = somgrid(5, 4, "hexagonal"))
# types of plots
plot(wine.som, type="codes", main = "Wine data")