Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/79.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 聚类序数数据_R_Cluster Analysis_K Means_Hclust - Fatal编程技术网

R 聚类序数数据

R 聚类序数数据,r,cluster-analysis,k-means,hclust,R,Cluster Analysis,K Means,Hclust,我想用R语言(编码)对数据进行聚类(kmeans或hclust)。我的数据是有序的,这意味着数据是衡量成本上升原因的利克特尺度(我有41个原因“变量”),从1到5,从1没有影响到5个主要影响(我有大约160个观察结果“对原因进行排序”)。。。关于如何根据观察结果对41个原因进行分类的任何帮助。。。在聚类或任何有助于。。。。。。我真的需要你的帮助!!这是要处理的数据 我想根据观察中出现的相似性对变量(列)进行聚类。。。我遵循statmethods.net/advstats/cluster.html

我想用R语言(编码)对数据进行聚类(kmeans或hclust)。我的数据是有序的,这意味着数据是衡量成本上升原因的利克特尺度(我有41个原因“变量”),从1到5,从1没有影响到5个主要影响(我有大约160个观察结果“对原因进行排序”)。。。关于如何根据观察结果对41个原因进行分类的任何帮助。。。在聚类或任何有助于。。。。。。我真的需要你的帮助!!这是要处理的数据


我想根据观察中出现的相似性对变量(列)进行聚类。。。我遵循statmethods.net/advstats/cluster.html中的代码;但我无法根据观察结果中出现的相似性对变量(列)进行聚类,而且我也遵循mattpeeples.net/kmeans.html的工作#help;但我不知道他为什么要将数据转换为百分比,然后再转换为Z分数标准化。

我不清楚您是想根据变量的相似性对行(观察值)进行聚类,还是根据观察值中出现的相似性对变量(列)进行聚类

无论如何,请参阅软件包。这是所有R安装附带的推荐软件包

阅读
?daisy
,了解如何处理顺序数据的详细信息。此度量可用于函数中,例如
agnes
(用于层次聚类)或
pam
(用于关于medoid的分区,k-means的更健壮版本)


默认情况下,这些将对行/观察值进行聚类。如果要对列(变量)进行集群,只需使用
t()
转换数据对象即可。尽管这可能会使数据变得混乱,这取决于您存储数据的方式。

将数据转换为百分比被称为数据标准化,因此所有变量都在0-1范围内


如果数据未标准化,则有可能偏向具有较大值的维度

在确定应在何处提问之前,您应该澄清您的问题。如果这是一个统计问题,你应该去交叉验证;如果这是一个编码问题,你应该在这里问,但我在你的文章中没有看到任何关于编码的问题。谢谢你的评论…我想根据观察中出现的相似性对变量(列)进行聚类。。。我遵循代码,但我不能根据观察中出现的相似性对变量(列)进行聚类,我也遵循了在的工作,但我不知道为什么他将数据转换为百分比,然后再转换为Z分数标准化。。。