R 聚类序数数据_R_Cluster Analysis_K Means_Hclust

R 聚类序数数据

R 聚类序数数据,r,cluster-analysis,k-means,hclust,R,Cluster Analysis,K Means,Hclust,我想用R语言（编码）对数据进行聚类（kmeans或hclust）。我的数据是有序的，这意味着数据是衡量成本上升原因的利克特尺度（我有41个原因“变量”），从1到5，从1没有影响到5个主要影响（我有大约160个观察结果“对原因进行排序”）。。。关于如何根据观察结果对41个原因进行分类的任何帮助。。。在聚类或任何有助于。。。。。。我真的需要你的帮助！！这是要处理的数据我想根据观察中出现的相似性对变量（列）进行聚类。。。我遵循statmethods.net/advstats/cluster.html

我想用R语言（编码）对数据进行聚类（kmeans或hclust）。我的数据是有序的，这意味着数据是衡量成本上升原因的利克特尺度（我有41个原因“变量”），从1到5，从1没有影响到5个主要影响（我有大约160个观察结果“对原因进行排序”）。。。关于如何根据观察结果对41个原因进行分类的任何帮助。。。在聚类或任何有助于。。。。。。我真的需要你的帮助！！这是要处理的数据

我想根据观察中出现的相似性对变量（列）进行聚类。。。我遵循statmethods.net/advstats/cluster.html中的代码；但我无法根据观察结果中出现的相似性对变量（列）进行聚类，而且我也遵循mattpeeples.net/kmeans.html的工作#help；但我不知道他为什么要将数据转换为百分比，然后再转换为Z分数标准化。

我不清楚您是想根据变量的相似性对行（观察值）进行聚类，还是根据观察值中出现的相似性对变量（列）进行聚类

无论如何，请参阅软件包。这是所有R安装附带的推荐软件包

阅读

？daisy

，了解如何处理顺序数据的详细信息。此度量可用于函数中，例如

agnes

（用于层次聚类）或

pam

（用于关于medoid的分区，k-means的更健壮版本）

默认情况下，这些将对行/观察值进行聚类。如果要对列（变量）进行集群，只需使用

t（）

转换数据对象即可。尽管这可能会使数据变得混乱，这取决于您存储数据的方式。

将数据转换为百分比被称为数据标准化，因此所有变量都在0-1范围内

如果数据未标准化，则有可能偏向具有较大值的维度

在确定应在何处提问之前，您应该澄清您的问题。如果这是一个统计问题，你应该去交叉验证；如果这是一个编码问题，你应该在这里问，但我在你的文章中没有看到任何关于编码的问题。谢谢你的评论…我想根据观察中出现的相似性对变量（列）进行聚类。。。我遵循代码，但我不能根据观察中出现的相似性对变量（列）进行聚类，我也遵循了在的工作，但我不知道为什么他将数据转换为百分比，然后再转换为Z分数标准化。。。