Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/svg/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R中的ProClus聚类分析_R_Parameters_Cluster Analysis_Dimensionality Reduction - Fatal编程技术网

R中的ProClus聚类分析

R中的ProClus聚类分析,r,parameters,cluster-analysis,dimensionality-reduction,R,Parameters,Cluster Analysis,Dimensionality Reduction,在我的论文作业中,我需要对包含零售商店(+1000维)购买数据的高维数据集进行聚类分析。因为传统的聚类算法不太适合高维数据(而且降维也不是一个真正的选项),所以我想尝试专门为高维数据开发的算法(例如ProClus) 然而,在这里,我的问题开始了。 我不知道参数d应该使用什么值。有人能帮我吗?这只是ProClus的诸多限制之一 该参数是集群的平均维度。它假设数据中的某个地方存在一个线性集群。这可能不适用于购买数据,但您可以尝试。对于购买之类的稀疏数据,我更愿意关注频繁项集挖掘 没有通用的聚类算法

在我的论文作业中,我需要对包含零售商店(+1000维)购买数据的高维数据集进行聚类分析。因为传统的聚类算法不太适合高维数据(而且降维也不是一个真正的选项),所以我想尝试专门为高维数据开发的算法(例如ProClus)

然而,在这里,我的问题开始了。


我不知道参数d应该使用什么值。有人能帮我吗?

这只是ProClus的诸多限制之一

该参数是集群的平均维度。它假设数据中的某个地方存在一个线性集群。这可能不适用于购买数据,但您可以尝试。对于购买之类的稀疏数据,我更愿意关注频繁项集挖掘

没有通用的聚类算法。任何聚类算法都会附带各种参数,您需要对这些参数进行实验


对于聚类分析,您必须能够以某种方式可视化或分析结果,以了解该方法是否有效以及效果如何。

任务特别要求对客户而不是产品进行聚类。你知道一种算法可以处理1000+维的稀疏矩阵吗?很多算法都可以处理。更好的问题是:什么是好的集群,我如何找到它这是一个你需要回答的问题。因为我认为ProClus集群对客户来说不是一个好的集群。但是,您可以根据客户购买的频繁项目集对客户进行聚类。你会看到一群购物行为相同的顾客。(请注意,客户可能在多个集群中,也可能没有集群;这很好。)