Cluster analysis 如何有效地对这种格式的数据集进行集群?

Cluster analysis 如何有效地对这种格式的数据集进行集群?,cluster-analysis,Cluster Analysis,假设我有一个由多个大小可变的集群组成的数据集,元素是散列。比如说 A) 1fjsoj3139i3,2i3doasdoada,213kdiosdaoj B) 2I3Doada,9dadk2la94ma C) 23daosimdiao,22daoskgmso0 注意:所有元素的大小都相同,但每个集群可以有不同数量的元素。假设每个集群都是一个集合。现在我主要想做的是,对于所有交集不是空集的集合,我想通过取这两个集合的并集来创建一个新的簇。就像在上面的例子中,由于A和B共享一个相似的元素,我想将A和B簇

假设我有一个由多个大小可变的集群组成的数据集,元素是散列。比如说

A) 1fjsoj3139i3,2i3doasdoada,213kdiosdaoj

B) 2I3Doada,9dadk2la94ma

C) 23daosimdiao,22daoskgmso0

注意:所有元素的大小都相同,但每个集群可以有不同数量的元素。假设每个集群都是一个集合。现在我主要想做的是,对于所有交集不是空集的集合,我想通过取这两个集合的并集来创建一个新的簇。就像在上面的例子中,由于A和B共享一个相似的元素,我想将A和B簇成一个新的簇D,其中包含A和B中的所有元素。在这个特定的例子中,C不与A和B共享任何元素。但是假设C与B共享一个元素,然后我想通过C和D的并集来创建另一个新集群,并继续这样做

希望得到一些帮助或指导