Machine learning 方法对也具有分类标签的数据进行聚类?

Machine learning 方法对也具有分类标签的数据进行聚类?,machine-learning,statistics,classification,cluster-analysis,hierarchical-clustering,Machine Learning,Statistics,Classification,Cluster Analysis,Hierarchical Clustering,我有一个数据集,其中每一行代表一个人及其全年的支付行为。对于每个人,我有3个可能的分类标签(年龄、性别、国籍)。付款行为由30多个指标定义,如付款数量和付款价值。结果数据集示例如下所示(我在右侧包含了一些随机支付行为指标): 我的目标是创建代表具有类似支付行为的同质人群的类(基于年龄/性别/国籍的组合)。例如:我们发现50-60岁的美国男性都有类似的支付行为。例如,对于每一类,我可以确定平均值、标准差、百分位数等。因为这似乎是聚类和分类之间的重叠,我被困在研究什么和在哪里寻找。有什么方法我可以

我有一个数据集,其中每一行代表一个人及其全年的支付行为。对于每个人,我有3个可能的分类标签(年龄、性别、国籍)。付款行为由30多个指标定义,如付款数量和付款价值。结果数据集示例如下所示(我在右侧包含了一些随机支付行为指标):

我的目标是创建代表具有类似支付行为的同质人群的类(基于年龄/性别/国籍的组合)。例如:我们发现50-60岁的美国男性都有类似的支付行为。例如,对于每一类,我可以确定平均值、标准差、百分位数等。因为这似乎是聚类和分类之间的重叠,我被困在研究什么和在哪里寻找。有什么方法我可以参考吗

我考虑的一个选项是首先创建所有可能的类(例如50-m-US、50-F-US、51-m-US等),然后根据欧几里得距离(使用所有支付行为度量方法)合并它们,直到剩下所需数量的类。让我知道你的想法