Machine learning 方法对也具有分类标签的数据进行聚类？_Machine Learning_Statistics_Classification_Cluster Analysis_Hierarchical Clustering

Machine learning 方法对也具有分类标签的数据进行聚类？

machine-learning statistics

Machine learning 方法对也具有分类标签的数据进行聚类？,machine-learning,statistics,classification,cluster-analysis,hierarchical-clustering,Machine Learning,Statistics,Classification,Cluster Analysis,Hierarchical Clustering,我有一个数据集，其中每一行代表一个人及其全年的支付行为。对于每个人，我有3个可能的分类标签（年龄、性别、国籍）。付款行为由30多个指标定义，如付款数量和付款价值。结果数据集示例如下所示（我在右侧包含了一些随机支付行为指标）：我的目标是创建代表具有类似支付行为的同质人群的类（基于年龄/性别/国籍的组合）。例如：我们发现50-60岁的美国男性都有类似的支付行为。例如，对于每一类，我可以确定平均值、标准差、百分位数等。因为这似乎是聚类和分类之间的重叠，我被困在研究什么和在哪里寻找。有什么方法我可以

我有一个数据集，其中每一行代表一个人及其全年的支付行为。对于每个人，我有3个可能的分类标签（年龄、性别、国籍）。付款行为由30多个指标定义，如付款数量和付款价值。结果数据集示例如下所示（我在右侧包含了一些随机支付行为指标）：

我的目标是创建代表具有类似支付行为的同质人群的类（基于年龄/性别/国籍的组合）。例如：我们发现50-60岁的美国男性都有类似的支付行为。例如，对于每一类，我可以确定平均值、标准差、百分位数等。因为这似乎是聚类和分类之间的重叠，我被困在研究什么和在哪里寻找。有什么方法我可以参考吗

我考虑的一个选项是首先创建所有可能的类（例如50-m-US、50-F-US、51-m-US等），然后根据欧几里得距离（使用所有支付行为度量方法）合并它们，直到剩下所需数量的类。让我知道你的想法