Python-小批量k-均值分层抽样
我正在尝试对大约一百万个对象进行聚类,每个对象都有不同长度的数据点,通常不到100个。这些特征将是观察的日期和每个对象的ID值(比如跑步者(姓名)及其在不同比赛中的时间)。我想在这些数据上运行minibatch k-means,但我也希望算法根据第三个特征(比如跑步者来自的美国州)进行分层采样。有没有办法在minibatchkmeans函数中实现这种采样 如果没有,是否有方法获取分层样本,然后以某种方式将其传递给函数?我考虑过这一点,但似乎如果我采取分层样本并将其传递给基本的k-均值算法,我将无法将样本聚合在一起,并为每个对象获得一个标签。有什么建议吗Python-小批量k-均值分层抽样,python,algorithm,k-means,sampling,Python,Algorithm,K Means,Sampling,我正在尝试对大约一百万个对象进行聚类,每个对象都有不同长度的数据点,通常不到100个。这些特征将是观察的日期和每个对象的ID值(比如跑步者(姓名)及其在不同比赛中的时间)。我想在这些数据上运行minibatch k-means,但我也希望算法根据第三个特征(比如跑步者来自的美国州)进行分层采样。有没有办法在minibatchkmeans函数中实现这种采样 如果没有,是否有方法获取分层样本,然后以某种方式将其传递给函数?我考虑过这一点,但似乎如果我采取分层样本并将其传递给基本的k-均值算法,我将无