Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/287.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/redis/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python-小批量k-均值分层抽样_Python_Algorithm_K Means_Sampling - Fatal编程技术网

Python-小批量k-均值分层抽样

Python-小批量k-均值分层抽样,python,algorithm,k-means,sampling,Python,Algorithm,K Means,Sampling,我正在尝试对大约一百万个对象进行聚类,每个对象都有不同长度的数据点,通常不到100个。这些特征将是观察的日期和每个对象的ID值(比如跑步者(姓名)及其在不同比赛中的时间)。我想在这些数据上运行minibatch k-means,但我也希望算法根据第三个特征(比如跑步者来自的美国州)进行分层采样。有没有办法在minibatchkmeans函数中实现这种采样 如果没有,是否有方法获取分层样本,然后以某种方式将其传递给函数?我考虑过这一点,但似乎如果我采取分层样本并将其传递给基本的k-均值算法,我将无

我正在尝试对大约一百万个对象进行聚类,每个对象都有不同长度的数据点,通常不到100个。这些特征将是观察的日期和每个对象的ID值(比如跑步者(姓名)及其在不同比赛中的时间)。我想在这些数据上运行minibatch k-means,但我也希望算法根据第三个特征(比如跑步者来自的美国州)进行分层采样。有没有办法在minibatchkmeans函数中实现这种采样

如果没有,是否有方法获取分层样本,然后以某种方式将其传递给函数?我考虑过这一点,但似乎如果我采取分层样本并将其传递给基本的k-均值算法,我将无法将样本聚合在一起,并为每个对象获得一个标签。有什么建议吗