具有特定属性的Python子样本

具有特定属性的Python子样本,python,scikit-learn,sampling,Python,Scikit Learn,Sampling,我想从数据集中创建一个子样本,同时将一些聚合度量值保持在某些边界内 例如,我希望绘制10%的行,并将平均属性X保持在某些边界内 这实际上是分层。我在Python中工作,通常使用StratifiedShuffleSplit,但我不知道这是否可以用在我的案例中。什么是StratifiedShuffleSplit?如果你正在使用一个库,你需要给它加上标签。什么是分层shufflesplit?如果您正在使用库,则需要对其进行标记。

我想从数据集中创建一个子样本,同时将一些聚合度量值保持在某些边界内

例如,我希望绘制10%的行,并将平均属性X保持在某些边界内


这实际上是分层。我在Python中工作,通常使用
StratifiedShuffleSplit
,但我不知道这是否可以用在我的案例中。

什么是
StratifiedShuffleSplit
?如果你正在使用一个库,你需要给它加上标签。什么是分层shufflesplit?如果您正在使用库,则需要对其进行标记。