Machine learning 有条件取样

Machine learning 有条件取样,machine-learning,statistics,distribution,sampling,Machine Learning,Statistics,Distribution,Sampling,从一个点池中,我想对一个固定数量的点进行采样,以使其满足某些条件 有什么程序可以这样做吗? 如果有任何关于这个主题的论文,那么它也会很有帮助 例如: 让我们考虑我们有10000个用户。关于每个用户,我知道有多少收入。现在让我们考虑一下,我想从这个用户群中抽取150个用户,这样人口的平均收入就变成了M。 注:该平均收入(条件)M与总人口平均数不同 提前感谢。如果您的程序的目标是在每个样本中获得平等的收入分配,您可以使用分层抽样。你划分收入类别,从每个收入类别中随机抽取一个样本 有关更多理论信息,请

从一个点池中,我想对一个固定数量的点进行采样,以使其满足某些条件

有什么程序可以这样做吗? 如果有任何关于这个主题的论文,那么它也会很有帮助

例如: 让我们考虑我们有10000个用户。关于每个用户,我知道有多少收入。现在让我们考虑一下,我想从这个用户群中抽取150个用户,这样人口的平均收入就变成了M。 注:该平均收入(条件)M与总人口平均数不同


提前感谢。

如果您的程序的目标是在每个样本中获得平等的收入分配,您可以使用分层抽样。你划分收入类别,从每个收入类别中随机抽取一个样本

有关更多理论信息,请参见此处的维基百科页面:


有关实现示例,请参见此处:

您这样做的目的是什么。如果希望每次采样保持不变,则可以尝试随机数字段,以便每次采样都相同。带条件的随机采样不再是随机采样。不管怎样,你可以只取n-1个随机样本,然后选择最后一个,这样平均值就等于你想要的结果。我投票决定以离题的方式结束这个问题,因为它与编程无关。