Statistics 如果只有样本才能在torch中从未知分布中提取,如何建立未知分布的良好近似?

Statistics 如果只有样本才能在torch中从未知分布中提取,如何建立未知分布的良好近似?,statistics,pytorch,distribution,sample,estimation,Statistics,Pytorch,Distribution,Sample,Estimation,假设我只有分布中的随机样本,没有其他数据-例如数字列表-[1,15,30,4等]。在Pytork中从中提取更多样本来估计分布的最佳方法是什么 我目前假设所有样本都来自正态分布,只使用样本的平均值和标准差来构建样本并从中提取。但是,该功能可以是任何分布 samples=火炬张量([1,2,3,4,3,2,2,1]) 正常(samples.mean(),samples.std()).sample() 最佳方法取决于您想要实现的目标。如果您不知道基础分布,则需要对其进行假设,然后将合适的分布(您知道如

假设我只有分布中的随机样本,没有其他数据-例如数字列表-
[1,15,30,4等]
。在Pytork中从中提取更多样本来估计分布的最佳方法是什么

我目前假设所有样本都来自正态分布,只使用样本的平均值和标准差来构建样本并从中提取。但是,该功能可以是任何分布

samples=火炬张量([1,2,3,4,3,2,2,1])
正常(samples.mean(),samples.std()).sample()
最佳方法取决于您想要实现的目标。如果您不知道基础分布,则需要对其进行假设,然后将合适的分布(您知道如何采样)拟合到您的样本中。你可以从一些简单的东西开始,比如高斯混合(几个不同权重的正态分布)


另一种方法是在现有值上定义离散分布。您将为每个值赋予相同的概率,例如p(x)=1/N。当您从中采样时,您只需从[0,N]中抽取一个随机整数,指向您的一个样本。

如果您有足够的样本(并且样本维度最好高于
1
),您可以使用或对分布进行建模(尽管我会坚持第一种方法,因为它更简单)

基本上,在正确的实现和训练之后,您将获得能够解码隐藏代码的确定性解码器,您将其(例如,从正态分布中获取的大小为
10
的向量)传递到目标分布中的值


请注意,它可能根本不可靠,但如果您的样本仅为
1D
,则会更加困难。

我喜欢离散分布方法,但它不适合我,因为我需要新样本。我正在黑盒优化中进行采集采样。因此我有一些样本,我想获取新样本,测试它们,然后选择新样本这是一个太宽泛的问题。涉及到什么假设?你已经给出了整数值,你是否假设分布是离散的(vs连续的)?对分布的支持是上下有界的,还是无限的(几何、泊松、指数等)?您是否试过查看您拥有的数据的直方图,以查看它的形状?您的样本是否足够大,可以合理地代表基础分布?在大多数情况下,适当的分布拟合需要大量样本或做出各种假设。没有任何假设-我不知道什么是先验的。很明显,我在我的普通例子中有连续变量的假设-这很好,但我真的不知道。另外,我实际上关心多维函数,但我给出了一个简单的一维例子,我可以从那里开始。边界让我们假设我可以得到-如果我不能,我可以用下限作为看到的最低值来伪造它在训练集中,最高也一样。这是用于黑盒优化中的获取。过一段时间,我将收集更多示例,我只想在任何时候获得分布的最佳近似值。