Statistics 如果只有样本才能在torch中从未知分布中提取，如何建立未知分布的良好近似？_Statistics_Pytorch_Distribution_Sample_Estimation

Statistics 如果只有样本才能在torch中从未知分布中提取，如何建立未知分布的良好近似？

statistics pytorch

Statistics 如果只有样本才能在torch中从未知分布中提取，如何建立未知分布的良好近似？,statistics,pytorch,distribution,sample,estimation,Statistics,Pytorch,Distribution,Sample,Estimation,假设我只有分布中的随机样本，没有其他数据-例如数字列表-[1,15,30,4等]。在Pytork中从中提取更多样本来估计分布的最佳方法是什么我目前假设所有样本都来自正态分布，只使用样本的平均值和标准差来构建样本并从中提取。但是，该功能可以是任何分布 samples=火炬张量（[1,2,3,4,3,2,2,1]）正常（samples.mean（），samples.std（））.sample（）最佳方法取决于您想要实现的目标。如果您不知道基础分布，则需要对其进行假设，然后将合适的分布（您知道如

假设我只有分布中的随机样本，没有其他数据-例如数字列表-

[1,15,30,4等]

。在Pytork中从中提取更多样本来估计分布的最佳方法是什么

我目前假设所有样本都来自正态分布，只使用样本的平均值和标准差来构建样本并从中提取。但是，该功能可以是任何分布

samples=火炬张量（[1,2,3,4,3,2,2,1]）
正常（samples.mean（），samples.std（））.sample（）

最佳方法取决于您想要实现的目标。如果您不知道基础分布，则需要对其进行假设，然后将合适的分布（您知道如何采样）拟合到您的样本中。你可以从一些简单的东西开始，比如高斯混合（几个不同权重的正态分布）

另一种方法是在现有值上定义离散分布。您将为每个值赋予相同的概率，例如p（x）=1/N。当您从中采样时，您只需从[0，N]中抽取一个随机整数，指向您的一个样本。

如果您有足够的样本（并且样本维度最好高于

），您可以使用或对分布进行建模（尽管我会坚持第一种方法，因为它更简单）

基本上，在正确的实现和训练之后，您将获得能够解码隐藏代码的确定性解码器，您将其（例如，从正态分布中获取的大小为

的向量）传递到目标分布中的值

请注意，它可能根本不可靠，但如果您的样本仅为

1D

，则会更加困难。

我喜欢离散分布方法，但它不适合我，因为我需要新样本。我正在黑盒优化中进行采集采样。因此我有一些样本，我想获取新样本，测试它们，然后选择新样本这是一个太宽泛的问题。涉及到什么假设？你已经给出了整数值，你是否假设分布是离散的（vs连续的）？对分布的支持是上下有界的，还是无限的（几何、泊松、指数等）？您是否试过查看您拥有的数据的直方图，以查看它的形状？您的样本是否足够大，可以合理地代表基础分布？在大多数情况下，适当的分布拟合需要大量样本或做出各种假设。没有任何假设-我不知道什么是先验的。很明显，我在我的普通例子中有连续变量的假设-这很好，但我真的不知道。另外，我实际上关心多维函数，但我给出了一个简单的一维例子，我可以从那里开始。边界让我们假设我可以得到-如果我不能，我可以用下限作为看到的最低值来伪造它在训练集中，最高也一样。这是用于黑盒优化中的获取。过一段时间，我将收集更多示例，我只想在任何时候获得分布的最佳近似值。