Statistics 集成Power pdf以获得energy pdf?

Statistics 集成Power pdf以获得energy pdf?,statistics,probability,Statistics,Probability,我正试图解决一个看似简单的问题,但我无法说服自己正确的方法 我有代表功率输出(p)的pdf的时间序列数据,随时间变化,还有cdf和分位数函数-f(p,t),f(p,t)和q(p,t)。我需要从这些数据中找到给定时间间隔[t1,t2]内能量的pdf,cdf和分位数函数,比如e(),e()和qe() 很明显,能量是[t1,t2]上的幂的积分,但我怎样才能最好地计算e,e和qe呢 我最好的猜测是,因为q(p,t)是一个幂,我应该通过在时间间隔内积分q来生成qe,然后从中计算其他分布 是这么简单,还是我

我正试图解决一个看似简单的问题,但我无法说服自己正确的方法

我有代表功率输出(p)的pdf的时间序列数据,随时间变化,还有cdf和分位数函数-f(p,t),f(p,t)和q(p,t)。我需要从这些数据中找到给定时间间隔[t1,t2]内能量的pdf,cdf和分位数函数,比如e(),e()和qe()

很明显,能量是[t1,t2]上的幂的积分,但我怎样才能最好地计算e,e和qe呢

我最好的猜测是,因为q(p,t)是一个幂,我应该通过在时间间隔内积分q来生成qe,然后从中计算其他分布

是这么简单,还是我需要掌握随机微积分

澄清的其他细节

我们得到的数据是一个时间序列,每个时间t的f(p),f(p),q(p)的“黑匣子”预测,其中p是瞬时功率,我想得到e(p)的时间间隔大约有100个预测。“黑盒”的意思是,我可以调用一个函数来计算P的f,f,q,但我不知道其基本分布

黑匣子函数几乎可以肯定是对生成功率预测的模型的输出数据进行插值,但我们无法访问该数据。我想它不会是简单的,因为它来自一系列非线性变换。这实际上是对风电场产量的预测:风速可能是正态分布的,但多种地形和涡轮机转换将改变这一点

进一步澄清 (我编辑了原始文本,以删除能量分布函数中令人困惑的变量名称。)

预测结果如下:


我们需要e,e和qe的区间[t1,t2]被细分为100个(比如)子区间k=1…100。对于每一个k,我们得到一个不同的f(P),称它们为f_k(P)。我们需要从这组f_k(P)计算区间的能量分布。

感谢澄清。据我所知,您没有足够的信息来正确解决此问题。具体来说,您需要对从一个时间步到下一个时间步的功率依赖性进行一些估计。时间步长越长,依赖性越小;如果步骤足够长,那么从一个步骤到下一个步骤的功耗可能基本上是独立的,这将是一个好消息,因为这将大大简化分析。那么,时间步长有多长?一个小时?一分钟?一天

如果时间步长足够长,足以独立,则能量分布为100个变量的分布,根据中心极限定理,这将非常接近正态分布。在这种情况下,很容易算出总能量的均值和方差

否则,分布将是更复杂的结果。我的猜测是,用独立步长法估计的方差太大了——我相信实际方差会小一些


从你所说的,你没有任何关于时间依赖性的信息。也许你可以找到或从其他来源获得一个或多个自相关函数的估计值——如果这个问题已经在风力发电方面研究过,我也不会感到惊讶。如果已经研究过这个问题的一般版本,我也不会感到惊讶——也许你可以搜索类似“自相关变量之和的分布”。你可能会在stats.stackexchange.com上对这个问题感兴趣

p的分布是什么?(正常、对数正常、其他情况?)您是在某个瞬间获得功率还是在某个时间间隔内获得平均功率?P仅由公式给出,还是由记录的测量值得出?谢谢您提供的任何其他信息。@RobertDodier我已经添加了一些进一步的详细信息来帮助澄清问题。谢谢您提供的信息。当你说有100个预测时,你的意思是在100个子区间上有一个时间序列,k=1,…,100,每个k有一个不同的f(P,t)?或者你的意思是有100个时间序列?@RobertDodier我补充了更多的澄清。我想:-)我相信我们会得到一个时间序列的预测-100个单独的PDF,间隔内每k一个。这帮助我认识到,正如我所说的,问题不可能是实际发生的事情。关于这些预测f(P)实际上是什么,有些地方有一个误解——不确定在哪一端:——)因为是风驱动的,每个子区间之间一定有一个相关性——这就是预测的重点。此外,子间隔间隔为分钟,因此功率变化的物理限制。谢谢你帮我理解这一点-我会做更多的谷歌搜索,因为我们不是第一个需要看这个的人。杰克,我很想知道你发现了什么。