Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/82.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 给定一个随机变量和n的样本,如何找到nxs和的ecdf?_R - Fatal编程技术网

R 给定一个随机变量和n的样本,如何找到nxs和的ecdf?

R 给定一个随机变量和n的样本,如何找到nxs和的ecdf?,r,R,我无法将X放入通用发行版,因此目前我只有X~ecdf(示例数据) 给定n,如何计算sum(X1+…+Xn)的经验分布?X1到Xn是iid。要估计该总和的分布,您可以通过替换重复采样(然后从采样数据中获取n变量的总和)。(sample()在sample\u数据的每个元素上放置相等的概率质量,就像ecdf一样,因此不需要计算ecdf(sample\u数据)作为中间步骤。) #创建一些示例数据 样本数据首先,推广和简化:求解阶跃函数CDFs X和Y,独立但不相同分布。对于每一步跳席和每一步跳彝,在X+

我无法将
X
放入通用发行版,因此目前我只有
X~ecdf(示例数据)


给定
n
,如何计算
sum(X1+…+Xn)
的经验分布?X1到Xn是iid。

要估计该总和的分布,您可以通过替换重复采样(然后从
采样数据
中获取
n
变量的总和)。(
sample()
sample\u数据
的每个元素上放置相等的概率质量,就像ecdf一样,因此不需要计算
ecdf(sample\u数据)
作为中间步骤。)

#创建一些示例数据

样本数据首先,推广和简化:求解阶跃函数CDFs X和Y,独立但不相同分布。对于每一步跳席和每一步跳彝,在X+Y的CDF中都会出现相应的席跃跳,所以X+Y的CDF将被列表的特征:

sorted(x + y for x in X for y in Y)
这意味着如果X的CDF中有k个点,那么(X1+…+Xn)中就有kn。我们可以通过再次丢弃k以外的所有数据,最终将其减少到一个可管理的数字,但很明显,中间计算在时间和空间上都是昂贵的

另外,请注意,即使原始CDF是X的ECDF,结果也不会是(X1+…+Xn)的ECDF,即使保留所有kn点


总之,使用Josh的解决方案。

等等……你有
n
随机变量(谁知道它们是否是iid),你想找到它们的和的分布?没有更多的信息,我不相信有办法确定这些变量和的分布。所以,我选取了两个iid随机变量…告诉我它们的和是如何分布的。好吧,只是为了理解:你有一些数据,用经验分布估计一个分布函数,称这个分布为
X
,现在想用
I=1,
sum(X_I)
计算分布,。。。,n
对于给定的
n
X_i~X
?因此,我选择了两个iid随机变量,让我们称它们为
X
Y
(为了简单起见,
n==2
)。告诉我
X+Y
是如何分发的。
sorted(x + y for x in X for y in Y)