R 为什么pgeom n参数值需要比我预期的少一个?

R 为什么pgeom n参数值需要比我预期的少一个?,r,R,《头先统计》一书中有一个示例问题: 20%的谷类食品包装包含一个免费玩具。可能性有多大 在找到你的食物之前,你需要打开少于4包的谷类食物 第一个玩具 工作解决方案如下所示: P(X ≤ 3) = 1 - q^r = 1 - 0.8^3 = 1 - 0.512 = 0.488 我希望使用以下R语句: > pgeom(3, 0.2) [1] 0.5904 但正如你所看到的,答案并不像预期的那样。n参数的正确值为2,如下所示: > pgeom(2, 0.2) [1] 0.488

《头先统计》一书中有一个示例问题:

20%的谷类食品包装包含一个免费玩具。可能性有多大 在找到你的食物之前,你需要打开少于4包的谷类食物 第一个玩具

工作解决方案如下所示:

P(X ≤ 3) 
= 1 - q^r
= 1 - 0.8^3
= 1 - 0.512 
= 0.488
我希望使用以下R语句:

> pgeom(3, 0.2)
[1] 0.5904
但正如你所看到的,答案并不像预期的那样。n参数的正确值为2,如下所示:

> pgeom(2, 0.2)
[1] 0.488

有人能解释一下为什么会出现这种情况,以及我对这种情况的错误思考吗?

我刚刚遇到了这种情况。我的教科书和pgeom使用不同的密度函数。根据文档,pgeom使用p(x)=p*(1-p)^x,我的书使用p(x)=p*(1-p)^(x-1)。大概Head First也使用了后一个公式。

问题是“少于4”

所以,如果你考虑最大的3次尝试,那么在你得到免费玩具之前,失败的次数是<代码> 2 < /代码>:
pgeom(q,prob,lower.tail=TRUE,log.p=FALSE)

q
:“在成功发生之前,代表贝努利试验序列中失败次数的分位数向量”

pgeom中的第一个参数是失败试验的次数

你的问题是问在不到4个包中找到玩具的可能性。所以你可以在包1、包2或包3中找到一个玩具。这意味着可能会发生1次或2次失败的试验,但不会发生3次(因为您的第3个数据包是成功事件)


附言:我正在上一门入门级的统计课程,遇到了类似的困惑。这就是我说服自己的原因。

你有没有想过?我很想知道答案,可惜我没有。