R 为什么pgeom n参数值需要比我预期的少一个？_R

R 为什么pgeom n参数值需要比我预期的少一个？

R 为什么pgeom n参数值需要比我预期的少一个？,r,R,《头先统计》一书中有一个示例问题： 20%的谷类食品包装包含一个免费玩具。可能性有多大在找到你的食物之前，你需要打开少于4包的谷类食物第一个玩具工作解决方案如下所示： P(X ≤ 3) = 1 - q^r = 1 - 0.8^3 = 1 - 0.512 = 0.488 我希望使用以下R语句： > pgeom(3, 0.2) [1] 0.5904 但正如你所看到的，答案并不像预期的那样。n参数的正确值为2，如下所示： > pgeom(2, 0.2) [1] 0.488

《头先统计》一书中有一个示例问题：

20%的谷类食品包装包含一个免费玩具。可能性有多大在找到你的食物之前，你需要打开少于4包的谷类食物第一个玩具

工作解决方案如下所示：

P(X ≤ 3) 
= 1 - q^r
= 1 - 0.8^3
= 1 - 0.512 
= 0.488

我希望使用以下R语句：

> pgeom(3, 0.2)
[1] 0.5904

但正如你所看到的，答案并不像预期的那样。n参数的正确值为2，如下所示：

> pgeom(2, 0.2)
[1] 0.488

有人能解释一下为什么会出现这种情况，以及我对这种情况的错误思考吗？

我刚刚遇到了这种情况。我的教科书和pgeom使用不同的密度函数。根据文档，pgeom使用p（x）=p*（1-p）^x，我的书使用p（x）=p*（1-p）^（x-1）。大概Head First也使用了后一个公式。

问题是“少于4”

所以，如果你考虑最大的3次尝试，那么在你得到免费玩具之前，失败的次数是<代码> 2 < /代码>：

pgeom（q，prob，lower.tail=TRUE，log.p=FALSE）

：“在成功发生之前，代表贝努利试验序列中失败次数的分位数向量”

pgeom中的第一个参数是失败试验的次数

你的问题是问在不到4个包中找到玩具的可能性。所以你可以在包1、包2或包3中找到一个玩具。这意味着可能会发生1次或2次失败的试验，但不会发生3次（因为您的第3个数据包是成功事件）

附言：我正在上一门入门级的统计课程，遇到了类似的困惑。这就是我说服自己的原因。

你有没有想过？我很想知道答案，可惜我没有。