R 一个变量在数据集中出现不止一次的概率

R 一个变量在数据集中出现不止一次的概率,r,probability,R,Probability,我正在研究一个数据集,其中有大约38000条关于YouTube视频趋势的观察结果。一个特定的视频可以有多个观察;这意味着一个视频可以趋势多次或超过一天 我们知道上面的说法是正确的,但我正试图找出如何计算视频在这个数据集中被观察到不止一次的概率P(X>1) 参考下图,我用条形图(头部(表(df$video_id))绘制了): 我们可以看出,在这6个视频中,有5个有一个以上的观察,这相当于83.33%的概率。如何在整个数据集上找出相同的结果?虽然我不一定要把它形象化(这将是一个额外的收获),但我只

我正在研究一个数据集,其中有大约38000条关于YouTube视频趋势的观察结果。一个特定的视频可以有多个观察;这意味着一个视频可以趋势多次或超过一天

我们知道上面的说法是正确的,但我正试图找出如何计算视频在这个数据集中被观察到不止一次的概率<代码>P(X>1)

参考下图,我用条形图(头部(表(df$video_id))绘制了

我们可以看出,在这6个视频中,有5个有一个以上的观察,这相当于83.33%的概率。如何在整个数据集上找出相同的结果?虽然我不一定要把它形象化(这将是一个额外的收获),但我只是好奇如何计算
视频id
在~38000次观察中发生一次以上的概率


以下是20个观察结果的示例:

您拥有您所需要的大部分:

tbl <- table(df$video_id)
p <- sum(tbl > 1)/length(tbl)
p
# [1] 0.5
barplot(c(p, 1-p))