base R summary()和summarytools descr()函数结果之间的奇数差异

base R summary()和summarytools descr()函数结果之间的奇数差异,r,statistics,package,summarytools,R,Statistics,Package,Summarytools,我有一个数字数据向量(下面的示例)。让我们将向量存储为x。当我运行summary(x)和descr(x)时,其中descr()来自summarytools包,我对最小值、中值、平均值和最大值有一致意见。但是,我的第一个和第三个四分位值不同。这是我第一次看到这两个函数结果之间的差异。你有没有想过为什么会发生这种情况,以及是如何发生的 我开始探索descr()源代码,但还没走多远,也没能访问summary()源代码,看看其中是否有区别。然而,当看到一些累积百分比时,我认为它们的分位数计算方式可能有所

我有一个数字数据向量(下面的示例)。让我们将向量存储为x。当我运行summary(x)和descr(x)时,其中descr()来自summarytools包,我对最小值、中值、平均值和最大值有一致意见。但是,我的第一个和第三个四分位值不同。这是我第一次看到这两个函数结果之间的差异。你有没有想过为什么会发生这种情况,以及是如何发生的

我开始探索descr()源代码,但还没走多远,也没能访问summary()源代码,看看其中是否有区别。然而,当看到一些累积百分比时,我认为它们的分位数计算方式可能有所不同

x = c(1132.1, 731.1, 851.2, 704.0, 226.3, 1703.6, 853.6, 821.4, 1192.9, 814.2, 880.2, 1270.8, 784.2, 606.5, 702.8, 863.6, 419.2, 1486.9, 1325.8, 493.2, 847.7, 552.5, 709.3, 508.3, 400.0, 711.4, 1161.5, 778.4, 626.2, 365.0, 329.1, 457.7, 446.2, 564.1, 376.9, 463.3, 239.7, 250.9, 266.5, 298.2, 186.2, 79.0, 149.9, 178.7, 79.4, 91.8, 12.6)
install.packages("")
library(summarytools)
descr(x)
summary(x)
使用descr()Q1=298.20和Q3=847.70 总结()Q1=313.6和Q3=834.5

当我运行freq(x)并查看累积百分比时,298.2为25.53%,821.4为74.47%,847.7为76.6%。因此,看起来descr()可能列出了最接近但不低于第一和第三个四分位数的x向量值

(821.4+847.7)/2=834.5

这与汇总的第三个四分位数相匹配,该四分位数不是向量值,但更接近估计的累积75%。仍然不确定summary()如何获得第1个四分位数的313.6。

请查看帮助页面以了解
?分位数。计算分位数有多种不同的方法,
descr()
使用
type=2
summary
使用默认值
type=7

> quantile(x, type = 2)
    0%    25%    50%    75%   100% 
  12.6  298.2  564.1  847.7 1703.6 
> quantile(x, type = 7)
     0%     25%     50%     75%    100% 
  12.60  313.65  564.10  834.55 1703.60  

谢谢@Marius!似乎我完全忘记了计算分位数的不同方法。summary()使用类型7是有意义的,因为它被列为默认方法。有趣的是,文档指出9种类型的发起者建议使用类型8,而类型7是默认的。