C Loadrunner分析:第90个百分位如何高于平均值?

C Loadrunner分析:第90个百分位如何高于平均值?,c,performance-testing,loadrunner,percentile,vugen,C,Performance Testing,Loadrunner,Percentile,Vugen,有点困惑。我有一些Loadrunner分析来自我运行的报告。我是测试新手。我对第90百分位的理解是,考虑到它采用了第90百分位并剔除了异常值,它呈现了一个更真实的画面。虽然我在看两份不同的报告,但在这两份报告中,第90个百分位的响应时间高于总结报告中给出的平均响应时间。这怎么可能呢 我正在查看事务响应时间(百分位)的图表和最后10%的增长,因此告诉我,使用90%应该会看到较低的响应时间 Example Transaction 1 Min 0.012 Avg 1.919 Max 20.935

有点困惑。我有一些Loadrunner分析来自我运行的报告。我是测试新手。我对第90百分位的理解是,考虑到它采用了第90百分位并剔除了异常值,它呈现了一个更真实的画面。虽然我在看两份不同的报告,但在这两份报告中,第90个百分位的响应时间高于总结报告中给出的平均响应时间。这怎么可能呢

我正在查看事务响应时间(百分位)的图表和最后10%的增长,因此告诉我,使用90%应该会看到较低的响应时间

 Example
Transaction 1

Min 0.012
Avg 1.919
Max 20.935
SD 2.718
90 Percentile 6.412

很多交易或多或少都是这样的。为什么第90个百分位高于平均值?

第90个百分位意味着90%的值低于该值。本例中的值是您的响应时间。因此,如果你有1000个值,而第90个百分位是
n
,那么其中900个值将低于
n
,而只有100个值高于
n
——因此,平均值小于第90个百分位是有意义的。

中值是第50个百分位。它将始终低于第90百分位。如果你的数据集有一小部分非常长,将整个数据集的平均值拖得更高,那么平均值实际上可能高于第90个百分位数。

Giles说: “第90百分位表示90%的值低于此值。本例中的值是您的响应时间。因此,如果您有1000个值,而第90百分位为n,则其中900个值低于n,而只有100个值高于n,因此,平均值低于第90百分位是有意义的。” 对不起,我不明白这有什么意义。我会说,如果你去掉最长的回答,剩下的是更短的回答时间,所以在这种情况下,当你计算较小数字的平均值时,你会得到一个更小的值:90%的分数总是小于平均值,这当然不是事实

90%不是为了显示网站如何为90%的客户提供服务而发明的吗?所以,收集所有最常发生的结果,并切断一些罕见的极端情况(两端),这些情况并不经常发生?这可以解释为什么loadrunner的平均输出几乎总是小于90%。 ? 我认为这就是它的工作原理:
平均值与n-分位数/中位数/四分位数/百分位数非常不同

可以设置一组平均值>中位数,甚至第90百分位<平均值的a值。 他们只是不一样

看到这个了吗

人们对他们的数据所做的一般假设依赖于一个未说的假设,即数据遵循一个中心分布,平均值~=中位数(如高斯分布)

看看幂律/帕累托定律,看看这个假设有多错误。 这同样适用于多模式分布。 在没有适当分析的情况下,不要做这样的假设是至关重要的,否则这只是某种“数据胡说八道”


(顺便说一句,这就是为什么平均收入比平均收入提供的信息要少)

我想这意味着90%的时间小于6.412,这似乎与平均值和标准差一致。换句话说,第90百分位应该与最大值进行比较/对比,而不是平均值。@user3386109谢谢,我在HP论坛上看到的印象是,应该与平均值进行比较。关于平均值和百分位的相关问题:嗨,非常感谢。我对第90个百分位数的最初理解是,这个数字是通过将所有响应时间从最低到最高排序计算出来的,将前90%的响应时间从最低到最高,丢弃最后10%(即丢弃最高响应时间),然后平均剩余响应时间。这就是为什么我认为第90个百分位数会低于平均值,因为它消除了所有一次性的高响应时间。对不起,如果这不合理的话。你的答案很清楚。第90百分位值能等于最大值吗?i、 e.第90百分位和第100百分位是否相同?否。您的图像显示忽略了最快的几个值和最慢的几个值,留下中间90%的值。我想你建议取他们的平均值。这不是第90个百分位数。再次阅读@gilez的答案。第90百分位意味着删除最慢的10%的值,并报告剩余值中最慢的。即,90%的值比第90个百分位值快。