R 正态性检验结果解释
我有一个需要查找的数据集R 正态性检验结果解释,r,R,我有一个需要查找的数据集 如果分布是正态的 在均值和中位数之间,什么应该准确地代表分布的中心趋势 在本教程之后,我做了以下工作 密度图 > shapiro.test(sample(df[[colName]],5000)) Shapiro-Wilk normality test data: sample(df[[colName]], 5000) W = 0.86463, p-value < 0.00000000000000022 > ad.test(df[[col
> shapiro.test(sample(df[[colName]],5000))
Shapiro-Wilk normality test
data: sample(df[[colName]], 5000)
W = 0.86463, p-value < 0.00000000000000022
> ad.test(df[[colName]])
Anderson-Darling normality test
data: df[[colName]]
A = 213650, p-value < 0.00000000000000022
Q-Q图
> shapiro.test(sample(df[[colName]],5000))
Shapiro-Wilk normality test
data: sample(df[[colName]], 5000)
W = 0.86463, p-value < 0.00000000000000022
> ad.test(df[[colName]])
Anderson-Darling normality test
data: df[[colName]]
A = 213650, p-value < 0.00000000000000022
Shapiro-Wilk测试
> shapiro.test(sample(df[[colName]],5000))
Shapiro-Wilk normality test
data: sample(df[[colName]], 5000)
W = 0.86463, p-value < 0.00000000000000022
> ad.test(df[[colName]])
Anderson-Darling normality test
data: df[[colName]]
A = 213650, p-value < 0.00000000000000022
>shapiro.test(样本(df[[colName]],5000))
夏皮罗-威尔克正态性检验
数据:样本(df[[colName]],5000)
W=0.86463,p值<0.00000000000000022
安德森-达林测试
> shapiro.test(sample(df[[colName]],5000))
Shapiro-Wilk normality test
data: sample(df[[colName]], 5000)
W = 0.86463, p-value < 0.00000000000000022
> ad.test(df[[colName]])
Anderson-Darling normality test
data: df[[colName]]
A = 213650, p-value < 0.00000000000000022
>ad.test(df[[colName]])
安德森-达林正态性检验
数据:df[[colName]]
A=213650,p值<0.00000000000000022
我所理解的一般指导是,如果p值大于0.05,则基本分布为正态的假设是正确的
在上面的测试中,我得到的p值是
p-value<0.00000000000000022
,而不是一个精确的值。我如何解释这一点?我应该用平均值还是中位数来表示分布的中心趋势?这不是一个关于R的问题,你会从任何统计语言中得到类似的结果。也就是说
在这个问题上我们可以犯两种错误。如果这个分布真的是正态的,我们就可以错误地得出这个分布不是正态的结论。如果分布不正态,我们就可能错误地认为它是正态的。这些错误分别称为类型1和类型2错误。现在,如果分布是正态的,我们对数据的行为有了很好的了解——至少是渐进的。如果真实分布不是正态分布,我们就不能说它的行为。也许它实际上是一个df=100的t分布——这看起来很像正常,尽管从技术上讲它不是正常的。它可能是指数,对数正态,伽马,。。。“不正常”不说它是什么,只说它不是什么(不正常)
由于这种不对称性,这些测试的想法如下: