Statistics 意义V值,wilcoxen符号秩检验

Statistics 意义V值,wilcoxen符号秩检验,statistics,Statistics,我对威尔科克森签名排名测试的结果有一个疑问: 我的数据包括两组(配对)的试验,其中使用了一种治疗。结果以%计。小组由131人组成 在R中运行测试时,我得到以下结果: wilcox.test(no.treatment, with.treatment, paired=T) # Wilcoxon signed rank test with continuity correction # data: no.treatment and with.treatment V = 3832, p-value

我对威尔科克森签名排名测试的结果有一个疑问:

我的数据包括两组(配对)的试验,其中使用了一种治疗。结果以%计。小组由131人组成

在R中运行测试时,我得到以下结果:

wilcox.test(no.treatment, with.treatment, paired=T) 
# Wilcoxon signed rank test with continuity correction 
# data:  no.treatment and with.treatment V = 3832, p-value = 0.7958
# alternative hypothesis: true location shift is not equal to 0

我想知道
V
值是什么意思。我在某个地方读到,它与正分数(?)的数量有关,但我想知道它是否能告诉我有关数据和解释的任何信息?

在回答你的问题之前,我会给出一点背景知识

比较相同
N
人群(此处为131人)之间的两个值,例如,在两个时间点测量了131人的血液值。测试的目的是查看血液值是否发生了变化

您得到的
V
-统计数据没有直接的解释。此值基于两组中的个体之间的成对差异。它是一个变量的值,应该遵循一定的概率分布。直观地说,你可以说
V
的值越大,你抽样的两组之间的差异就越大

在假设检验中,您(嗯,
wilcox.test
函数)将计算该变量的值(
V
)等于或大于3832的概率
prob('观察到3832或更大的值,而组实际上是相同的)

如果两组之间确实没有差异,
V
的值将“接近零”。您看到的值
V
是否“接近零”取决于概率分布。该变量的概率分布并不简单,但幸运的是,这并不重要,因为
wilcoxon
知道该分布并为您计算概率(0.7958)

简言之 您的小组没有显著差异,
V
没有明确的解释

函数
wilcox.test()
产生的V统计值可在
R
中计算,如下所示:

# Create random data between -0.5 and 0.5
da_ta <- runif(1e3, min=-0.5, max=0.5)
# Perform Wilcoxon test using function wilcox.test()
wilcox.test(da_ta)
# Calculate the V statistic produced by wilcox.test()
sum(rank(abs(da_ta))[da_ta > 0])
# Calculate the Wilcoxon W statistic
sum(sign(da_ta) * rank(abs(da_ta)))

上述统计数据可与Wilcoxon概率分布进行比较,以获得p值。Wilcoxon分布没有简单的公式,但可以使用蒙特卡罗模拟进行模拟。

V的值并不意味着正分数的数量,而是这些正分数的总和。 此外,还有一个测量负分数总和的方法,这项测试没有提供。以下示例中提供了一个用于计算正分数和负分数总和的简短脚本:

a <- c(214, 159, 169, 202, 103, 119, 200, 109, 132, 142, 194, 104, 219, 119, 234)
b <- c(159, 135, 141, 101, 102, 168, 62, 167, 174, 159, 66, 118, 181, 171, 112)

diff <- c(a - b) #calculating the vector containing the differences
diff <- diff[ diff!=0 ] #delete all differences equal to zero
diff.rank <- rank(abs(diff)) #check the ranks of the differences, taken in absolute
diff.rank.sign <- diff.rank * sign(diff) #check the sign to the ranks, recalling the signs of the values of the differences
ranks.pos <- sum(diff.rank.sign[diff.rank.sign > 0]) #calculating the sum of ranks assigned to the differences as a positive, ie greater than zero
ranks.neg <- -sum(diff.rank.sign[diff.rank.sign < 0]) #calculating the sum of ranks assigned to the differences as a negative, ie less than zero
ranks.pos #it is the value V of the wilcoxon signed rank test
[1] 80
ranks.neg
[1] 40

aI也对这个看似神秘的“V”统计数据感到困惑。我意识到这里已经有一些有用的答案,但当我第一次读到它们时,我并没有真正理解它们。所以我在这里再次解释它,以一种我最终理解它的方式。希望它能帮助其他人,如果他们仍然感到困惑的话

V-统计量是分配给具有正号的差异的秩和。也就是说,当您运行Wilcoxon符号秩检验时,它会计算负秩和(W-)和正秩和(W+)。检验统计量(W)通常是(W-)或(W+)中的最小值,然而V统计量只是(W+)

为了理解这一点的重要性,如果零假设为真,(W+)和(W-)将是相似的。这是因为给定样本数(n),您的(W+)和(W-)将有一个最大可能的组合值,或者,(W+)(W-)=n(n+1)/2。如果这个最大值被稍微均匀地划分,那么成对样本集之间就没有太大差异,我们接受空值。如果(W+)和(W-)之间存在较大差异,则配对样本集之间存在较大差异,并且我们有证据支持替代假设。差异程度及其重要性与W的临界值图有关

这里有一些特别有用的网站,可以查看这个概念是否仍然是100%:

1.)

(二)

(三)


TLDR;在(W+)是(W+)或(W-)中的较小者的情况下,R报告的V-统计与W-统计相同。

此问题属于打开状态,因为它涉及的是一个与编程无关的统计问题。非常感谢!真的很有帮助:)我必须在文章中报告V值吗?