R 用t检验求两个向量中观测状态的pv值
我计划在网络数据上使用它 我的网络有两种边。 我编写了一个函数,分别返回这两种边类型的indegree,让您看看它是什么样子:R 用t检验求两个向量中观测状态的pv值,r,p-value,R,P Value,我计划在网络数据上使用它 我的网络有两种边。 我编写了一个函数,分别返回这两种边类型的indegree,让您看看它是什么样子: Node G_obs R_obs 1 N1 3 2 2 N2 1 0 3 N3 9 0 4 N4 1 4 5 N5 1 0 ... 我还编写了另一个函数,对网络边缘进行采样。以下是这之后的情况: Node G
Node G_obs R_obs
1 N1 3 2
2 N2 1 0
3 N3 9 0
4 N4 1 4
5 N5 1 0
...
我还编写了另一个函数,对网络边缘进行采样。以下是这之后的情况:
Node G_obs R_obs
1 N1 4 1
2 N2 1 0
3 N3 3 6
4 N4 3 2
5 N5 1 0
...
注意,G_obs+R_obs,即节点的索引保持不变
我想知道每个节点的pValue,以便在G_obs和R_obs之间分割最初观察到的indegree
编辑:
对不起,这似乎有点太不清楚了。
我不想要观察到的分布的行概率。
我想要观察到的G_obs的概率,R_obs为每个节点分割,其中sample(G_obs)+sample(R_obs)对节点的和仍然与之前相同。
下次我应该找一位英语为母语的人商量更好的措辞。。希望我现在能更清楚地描述这个问题:(
编辑2
观察:
Node G_obs R_obs
1 N1 3 2
2 N2 1 0
3 N3 9 0
4 N4 1 4
5 N5 1 0
如你所见,N1有5条边缘。其中3条是绿色(G_obs),2条是红色(R_obs)
对于所示的5个节点,我们总共有15条绿色边和6条红色边。
现在,我们“采样”所有绿色和红色边,也就是将它们重新分布在指定的列中-但同时,N1仍有5条边。(参见上面的采样示例,其中
Node G_obs R_obs
1 N1 4 1
...
我已经有了一个正确提供“采样”的函数(此函数的占位符:mySample(graph)
),并且需要一个函数来获取mySample,使用它(例如1000次),并计算每个节点原始观测的可能性
谢谢你的帮助
谢谢你听起来你在追求一个二项式概率(在两种类型之间随机划分边将产生与最初观察到的相同分布的概率) 您可以使用
dbinom()
函数计算这些概率:
transform(
df,
prob_same = dbinom(G_obs, G_obs + R_obs, prob = .5)
)
数据
df <- read.table(
text = "
Node G_obs R_obs
N1 3 2
N2 1 0
N3 9 0
N4 1 4
N5 1 0
",
header = TRUE
)
df感谢您提供了快速的答案和简短的方法!什么是prob=.5
do?您能解释一下这个值吗?prob=.5
只是指出,当在G_obs和R_obs之间随机放置边时,给定边是G_obs的概率是0.5。该方法在所有可能的d之间计算prob_是否正确通过只看这一行来分配每一行,还是它也考虑了所有其他的边?(我需要后者)你最初的问题要求Pvalue(我读作“概率”)每个节点的概率。上面的解决方案给出了每个节点的一个概率。您是否在寻找所有节点都具有相同分布的单一概率?您的解释正确,但我想知道您的答案是按行计算还是像应用t.test一样,其中每行获得一个pValue,但仍然使用整列计算。它是很难得到-很抱歉。在这样的时候,我错过了下午的后续问题