Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/72.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 用t检验求两个向量中观测状态的pv值_R_P Value - Fatal编程技术网

R 用t检验求两个向量中观测状态的pv值

R 用t检验求两个向量中观测状态的pv值,r,p-value,R,P Value,我计划在网络数据上使用它 我的网络有两种边。 我编写了一个函数,分别返回这两种边类型的indegree,让您看看它是什么样子: Node G_obs R_obs 1 N1 3 2 2 N2 1 0 3 N3 9 0 4 N4 1 4 5 N5 1 0 ... 我还编写了另一个函数,对网络边缘进行采样。以下是这之后的情况: Node G

我计划在网络数据上使用它

我的网络有两种边。 我编写了一个函数,分别返回这两种边类型的indegree,让您看看它是什么样子:

    Node    G_obs   R_obs
1   N1      3       2
2   N2      1       0
3   N3      9       0
4   N4      1       4
5   N5      1       0
...
我还编写了另一个函数,对网络边缘进行采样。以下是这之后的情况:

    Node    G_obs   R_obs
1   N1      4       1
2   N2      1       0
3   N3      3       6
4   N4      3       2
5   N5      1       0
...
注意,G_obs+R_obs,即节点的索引保持不变

我想知道每个节点的pValue,以便在G_obs和R_obs之间分割最初观察到的indegree

编辑: 对不起,这似乎有点太不清楚了。 我不想要观察到的分布的行概率。 我想要观察到的G_obs的概率,R_obs为每个节点分割,其中sample(G_obs)+sample(R_obs)对节点的和仍然与之前相同。 下次我应该找一位英语为母语的人商量更好的措辞。。希望我现在能更清楚地描述这个问题:(

编辑2

观察:

    Node    G_obs   R_obs
1   N1      3       2
2   N2      1       0
3   N3      9       0
4   N4      1       4
5   N5      1       0
如你所见,N1有5条边缘。其中3条是绿色(G_obs),2条是红色(R_obs)

对于所示的5个节点,我们总共有15条绿色边和6条红色边。 现在,我们“采样”所有绿色和红色边,也就是将它们重新分布在指定的列中-但同时,N1仍有5条边。(参见上面的采样示例,其中

    Node    G_obs   R_obs
1   N1      4       1
...
我已经有了一个正确提供“采样”的函数(此函数的占位符:
mySample(graph)
),并且需要一个函数来获取mySample,使用它(例如1000次),并计算每个节点原始观测的可能性

谢谢你的帮助
谢谢你

听起来你在追求一个二项式概率(在两种类型之间随机划分边将产生与最初观察到的相同分布的概率)

您可以使用
dbinom()
函数计算这些概率:

transform(
  df,
  prob_same = dbinom(G_obs, G_obs + R_obs, prob = .5)
)
数据

df <- read.table(
  text = "
   Node    G_obs   R_obs
N1      3       2
N2      1       0
N3      9       0
N4      1       4
N5      1       0
  ",
  header = TRUE
)

df感谢您提供了快速的答案和简短的方法!什么是
prob=.5
do?您能解释一下这个值吗?
prob=.5
只是指出,当在G_obs和R_obs之间随机放置边时,给定边是G_obs的概率是0.5。该方法在所有可能的d之间计算prob_是否正确通过只看这一行来分配每一行,还是它也考虑了所有其他的边?(我需要后者)你最初的问题要求Pvalue(我读作“概率”)每个节点的概率。上面的解决方案给出了每个节点的一个概率。您是否在寻找所有节点都具有相同分布的单一概率?您的解释正确,但我想知道您的答案是按行计算还是像应用t.test一样,其中每行获得一个pValue,但仍然使用整列计算。它是很难得到-很抱歉。在这样的时候,我错过了下午的后续问题