Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/67.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/apache-flex/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
将每n个观测值与R中2个数据帧中的第i组观测值进行比较_R - Fatal编程技术网

将每n个观测值与R中2个数据帧中的第i组观测值进行比较

将每n个观测值与R中2个数据帧中的第i组观测值进行比较,r,R,我想比较两个数据帧。一个数据帧具有400k观测值,另一个数据帧具有100k观测值。我想比较2中较短的一组中的每一个观察结果与较大序列中的每一组4。换句话说,b中的第一个观测值较短,a中的前4个观测值较大,b中的第二个观测值第二组为a中的4个观测值。。。我想数一数比赛的次数 c = 0 x = 0 d = 1 e = 4 for (x in b) { if(a[d:e,1] = x){ c+1 } x=x+1 d=d+4 e=e+4 }

我想比较两个数据帧。一个数据帧具有400k观测值,另一个数据帧具有100k观测值。我想比较2中较短的一组中的每一个观察结果与较大序列中的每一组4。换句话说,b中的第一个观测值较短,a中的前4个观测值较大,b中的第二个观测值第二组为a中的4个观测值。。。我想数一数比赛的次数

c = 0
x = 0
d = 1
e = 4

for (x in b) {
    if(a[d:e,1] = x){
        c+1
    }
    x=x+1
    d=d+4
    e=e+4
}

我试图解决你下面的问题,但有点困难,因为你的问题有点模糊。看看这个关于如何写一个好问题的指导

我希望这段代码能帮助你走上正轨

图书馆弹琴 > >正在附加包:“dplyr” >以下对象已从“package:stats”屏蔽: > >滤波器,滞后 >以下对象已从“package:base”屏蔽: > >相交、setdiff、setequal、并集 创建两个具有指定尺寸的数据框 第123集 大样本 > 1 29 > 2 79 > 3 41 > 4 89 > 5 95 > 6 5 小样本 > 1 99 > 2 14 > 3 91 > 4 58 > 5 40 > 6 45 每4行创建一个组索引列 a_大_df% 4指数的突变组合=大指数df-1%/%4 头大 >样本是一组索引 > 1 29 0 > 2 79 0 > 3 41 0 > 4 89 0 > 5 95 1 > 6 5 1 从0开始,每行创建一个索引列以匹配上面的内容 b_小型_df% 指数的突变组合=序列号b小的df-1 头小 >样本4指数的b组 > 1 99 0 > 2 14 1 > 3 91 2 > 4 58 3 > 5 40 4 > 6 45 5 通过索引组合两个数据帧 a_b_df样本a_4_索引样本的组 > 1 29 0 99 > 2 79 0 99 > 3 41 0 99 > 4 89 0 99 > 5 95 1 14 > 6 5 1 14 检查每组样本的值是否匹配,如果匹配,则标记为是 a_b_df% 分组指数%>% mutatematch=如果在%sample\u b中有其他样本a%,则为是,否 头A_b_df >一个tibble:6x4 >组别:组别4组别索引[2] >样本a组样本4索引样本b匹配 > >129099号 >279099号 >3410099号 >489099号 >595114号 >65114号 表A_b_df$匹配 > >不,是的 > 392 8
如何防止重复?我不能在样本函数中的每组4中重复任何数字,将replace改为FALSE,例如sample1:100100,FALSE,我试过了。它抛出了一个错误。我需要生产n 1:10100000我不太确定你在找什么。你能说得更具体些吗。repsample1:10,4,FALSE,25000将从1:10生成4个数字的随机样本,无需替换。然后将该采样重复25000次,以产生总长度为100000的向量。如果您需要其他帮助,请提供实际代码的详细信息。谢谢我需要2个数据帧,两个数据帧都是1:10 1的非重复数字,一组是4,另一个是很好的,只是你设置它的方式。