将每n个观测值与R中2个数据帧中的第i组观测值进行比较_R

将每n个观测值与R中2个数据帧中的第i组观测值进行比较

将每n个观测值与R中2个数据帧中的第i组观测值进行比较,r,R,我想比较两个数据帧。一个数据帧具有400k观测值，另一个数据帧具有100k观测值。我想比较2中较短的一组中的每一个观察结果与较大序列中的每一组4。换句话说，b中的第一个观测值较短，a中的前4个观测值较大，b中的第二个观测值第二组为a中的4个观测值。。。我想数一数比赛的次数 c = 0 x = 0 d = 1 e = 4 for (x in b) { if(a[d:e,1] = x){ c+1 } x=x+1 d=d+4 e=e+4 }

我想比较两个数据帧。一个数据帧具有400k观测值，另一个数据帧具有100k观测值。我想比较2中较短的一组中的每一个观察结果与较大序列中的每一组4。换句话说，b中的第一个观测值较短，a中的前4个观测值较大，b中的第二个观测值第二组为a中的4个观测值。。。我想数一数比赛的次数

c = 0
x = 0
d = 1
e = 4

for (x in b) {
    if(a[d:e,1] = x){
        c+1
    }
    x=x+1
    d=d+4
    e=e+4
}

我试图解决你下面的问题，但有点困难，因为你的问题有点模糊。看看这个关于如何写一个好问题的指导

我希望这段代码能帮助你走上正轨

图书馆弹琴 > >正在附加包：“dplyr” >以下对象已从“package:stats”屏蔽： > >滤波器，滞后 >以下对象已从“package:base”屏蔽： > >相交、setdiff、setequal、并集创建两个具有指定尺寸的数据框第123集大样本 > 1 29 > 2 79 > 3 41 > 4 89 > 5 95 > 6 5 小样本 > 1 99 > 2 14 > 3 91 > 4 58 > 5 40 > 6 45 每4行创建一个组索引列 a_大_df% 4指数的突变组合=大指数df-1%/%4 头大 >样本是一组索引 > 1 29 0 > 2 79 0 > 3 41 0 > 4 89 0 > 5 95 1 > 6 5 1 从0开始，每行创建一个索引列以匹配上面的内容 b_小型_df% 指数的突变组合=序列号b小的df-1 头小 >样本4指数的b组 > 1 99 0 > 2 14 1 > 3 91 2 > 4 58 3 > 5 40 4 > 6 45 5 通过索引组合两个数据帧 a_b_df样本a_4_索引样本的组 > 1 29 0 99 > 2 79 0 99 > 3 41 0 99 > 4 89 0 99 > 5 95 1 14 > 6 5 1 14 检查每组样本的值是否匹配，如果匹配，则标记为是 a_b_df% 分组指数%>% mutatematch=如果在%sample\u b中有其他样本a%，则为是，否头A_b_df >一个tibble:6x4 >组别：组别4组别索引[2] >样本a组样本4索引样本b匹配 > >129099号 >279099号 >3410099号 >489099号 >595114号 >65114号表A_b_df$匹配 > >不，是的 > 392 8

如何防止重复？我不能在样本函数中的每组4中重复任何数字，将replace改为FALSE，例如sample1:100100，FALSE，我试过了。它抛出了一个错误。我需要生产n 1:10100000我不太确定你在找什么。你能说得更具体些吗。repsample1:10，4，FALSE，25000将从1:10生成4个数字的随机样本，无需替换。然后将该采样重复25000次，以产生总长度为100000的向量。如果您需要其他帮助，请提供实际代码的详细信息。谢谢我需要2个数据帧，两个数据帧都是1:10 1的非重复数字，一组是4，另一个是很好的，只是你设置它的方式。