R 使用循环检查多列中是否存在某些值
我的数据集包含多个列,其中有6个称为ID1、ID2、ID3、ID13、ID23、ID33,其中包含多个ID。我的目标是检查哪些行包含某些值(本例中的值以531或532或533或534开头),并将这些值子集到新的数据集中 这段代码为所有行的数据子集,其中任何一列中的ID正好是531,但我不知道如何使其只检查从531开始的值,以及如何使其检查所有4个起始值:531、532、533和534(不使用更多的条件语句) 对于格式设置,我深表歉意(确实缺少一些数据点)R 使用循环检查多列中是否存在某些值,r,R,我的数据集包含多个列,其中有6个称为ID1、ID2、ID3、ID13、ID23、ID33,其中包含多个ID。我的目标是检查哪些行包含某些值(本例中的值以531或532或533或534开头),并将这些值子集到新的数据集中 这段代码为所有行的数据子集,其中任何一列中的ID正好是531,但我不知道如何使其只检查从531开始的值,以及如何使其检查所有4个起始值:531、532、533和534(不使用更多的条件语句) 对于格式设置,我深表歉意(确实缺少一些数据点) 感谢虽然您的问题有点不清楚(我不确定在此
感谢虽然您的问题有点不清楚(我不确定在此之后您想对这些行执行什么操作..您可以使用
all
或至少一个使用any
选择所有id列均为TRUE
的行):
如果您想保留至少有1个TRUE
的行(似乎是这样的,因为在代码段中您确实执行了|
),那么您可以简单地执行
dt[dt2[,rowSums(.SD)>=1]]
# id1 id2 id3
#1: 528 529 532
#2: 532 531 534
#3: 535 530 530
#4: 534 525 533
#5: 531 534 528
#6: 525 526 531
#7: 527 532 526
#8: 533 533 525
#9: 529 535 535
您想要一个数据集,该数据集只包含那些在所有三列中都包含其中一个值的行,还是至少包含一个值?我想我会使用
grepl
。建议包括样本数据和所需的输出。因此我只想将行保留在另一个较小的子集中,以便我可以计算和处理这些观察结果。我想保持原始的ID值。谢谢你的帮助。根据我的回答,不清楚你想保留哪一行
Sample Data
ID1 ID2 ID3 ID13 ID23 ID33
43645 38894 37338 45617 54419 42716
53123 24277 5323 29160
22821 26091 46100 65324 22179 12367
47946 59421
1954 9544
63534 53244 4771
59080 32532 41460 34562 15722
30542 11477 13211 11739 26753
29331 5311 7079 534424 5322
Desired Output
ID1 ID2 ID3 ID13 ID23 ID33
53123 24277 5323 29160
63534 53244 4771
29331 5311 7079 534424 5322
require(data.table)
set.seed(123)
dt = data.table(id1 = sample(525:535), id2=sample(525:535), id3=sample(525:535))
dt2=dt[,lapply(.SD, FUN = function(z) {z >= 531})]
# id1 id2 id3
# 1: FALSE FALSE TRUE
# 2: TRUE TRUE TRUE
# 3: TRUE FALSE FALSE
# 4: TRUE FALSE TRUE
# 5: TRUE TRUE FALSE
# 6: FALSE FALSE TRUE
# 7: FALSE TRUE FALSE
# 8: TRUE TRUE FALSE
# 9: FALSE FALSE FALSE
#10: FALSE FALSE FALSE
#11: FALSE TRUE TRUE
dt[dt2[,rowSums(.SD)>=1]]
# id1 id2 id3
#1: 528 529 532
#2: 532 531 534
#3: 535 530 530
#4: 534 525 533
#5: 531 534 528
#6: 525 526 531
#7: 527 532 526
#8: 533 533 525
#9: 529 535 535