R 如果是按组-检查下一行中的值
以下是一个df示例:R 如果是按组-检查下一行中的值,r,tidyverse,R,Tidyverse,以下是一个df示例: test_df <- structure(list(plant_sp = c("plant_1", "plant_1", "plant_2", "plant_2", "plant_3", "plant_3", "plant_3", "plant
test_df <- structure(list(plant_sp = c("plant_1", "plant_1", "plant_2", "plant_2", "plant_3",
"plant_3", "plant_3", "plant_3", "plant_3", "plant_4",
"plant_4", "plant_4", "plant_4", "plant_4", "plant_4",
"plant_5", "plant_5", "plant_5", "plant_5", "plant_5"),
sp_rich = c(1, 1, NA, 1, NA,
1, 0, 0, NA, 0,
0, 1, 0, 0, 1,
0, NA, NA, 0,NA)),
row.names = c(NA, -20L), class = "data.frame",
.Names = c("plant_sp", "sp_rich"))
但我不知道如何引用列sp_rich
中的值,而是在下一行(在组中)
例如:
test_df <- structure(list(plant_sp = c("plant_1", "plant_1", "plant_2", "plant_2", "plant_3",
"plant_3", "plant_3", "plant_3", "plant_3", "plant_4",
"plant_4", "plant_4", "plant_4", "plant_4", "plant_4",
"plant_5", "plant_5", "plant_5", "plant_5", "plant_5"),
sp_rich = c(1, 1, NA, 1, NA,
1, 0, 0, NA, 0,
0, 1, 0, 0, 1,
0, NA, NA, 0,NA)),
row.names = c(NA, -20L), class = "data.frame",
.Names = c("plant_sp", "sp_rich"))
如果第4行的sp\u rich
下有空行,我希望值“1”位于第3行的is\u na\u nest\u row
下
非常感谢,
Ido测试_df%>%
分组依据(工厂sp)%>%
mutate(is_na_nest_row=+any(is.na(sp_rich)))
##tibble:20 x 3
##组:植物#sp[5]
#植物sp sp丰富,是一排植物
#
#1工厂1 10
#2工厂1 1 0
#3工厂2 NA 1
#4工厂2 1 1
#5工厂3 NA 1
#6工厂3 1 1
#7工厂3 0 1
#8工厂3 0 1
#9工厂3 NA 1
#10工厂4 0 0
#11工厂4 0 0
#12工厂4 1 0
#13工厂4 0 0
#14工厂4 0 0
#15工厂4 1 0
#16工厂5 0 1
#17工厂5 NA 1
#18工厂5 NA 1
#19工厂5 0 1
#20工厂5 NA 1
或者如果只是下一排
test_df%>%
分组依据(工厂sp)%>%
mutate(is_na_nest_row=+(lead(is.na(sp_rich),default=FALSE)))
##tibble:20 x 3
##组:植物#sp[5]
#植物sp sp丰富,是一排植物
#
#1工厂1 10
#2工厂1 1 0
#3植物2钠0
#4工厂2 1 0
#5植物3钠0
#6工厂3 1 0
#7工厂3 0 0
#8工厂3 0 1
#9植物3钠0
#10工厂4 0 0
#11工厂4 0 0
#12工厂4 1 0
#13工厂4 0 0
#14工厂4 0 0
#15工厂4 1 0
#16工厂5 0 1
#17工厂5 NA 1
#18植物5钠0
#19工厂5 0 1
#20植物5钠0
编辑:现在应该可以正常工作了
您可以使用mutate
中的row\u number()
访问下一行。所以我认为这是正确的解决方案
test_df %>% group_by(plant_sp) %>% mutate(Test = ifelse(is.na(sp_rich[row_number() + 1]), 1, 0), Test = c(Test[-n()], 0)))
有输出
# A tibble: 20 x 3
# Groups: plant_sp [5]
plant_sp sp_rich Test
<chr> <dbl> <dbl>
1 plant_1 1 0
2 plant_1 1 0
3 plant_2 NA 0
4 plant_2 1 0
5 plant_3 NA 0
6 plant_3 1 0
7 plant_3 0 0
8 plant_3 0 1
9 plant_3 NA 0
10 plant_4 0 0
11 plant_4 0 0
12 plant_4 1 0
13 plant_4 0 0
14 plant_4 0 0
15 plant_4 1 0
16 plant_5 0 1
17 plant_5 NA 1
18 plant_5 NA 0
19 plant_5 0 1
20 plant_5 NA 0
#一个tible:20x3
#组别:植物组[5]
工厂sp富sp测试
1工厂1 10
2工厂1 1 0
3植物2钠0
4工厂2 1 0
5植物3钠0
6工厂3 1 0
7工厂3 0 0
8工厂3 0 1
9植物3钠0
10工厂4 0 0
11工厂4 0 0
12工厂4 1 0
13工厂4 0 0
14工厂4 0 0
15工厂4 1 0
16工厂5 0 1
17工厂5 NA 1
18植物5钠0
19工厂5 0 1
20植物5钠0
(1)如果您使用的是dplyr
,请改用If_else
,因为base::ifelse
有一些。(2) 坦白地说,这里不需要它,正如你所说的mutate(is_na_nest_row=+is.na(sp_rich))
可以获得相同的效果(虽然它是整数,而不是浮点)。它不会检查同一行中是否有na.value吗?例如,如果第4行的“sp_rich”下有空行,我希望值“1”在第3行。我添加了一个例子,因为我以前不清楚,谢谢!它不会检查同一行中是否有na.value吗?例如,如果第4行的“sp_rich”下有空行,我希望值“1”位于第3行。我已经添加了一个例子,因为我以前不清楚,谢谢!您知道,如果您提供了给定示例数据的实际预期输出,这将非常有帮助。它消除了大部分歧义。谢谢!问题是,我确实需要分组。例如,第2行的值为1,即使NA行位于另一组-“plant_2”。有没有一种方法可以通过小组来完成呢?是的,有,现在我认为应该可以了!请参阅新代码和输出。