如何在R中找到最后一列的值(每行)?

如何在R中找到最后一列的值(每行)?,r,na,R,Na,假设有一个包含多个度量值的数据帧,其中缺少一些度量值。如果缺少该值,则以下所有测量值也将丢失。如何找到最后的测量值 df <- data.frame(id = c(1, 2, 3, 4), m_1 = c('a', 'b', 'c', 'd'), m_2 = c('e', NA, 'g', 'h'), m_3 = c('i', NA, NA, 'l')) df id m_1 m_2 m_3 [1] 1 a e i [2] 2 b

假设有一个包含多个度量值的数据帧,其中缺少一些度量值。如果缺少该值,则以下所有测量值也将丢失。如何找到最后的测量值

df <- data.frame(id = c(1, 2, 3, 4), m_1 = c('a', 'b', 'c', 'd'), m_2 = c('e', NA, 'g', 'h'), m_3 = c('i', NA, NA, 'l'))

df
    id   m_1   m_2   m_3
[1]  1     a     e     i
[2]  2     b  <NA>  <NA>
[3]  3     c     g  <NA>
[4]  4     d     h     l

df一个选项是
max.col
from
base R
,用于获取存在非NA元素的每行的列索引。
ties.method
可以是
“random”
“first”
“last”
。由于我们希望
last
非NA,请将
的“last”
指定为
ties.method

df$m <- names(df)[-1][max.col(!is.na(df[-1]), 'last')]
df$m
#[1] "m_3" "m_1" "m_2" "m_3"

也可以使用
tidyverse

library(dplyr)
df %>%
  rowwise %>% 
  mutate(m = {tmp <- c_across(starts_with('m'))
               tail(na.omit(tmp), 1)}) %>%
  ungroup
-输出

# A tibble: 4 x 6
#     id m_1   m_2   m_3   m_name m_value
#  <dbl> <chr> <chr> <chr> <chr>  <chr>  
#1     1 a     e     i     m_3    i      
#2     2 b     <NA>  <NA>  m_1    b      
#3     3 c     g     <NA>  m_2    g      
#4     4 d     h     l     m_3    l      
#一个tible:4 x 6
#id m_1 m_2 m_3 m_名称m_值
#          
#1 a e i m_3 i
#2亿立方米1亿立方米
#3立方厘米2立方厘米
#4 4 d h l m_3 l

也许这会有所帮助

> names(df)[rowSums(!is.na(df))]
[1] "m_3" "m_1" "m_2" "m_3"
library(tidyr)
df %>% 
   pivot_longer(cols = starts_with('m'), values_drop_na = TRUE, 
        names_to = "m_name", values_to = 'm_value') %>% 
   group_by(id) %>%
   slice_tail(n = 1)%>%
   ungroup %>% 
   right_join(df) %>% 
   select(names(df), everything())
# A tibble: 4 x 6
#     id m_1   m_2   m_3   m_name m_value
#  <dbl> <chr> <chr> <chr> <chr>  <chr>  
#1     1 a     e     i     m_3    i      
#2     2 b     <NA>  <NA>  m_1    b      
#3     3 c     g     <NA>  m_2    g      
#4     4 d     h     l     m_3    l      
> names(df)[rowSums(!is.na(df))]
[1] "m_3" "m_1" "m_2" "m_3"