&引用；散布；使用pivot_wider（）的多个变量_R_Tidyr

&引用；散布；使用pivot_wider（）的多个变量

&引用；散布；使用pivot_wider（）的多个变量,r,tidyr,R,Tidyr,在tidyr的开发版本中，使用pivot\u wide（）来“分散”多个变量的最佳方法是什么 # https://tidyr.tidyverse.org/dev/reference/pivot_wider.html # devtools::install_github("tidyverse/tidyr") library(tidyr) library(tidyverse) have <- tibble::tribble( ~user_id, ~question, ~answer, ~t

在

tidyr

的开发版本中，使用

pivot\u wide（）

来“分散”多个变量的最佳方法是什么

# https://tidyr.tidyverse.org/dev/reference/pivot_wider.html
# devtools::install_github("tidyverse/tidyr")
library(tidyr)
library(tidyverse)
have <- tibble::tribble(
  ~user_id, ~question, ~answer, ~timestamp,
  1, "q1", "a1", "2019-07-22 16:54:43",
  1, "q2", "a2", "2019-07-22 16:55:43",
  2, "q1", "a1", "2019-07-22 16:56:43",
  2, "q2", "a2", "2019-07-22 16:57:43",
  3, "q1", "a1", "2019-07-22 16:58:43",
  3, "q2", "a2", "2019-07-22 16:59:43"
) %>%
  mutate(timestamp = as_datetime(timestamp))

have
# # A tibble: 6 x 4
# user_id question answer timestamp          
# <dbl> <chr>    <chr>  <dttm>             
#   1       1 q1       a1     2019-07-22 16:54:43
#   2       1 q2       a2     2019-07-22 16:55:43
#   3       2 q1       a1     2019-07-22 16:56:43
#   4       2 q2       a2     2019-07-22 16:57:43
#   5       3 q1       a1     2019-07-22 16:58:43
#   6       3 q2       a2     2019-07-22 16:59:43

want <- tibble::tribble(
    ~user_id, ~q1, ~q2, ~timestamp_q1, ~timestamp_q2,
    1, "a1", "a2", "2019-07-22 16:54:43", "2019-07-22 16:55:43",
    2, "a1", "a2", "2019-07-22 16:56:43", "2019-07-22 16:57:43",
    3, "a1", "a2", "2019-07-22 16:58:43", "2019-07-22 16:59:43"
  ) %>%
  mutate(timestamp_q1 = as_datetime(timestamp_q1)) %>%
  mutate(timestamp_q2 = as_datetime(timestamp_q2))

want
# A tibble: 3 x 5
#  user_id q1    q2    timestamp_q1        timestamp_q2       
#    <dbl> <chr> <chr> <dttm>              <dttm>             
#1       1 a1    a2    2019-07-22 16:54:43 2019-07-22 16:55:43
#2       2 a1    a2    2019-07-22 16:56:43 2019-07-22 16:57:43
#3       3 a1    a2    2019-07-22 16:58:43 2019-07-22 16:59:43

您可以在参数的

values\u中包含多列，以便一次分散多列：
have %>%
    pivot_wider(
        id_cols = user_id,
        names_from = question,
        values_from = c(answer, timestamp)
    ) %>%
    # remove the 'answer_' prefix from those cols
    rename_all(~ str_remove(., "answer_"))

输出：
# A tibble: 3 x 5
  user_id q1    q2    timestamp_q1        timestamp_q2       
    <dbl> <chr> <chr> <dttm>              <dttm>             
1       1 a1    a2    2019-07-22 16:54:43 2019-07-22 16:55:43
2       2 a1    a2    2019-07-22 16:56:43 2019-07-22 16:57:43
3       3 a1    a2    2019-07-22 16:58:43 2019-07-22 16:59:43

#一个tible:3 x 5
用户id q1 q2时间戳q1时间戳q2
a1 a2 2019-07-22 16:54:43 2019-07-22 16:55:43
2 a1 a2 2019-07-22 16:56:43 2019-07-22 16:57:43
3 a1 a2 2019-07-22 16:58:43 2019-07-22 16:59:43

# A tibble: 3 x 5
  user_id q1    q2    timestamp_q1        timestamp_q2       
    <dbl> <chr> <chr> <dttm>              <dttm>             
1       1 a1    a2    2019-07-22 16:54:43 2019-07-22 16:55:43
2       2 a1    a2    2019-07-22 16:56:43 2019-07-22 16:57:43
3       3 a1    a2    2019-07-22 16:58:43 2019-07-22 16:59:43