R 重新排列两列,使相似的元素位于一列中

R 重新排列两列,使相似的元素位于一列中,r,dplyr,data-wrangling,R,Dplyr,Data Wrangling,我有一个看起来很容易的问题。我想不出如何搜索一个函数来实现这一点(或者找到一个类似问题的方法,这个问题已经被问到了:-/)。我目前有一个数据框,看起来像这样: sp1 sp2 dist Viola_canadensis_ott1089589 Dasiphora_fruticosa_ott782136 8.043604e-311 Viola_nuttallii_ott203476 Da

我有一个看起来很容易的问题。我想不出如何搜索一个函数来实现这一点(或者找到一个类似问题的方法,这个问题已经被问到了:-/)。我目前有一个数据框,看起来像这样:

sp1                           sp2                            dist
Viola_canadensis_ott1089589 Dasiphora_fruticosa_ott782136   8.043604e-311
Viola_nuttallii_ott203476   Dasiphora_fruticosa_ott782136   6.702821e-311
Parnassia_fimbriata_ott1035577  Dasiphora_fruticosa_ott782136   4.691921e-311
Paxistima_myrsinites_ott381954  Dasiphora_fruticosa_ott782136   4.692195e-311
Dasiphora_fruticosa_ott782136   Sibbaldia_procumbens_ott176706  1.340783e-311
Dasiphora_fruticosa_ott782136   Fragaria_virginiana_ott1004791  2.680745e-311
Dasiphora_fruticosa_ott782136   Fragaria_vesca_ott852873    2.681018e-311
Dasiphora_fruticosa_ott782136   Geum_rossii_ott255461   2.681292e-311
sp1                           sp2                            dist
Dasiphora_fruticosa_ott78213    Viola_canadensis_ott1089589 8.043604e-311
Dasiphora_fruticosa_ott78213    Viola_nuttallii_ott203476   6.702821e-311
Dasiphora_fruticosa_ott78213    Parnassia_fimbriata_ott1035577  4.691921e-311
Dasiphora_fruticosa_ott78213    Paxistima_myrsinites_ott381954  4.692195e-311
Dasiphora_fruticosa_ott782136   Sibbaldia_procumbens_ott176706  1.340783e-311
Dasiphora_fruticosa_ott782136   Fragaria_virginiana_ott1004791  2.680745e-311
Dasiphora_fruticosa_ott782136   Fragaria_vesca_ott852873    2.681018e-311
Dasiphora_fruticosa_ott782136   Geum_rossii_ott255461   2.681292e-311
此框架只有3列,约11000行。请注意,我有50种物种,我想以与此物种相同的方式将其部分“移动”到sp1列,约250种物种将移动到sp2列;我已经有了这50种病毒

我想做的是重新排列数据框,使其看起来像这样:

sp1                           sp2                            dist
Viola_canadensis_ott1089589 Dasiphora_fruticosa_ott782136   8.043604e-311
Viola_nuttallii_ott203476   Dasiphora_fruticosa_ott782136   6.702821e-311
Parnassia_fimbriata_ott1035577  Dasiphora_fruticosa_ott782136   4.691921e-311
Paxistima_myrsinites_ott381954  Dasiphora_fruticosa_ott782136   4.692195e-311
Dasiphora_fruticosa_ott782136   Sibbaldia_procumbens_ott176706  1.340783e-311
Dasiphora_fruticosa_ott782136   Fragaria_virginiana_ott1004791  2.680745e-311
Dasiphora_fruticosa_ott782136   Fragaria_vesca_ott852873    2.681018e-311
Dasiphora_fruticosa_ott782136   Geum_rossii_ott255461   2.681292e-311
sp1                           sp2                            dist
Dasiphora_fruticosa_ott78213    Viola_canadensis_ott1089589 8.043604e-311
Dasiphora_fruticosa_ott78213    Viola_nuttallii_ott203476   6.702821e-311
Dasiphora_fruticosa_ott78213    Parnassia_fimbriata_ott1035577  4.691921e-311
Dasiphora_fruticosa_ott78213    Paxistima_myrsinites_ott381954  4.692195e-311
Dasiphora_fruticosa_ott782136   Sibbaldia_procumbens_ott176706  1.340783e-311
Dasiphora_fruticosa_ott782136   Fragaria_virginiana_ott1004791  2.680745e-311
Dasiphora_fruticosa_ott782136   Fragaria_vesca_ott852873    2.681018e-311
Dasiphora_fruticosa_ott782136   Geum_rossii_ott255461   2.681292e-311
我知道这一定是非常简单的dplyr!!!!我只是从来没有遇到过这样的问题

如果需要,下面是一个较长的示例:

key_species <- c("Dasiphora_fruticosa_ott782136", "Erythronium_grandiflorum_ott653293")

        sp1                            sp2                                 dist
    Aquilegia_elegantula_ott668865  Erythronium_grandiflorum_ott653293  6.703914e-312
    Aquilegia_coerulea_ott192307    Erythronium_grandiflorum_ott653293  6.703914e-312
    Corydalis_caseana_ott3944909    Erythronium_grandiflorum_ott653293  6.703914e-312
    Erythronium_grandiflorum_ott653293  Selaginella_densa_ott1095392    6.701177e-312
    Erythronium_grandiflorum_ott653293  Selaginella_scopulorum_ott5923066   6.701177e-312
    Erythronium_grandiflorum_ott653293  Blepharostoma_trichophyllum_ott390604   1.340235e-311
    Viola_canadensis_ott1089589 Dasiphora_fruticosa_ott782136   8.043604e-311
    Viola_nuttallii_ott203476   Dasiphora_fruticosa_ott782136   6.702821e-311
    Parnassia_fimbriata_ott1035577  Dasiphora_fruticosa_ott782136   4.691921e-311
    Paxistima_myrsinites_ott381954  Dasiphora_fruticosa_ott782136   4.692195e-311
    Dasiphora_fruticosa_ott782136   Sibbaldia_procumbens_ott176706  1.340783e-311
    Dasiphora_fruticosa_ott782136   Fragaria_virginiana_ott1004791  2.680745e-311
    Dasiphora_fruticosa_ott782136   Fragaria_vesca_ott852873    2.681018e-311
    Dasiphora_fruticosa_ott782136   Geum_rossii_ott255461   2.681292e-311

很抱歉,如果这是一个重新发布,我真的想不出一个好方法来进行搜索以找到类似的问题。

我会尝试创建新的
sp
列,而不是修改现有的列。然后,当它们看起来不错时,您可以删除旧列并重命名新列

data %>%
  mutate(new_sp1 = case_when(
      sp1 %in% key_species ~ sp1,
      sp2 %in% key_species ~ sp2,
      TRUE ~ NA_character_
    ),
    new_sp2 = case_when(
      sp1 %in% key_species ~ sp2,
      sp2 %in% key_species ~ sp1,
      TRUE ~ NA_character_
    )
)