R 重新排列两列,使相似的元素位于一列中
我有一个看起来很容易的问题。我想不出如何搜索一个函数来实现这一点(或者找到一个类似问题的方法,这个问题已经被问到了:-/)。我目前有一个数据框,看起来像这样:R 重新排列两列,使相似的元素位于一列中,r,dplyr,data-wrangling,R,Dplyr,Data Wrangling,我有一个看起来很容易的问题。我想不出如何搜索一个函数来实现这一点(或者找到一个类似问题的方法,这个问题已经被问到了:-/)。我目前有一个数据框,看起来像这样: sp1 sp2 dist Viola_canadensis_ott1089589 Dasiphora_fruticosa_ott782136 8.043604e-311 Viola_nuttallii_ott203476 Da
sp1 sp2 dist
Viola_canadensis_ott1089589 Dasiphora_fruticosa_ott782136 8.043604e-311
Viola_nuttallii_ott203476 Dasiphora_fruticosa_ott782136 6.702821e-311
Parnassia_fimbriata_ott1035577 Dasiphora_fruticosa_ott782136 4.691921e-311
Paxistima_myrsinites_ott381954 Dasiphora_fruticosa_ott782136 4.692195e-311
Dasiphora_fruticosa_ott782136 Sibbaldia_procumbens_ott176706 1.340783e-311
Dasiphora_fruticosa_ott782136 Fragaria_virginiana_ott1004791 2.680745e-311
Dasiphora_fruticosa_ott782136 Fragaria_vesca_ott852873 2.681018e-311
Dasiphora_fruticosa_ott782136 Geum_rossii_ott255461 2.681292e-311
sp1 sp2 dist
Dasiphora_fruticosa_ott78213 Viola_canadensis_ott1089589 8.043604e-311
Dasiphora_fruticosa_ott78213 Viola_nuttallii_ott203476 6.702821e-311
Dasiphora_fruticosa_ott78213 Parnassia_fimbriata_ott1035577 4.691921e-311
Dasiphora_fruticosa_ott78213 Paxistima_myrsinites_ott381954 4.692195e-311
Dasiphora_fruticosa_ott782136 Sibbaldia_procumbens_ott176706 1.340783e-311
Dasiphora_fruticosa_ott782136 Fragaria_virginiana_ott1004791 2.680745e-311
Dasiphora_fruticosa_ott782136 Fragaria_vesca_ott852873 2.681018e-311
Dasiphora_fruticosa_ott782136 Geum_rossii_ott255461 2.681292e-311
此框架只有3列,约11000行。请注意,我有50种物种,我想以与此物种相同的方式将其部分“移动”到sp1列,约250种物种将移动到sp2列;我已经有了这50种病毒
我想做的是重新排列数据框,使其看起来像这样:
sp1 sp2 dist
Viola_canadensis_ott1089589 Dasiphora_fruticosa_ott782136 8.043604e-311
Viola_nuttallii_ott203476 Dasiphora_fruticosa_ott782136 6.702821e-311
Parnassia_fimbriata_ott1035577 Dasiphora_fruticosa_ott782136 4.691921e-311
Paxistima_myrsinites_ott381954 Dasiphora_fruticosa_ott782136 4.692195e-311
Dasiphora_fruticosa_ott782136 Sibbaldia_procumbens_ott176706 1.340783e-311
Dasiphora_fruticosa_ott782136 Fragaria_virginiana_ott1004791 2.680745e-311
Dasiphora_fruticosa_ott782136 Fragaria_vesca_ott852873 2.681018e-311
Dasiphora_fruticosa_ott782136 Geum_rossii_ott255461 2.681292e-311
sp1 sp2 dist
Dasiphora_fruticosa_ott78213 Viola_canadensis_ott1089589 8.043604e-311
Dasiphora_fruticosa_ott78213 Viola_nuttallii_ott203476 6.702821e-311
Dasiphora_fruticosa_ott78213 Parnassia_fimbriata_ott1035577 4.691921e-311
Dasiphora_fruticosa_ott78213 Paxistima_myrsinites_ott381954 4.692195e-311
Dasiphora_fruticosa_ott782136 Sibbaldia_procumbens_ott176706 1.340783e-311
Dasiphora_fruticosa_ott782136 Fragaria_virginiana_ott1004791 2.680745e-311
Dasiphora_fruticosa_ott782136 Fragaria_vesca_ott852873 2.681018e-311
Dasiphora_fruticosa_ott782136 Geum_rossii_ott255461 2.681292e-311
我知道这一定是非常简单的dplyr!!!!我只是从来没有遇到过这样的问题
如果需要,下面是一个较长的示例:
key_species <- c("Dasiphora_fruticosa_ott782136", "Erythronium_grandiflorum_ott653293")
sp1 sp2 dist
Aquilegia_elegantula_ott668865 Erythronium_grandiflorum_ott653293 6.703914e-312
Aquilegia_coerulea_ott192307 Erythronium_grandiflorum_ott653293 6.703914e-312
Corydalis_caseana_ott3944909 Erythronium_grandiflorum_ott653293 6.703914e-312
Erythronium_grandiflorum_ott653293 Selaginella_densa_ott1095392 6.701177e-312
Erythronium_grandiflorum_ott653293 Selaginella_scopulorum_ott5923066 6.701177e-312
Erythronium_grandiflorum_ott653293 Blepharostoma_trichophyllum_ott390604 1.340235e-311
Viola_canadensis_ott1089589 Dasiphora_fruticosa_ott782136 8.043604e-311
Viola_nuttallii_ott203476 Dasiphora_fruticosa_ott782136 6.702821e-311
Parnassia_fimbriata_ott1035577 Dasiphora_fruticosa_ott782136 4.691921e-311
Paxistima_myrsinites_ott381954 Dasiphora_fruticosa_ott782136 4.692195e-311
Dasiphora_fruticosa_ott782136 Sibbaldia_procumbens_ott176706 1.340783e-311
Dasiphora_fruticosa_ott782136 Fragaria_virginiana_ott1004791 2.680745e-311
Dasiphora_fruticosa_ott782136 Fragaria_vesca_ott852873 2.681018e-311
Dasiphora_fruticosa_ott782136 Geum_rossii_ott255461 2.681292e-311
很抱歉,如果这是一个重新发布,我真的想不出一个好方法来进行搜索以找到类似的问题。我会尝试创建新的
sp
列,而不是修改现有的列。然后,当它们看起来不错时,您可以删除旧列并重命名新列
data %>%
mutate(new_sp1 = case_when(
sp1 %in% key_species ~ sp1,
sp2 %in% key_species ~ sp2,
TRUE ~ NA_character_
),
new_sp2 = case_when(
sp1 %in% key_species ~ sp2,
sp2 %in% key_species ~ sp1,
TRUE ~ NA_character_
)
)