R 如何根据给定条件排列列?
我的数据集是:R 如何根据给定条件排列列?,r,R,我的数据集是: S1 S2 S3 S4 1 4 7 20 2 6 8 21 3 9 10 30 我根据以下条件转换数据: 按每列值之间的最大差值排序 条件之后的数据应该是这样的 S4 S2 S3 S1 20 4 7 1 21 6 8 2 30 9 1 3 说明: 最大值和最小值之间的差异 for S4 is 30 - 20 =10
S1 S2 S3 S4
1 4 7 20
2 6 8 21
3 9 10 30
我根据以下条件转换数据:
按每列值之间的最大差值排序
条件之后的数据应该是这样的
S4 S2 S3 S1
20 4 7 1
21 6 8 2
30 9 1 3
说明:
最大值和最小值之间的差异
for S4 is 30 - 20 =10
for S2 is 9-4 = 5
for S3 is 10-7 = 3
for S1 is 3-1 =2
列按照最大值和最小值的差值进行排序。这里是一个基于R的想法
df[order(sapply(df, function(i) max(i)-min(i)), decreasing = TRUE)]
这就给了,
如果要更改列名以反映顺序,可以使用setNames
,即
setNames(df[order(sapply(df, function(i) max(i)-min(i)), decreasing = TRUE)],
paste0('column', seq_along(df)))
这就给了,
这里有一个使用
tidyverse
library(tidyverse)
df1 %>%
summarise_all(funs(max(.)-min(.))) %>%
unlist %>%
order(., decreasing = TRUE) %>%
select(df1, .)
# S4 S2 S3 S1
#1 20 4 7 1
#2 21 6 8 2
#3 30 9 10 3
欢迎来到StackOverflow!请阅读相关信息以及如何给出建议。这将使其他人更容易帮助您。我如何才能根据条件为列命名?您的意思是什么?例如,如果我想为第二高的列命名,从“S2”到“column2”,并为所有列命名,即column1等。更新了我的回答感谢您的帮助:如果我想将名称命名为column1,value_column2,3_data_column,column_4_id那么我该怎么做呢?我在select(df,.)中得到
错误:未使用的参数(.)
ahh…ok更新了其余的包,效果很好。尼斯1:)谢谢我使用了集合名(df[顺序(sappy(df,函数(i)max(i)-min(i)),递减=真)],c(“c1”,“c2”,“c3”,“c4”))谢谢你的帮助,尼斯:D
column1 column2 column3 column4
1 20 4 7 1
2 21 6 8 2
3 30 9 10 3
library(tidyverse)
df1 %>%
summarise_all(funs(max(.)-min(.))) %>%
unlist %>%
order(., decreasing = TRUE) %>%
select(df1, .)
# S4 S2 S3 S1
#1 20 4 7 1
#2 21 6 8 2
#3 30 9 10 3
df1[,order(sapply(df1,function(x)diff(range(x))),decreasing = T)]
S4 S2 S3 S1
1 20 4 7 1
2 21 6 8 2
3 30 9 10 3