R 想要获得基于因子列的偏离平均值的值的数据帧吗_R_Dplyr_Tidyverse_Data Cleaning_Data Wrangling

R 想要获得基于因子列的偏离平均值的值的数据帧吗

R 想要获得基于因子列的偏离平均值的值的数据帧吗,r,dplyr,tidyverse,data-cleaning,data-wrangling,R,Dplyr,Tidyverse,Data Cleaning,Data Wrangling,例如：假设我有这个数据框 x = data.frame(factor = as.factor(c('a','a','b','b','c','c')),value1 = c(1,3,2,4,5,3), value2 = c(7,9,3,4,9,3)) factor value1 value2 1 a 1 7 2 a 3 9 3 b 2 3 4 b 4 4 5

例如：

假设我有这个数据框

x = data.frame(factor = as.factor(c('a','a','b','b','c','c')),value1 = c(1,3,2,4,5,3), value2 = c(7,9,3,4,9,3))


    factor value1 value2
1      a      1      7
2      a      3      9
3      b      2      3
4      b      4      4
5      c      5      9
6      c      3      3

我知道如何获得每个因子的平均值，我使用以下方法：

aggregate(x[,c(2,3)], list(x$factor), mean, na.rm = T )

这将为我提供以下输出：

  Group.1 value1 value2
1       a      2    8.0
2       b      3    3.5
3       c      4    6.0

现在我如何从原始数据帧中的每个值中减去其因子的相应平均值。我使用的实际数据集很大，所以需要有一个好的方法，我已经设法做到了，但我使用了复杂的for循环

所以我想要的输出是：

  factor value1 value2
1      a     -1   -1.0
2      a      1    1.0
3      b     -1   -0.5
4      b      1    0.5
5      c      1    3.0
6      c     -1   -3.0

任何帮助都会很好。谢谢。

您可以尝试这种dplyr方法：

library(dplyr)
#Data
x = data.frame(factor = as.factor(c('a','a','b','b','c','c')),value1 = c(1,3,2,4,5,3), value2 = c(7,9,3,4,9,3))
#Code
x <- x %>% group_by(factor) %>%
  mutate(Mv1=mean(value1),
         Mv2=mean(value2),
         value1=value1-Mv1,
         value2=value2-Mv2) %>% select(-c(Mv1,Mv2))

输出：

# A tibble: 6 x 3
# Groups:   factor [3]
  factor value1 value2
  <fct>   <dbl>  <dbl>
1 a          -1   -1  
2 a           1    1  
3 b          -1   -0.5
4 b           1    0.5
5 c           1    3  
6 c          -1   -3

您可以尝试以下dplyr方法：

library(dplyr)
#Data
x = data.frame(factor = as.factor(c('a','a','b','b','c','c')),value1 = c(1,3,2,4,5,3), value2 = c(7,9,3,4,9,3))
#Code
x <- x %>% group_by(factor) %>%
  mutate(Mv1=mean(value1),
         Mv2=mean(value2),
         value1=value1-Mv1,
         value2=value2-Mv2) %>% select(-c(Mv1,Mv2))

输出：

# A tibble: 6 x 3
# Groups:   factor [3]
  factor value1 value2
  <fct>   <dbl>  <dbl>
1 a          -1   -1  
2 a           1    1  
3 b          -1   -0.5
4 b           1    0.5
5 c           1    3  
6 c          -1   -3

dplyr解决方案

输出

# A tibble: 6 x 3
# Groups:   factor [3]
  factor value1 value2
  <fct>   <dbl>  <dbl>
1 a          -1   -1  
2 a           1    1  
3 b          -1   -0.5
4 b           1    0.5
5 c           1    3  
6 c          -1   -3

dplyr解决方案

输出

# A tibble: 6 x 3
# Groups:   factor [3]
  factor value1 value2
  <fct>   <dbl>  <dbl>
1 a          -1   -1  
2 a           1    1  
3 b          -1   -0.5
4 b           1    0.5
5 c           1    3  
6 c          -1   -3

这是一个带有data.table的解决方案

withx，value1-avevalue1，factor，FUN=means withx，value1-avevalue1，factor，FUN=meanekoam，因此第一个“.”表示行值，平均值函数中的“.”表示组平均值？。指应用该公式的值。例如，对于组a和值1。代表c1,3；对于组b和值2。表示c3，4.ok，所以公式~。-意思是对于a组，当value1=1时，value1转化为：=1-平均值c1,3；对于a组的相应值，当value1=3时，value1转化为3-平均值c1,3？是的，但由于R使用向量计算，因此更准确的说法是，对于a组，公式转化为c1,3-平均值c1,3。dplyr等价物为总结。简单地用summary和~替换mutate意思是使用just mean，您将得到所需的值。ekoam，因此第一个“.”表示行值，而均值函数中的“.”表示组mean？。指应用该公式的值。例如，对于组a和值1。代表c1,3；对于组b和值2。表示c3，4.ok，所以公式~。-意思是对于a组，当value1=1时，value1转化为：=1-平均值c1,3；对于a组的相应值，当value1=3时，value1转化为3-平均值c1,3？是的，但由于R使用向量计算，因此更准确的说法是，对于a组，公式转化为c1,3-平均值c1,3。dplyr等价物为总结。简单地用summary和~替换mutate意思是只要你小心谨慎，你就会得到你所需要的。