R 根据另一个变量（工作满意度）计算变量（工资）的平均值和标准差_R_Plyr

R 根据另一个变量（工作满意度）计算变量（工资）的平均值和标准差

R 根据另一个变量（工作满意度）计算变量（工资）的平均值和标准差,r,plyr,R,Plyr,我在数据集中有两列，我知道我必须使用函数ddply和summary，但我不知道如何开始。希望这能让您开始： data %>% group_by(Satisfaction) %>% summarise(Mean = mean(Salary), SD = sd(Salary)) # A tibble: 7 x 3 Satisfaction Mean SD <int> <dbl> <db

我在数据集中有两列，我知道我必须使用函数ddply和summary，但我不知道如何开始。

希望这能让您开始：

data %>%
  group_by(Satisfaction) %>%
  summarise(Mean = mean(Salary),
            SD = sd(Salary))
# A tibble: 7 x 3
  Satisfaction    Mean     SD
         <int>   <dbl>  <dbl>
1            1  12481.  1437.
2            2  31965.  5235.
3            3  45844.  7631.
4            4  69052.  9257.
5            5  79555. 12975.
6            6 100557. 13739.
7            7 111414. 19139.

如果这样的问题（特别是在R中）是可复制和自包含的，那么它们会做得更好。我的意思是包括尝试的代码（请明确说明非基本包）、样本代表性数据（可能通过

dput（head（x））

或以编程方式构建数据（例如，

data.frame（…）

），可能在

set.seed（1）

之后随机），可能是实际输出（带有逐字错误/警告）相对于预期输出。参考文献：，和.“员工%>%+团队成员（工作满意度）%>%+总结（平均值=平均值（月收入），+SD=标准差（月收入））#表：4 x 3工作满意度平均值SD 1低6562。46452中等6527。48673高6480。47984甚高6473。有一个简单的方法发布结果吗？我建议编辑你的原始问题或打开一个新问题发布输出。你可以用三个倒勾（`````）来环绕输出以改进格式。好的，可以，我似乎要等90分钟。再次感谢！

set.seed(3)
data <- data.frame(Salary = sapply(rep(1:7,each = 10), function(x){floor(runif(1,x*10000,x*20000))}),
                   Satisfaction = rep(1:7,each = 10))