R 如何仅获取特定行的标准化列?
可能重复:R 如何仅获取特定行的标准化列?,r,R,可能重复: 有关 我正在尝试在我的数据框架中创建一个新列,它根据“Round”列将“Score”列扩展为多个部分 看起来像这样 Unit Score Quarter Scale 6 98.7 QTR 1 2011 1.01 1 88.6 QTR 1 2011 .98 3 76.5 QTR 1 2011 .01 5 93.5 QTR 2 2011 2.
有关 我正在尝试在我的数据框架中创建一个新列,它根据“Round”列将“Score”列扩展为多个部分 看起来像这样
Unit Score Quarter Scale
6 98.7 QTR 1 2011 1.01
1 88.6 QTR 1 2011 .98
3 76.5 QTR 1 2011 .01
5 93.5 QTR 2 2011 2.0
6 88.6 QTR 2 2011 2.5
9 89.1 QTR 1 2012 2.2
1 79.4 QTR 1 2012 -.09
3 80.3 QTR 1 2012 -.01
3 98.7 QTR 1 2011 -2.2
我不想对整个列进行标准化,因为我想对数据进行趋势分析,并真正了解各单位在每个季度之间的表现,而不是将所有分数相互比较的尺度(数据$Score),无论是哪一轮
我尝试过类似这样的变体:
data$Score_Scale <- with (data, scale(Score), findInterval(QTR, c(-Inf,"2011-01-01","2011-06-30", Inf)), FUN= scale)
data$Score\u Scale使用ave
可能是一个不错的选择:
获取您的数据:
test <- read.csv(textConnection("Score,Quarter
98.7,Round 1 2011
88.6,Round 1 2011
76.5,Round 1 2011
93.5,Round 2 2011
97.7,Round 2 2011
89.1,Round 1 2012
79.4,Round 1 2012
80.3,Round 1 2012"),header=TRUE)
为了说明这一点,下面是每个季度组的单独结果:
test$score_scale <- ave(test$Score,test$Quarter,FUN=scale)
test
Score Quarter score_scale
1 98.7 Round 1 2011 0.96866054
2 88.6 Round 1 2011 0.05997898
3 76.5 Round 1 2011 -1.02863953
4 93.5 Round 2 2011 -0.70710678
5 97.7 Round 2 2011 0.70710678
6 89.1 Round 1 2012 1.15062301
7 79.4 Round 1 2012 -0.65927589
8 80.3 Round 1 2012 -0.49134712
> as.vector(scale(test$Score[test$Quarter=="Round 1 2011"]))
[1] 0.96866054 0.05997898 -1.02863953
> as.vector(scale(test$Score[test$Quarter=="Round 2 2011"]))
[1] -0.7071068 0.7071068
> as.vector(scale(test$Score[test$Quarter=="Round 1 2012"]))
[1] 1.1506230 -0.6592759 -0.4913471
Round
和QTR
是否交替使用?在您的示例数据中,Date
在哪里?很抱歉,mnel的不一致性现在已经解决了。为什么我会得到否决票?我知道问题中有一个拼写错误,但现在已经解决了。我的问题和上一个问题一样有效。看起来有效,谢谢你的帮助。
> as.vector(scale(test$Score[test$Quarter=="Round 1 2011"]))
[1] 0.96866054 0.05997898 -1.02863953
> as.vector(scale(test$Score[test$Quarter=="Round 2 2011"]))
[1] -0.7071068 0.7071068
> as.vector(scale(test$Score[test$Quarter=="Round 1 2012"]))
[1] 1.1506230 -0.6592759 -0.4913471