R 标准化/缩放数据集
我有以下数据集:R 标准化/缩放数据集,r,excel,statistics,excel-formula,R,Excel,Statistics,Excel Formula,我有以下数据集: dat<-as.data.frame(rbind(10,8,2,7,10,10,1,10,14,9,2,6,10,8,10,8,10,10,7,11,10)) colnames(dat)<-"Score" print(dat) Score 10 8 2 7 10 10 1 10 14 9 2 6 10 8 10 8 10 10 7 11 10 dat您可以在R中使用此命令在0到20之间缩放: newvalue <- 20/(max(score)-min(sc
dat<-as.data.frame(rbind(10,8,2,7,10,10,1,10,14,9,2,6,10,8,10,8,10,10,7,11,10))
colnames(dat)<-"Score"
print(dat)
Score
10
8
2
7
10
10
1
10
14
9
2
6
10
8
10
8
10
10
7
11
10
dat您可以在R中使用此命令在0到20之间缩放:
newvalue <- 20/(max(score)-min(score))*(score-min(score))
newvalue您可以在R中使用此命令在0到20之间缩放:
newvalue <- 20/(max(score)-min(score))*(score-min(score))
newvalue如果所有刻度的下限为0,则数学方法相当简单
new\u value=新上限*旧上限/旧上限
下一个公式将考虑每个比例尺上的不同楼层:
new_value=new_floor+(new_天花-old_天花)*((old_value-old_floor)/(old_天花-old_floor))
这实际上是你从维基百科发布的公式
希望这有帮助 如果所有比例的下限为0,则数学方法相当简单
new\u value=新上限*旧上限/旧上限
下一个公式将考虑每个比例尺上的不同楼层:
new_value=new_floor+(new_天花-old_天花)*((old_value-old_floor)/(old_天花-old_floor))
这实际上是你从维基百科发布的公式
希望这有帮助 在您的情况下,我将使用您在问题上发布的特征比例公式。(x-min(x))/(max(x)-min(x))
基本上将测试分数转换为0-1之间的范围
因为边实际上是0和15,而不是2和14,所以min(x)=0
和max(x)=15
。一旦你的分数在0-1之间,你只需要乘以20
i、 e
结果直观,功能可靠。例如,得分为14/15的人应该得到最高的分数(非常接近20分),这就是这里的情况(转换后他们的得分为18.6666)。在你的情况下,我将使用你在问题上发布的特征量表公式。(x-min(x))/(max(x)-min(x))
基本上将测试分数转换为0-1之间的范围
因为边实际上是0和15,而不是2和14,所以min(x)=0
和max(x)=15
。一旦你的分数在0-1之间,你只需要乘以20
i、 e
结果直观,功能可靠。例如,得分为14/15的人应该得到最高的分数(非常接近20分),这是这里的情况(转换后他们的分数为18.6666)。在Excel中,如果您希望标准化数据的最小值为0,最大值为20,那么我们需要解决:
y = A * x + b
有两点
将原始数据的最大值放入C1:
=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
将原始数据的最小值放入C2:
=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
将所需最大值放入D1,将所需最小值放入D2。将A系数的公式放入C3:
=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
以及C4中的B系数公式:
=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
最后将缩放公式放入B1:
=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
并抄写:
当然,如果您希望缩放独立于原始最大值或最小值,您可以在Excel中使用15 inC1和0 inC2,如果您希望标准化数据的最小值为0,最大值为20,那么我们需要解决:
y = A * x + b
有两点
将原始数据的最大值放入C1:
=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
将原始数据的最小值放入C2:
=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
将所需最大值放入D1,将所需最小值放入D2。将A系数的公式放入C3:
=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
以及C4中的B系数公式:
=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
最后将缩放公式放入B1:
=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
并抄写:
当然,如果您希望缩放独立于原始的最大值或最小值,您可以在C1中使用15,在C2中使用0,这非常简单。由于这两个等级都是线性的,一个简单的倍数就可以了。或者换言之,你们组中的每个等级都需要是*20/15。
这很简单。由于这两个等级都是线性的,一个简单的倍数就可以了。或者换言之,你们组中的每个等级都需要是*20/15。
你想比较什么?标准偏差?您是否假设所有测试分数(最大15分、最大20分、最大5分)均为正态分布?你在这里只有21分,所以你不能用太多的可靠性进行经验测试。你想比较什么?标准偏差?您是否假设所有测试分数(最大15分、最大20分、最大5分)均为正态分布?你在这里只有21分,所以你不能用太多的可靠性进行经验测试。所以对于第一个数据点(10),我将得到以下结果,对吗?20/(14-1)*(10-1)=13,84这就是你的意思吗?它可靠吗?我不明白这背后的逻辑,因为它给出的值与我在维基上发布的公式不同。为什么?对于第一个数据点(10),我将得到以下结果,对吗?20/(14-1)*(10-1)=13,84这就是你的意思吗?它可靠吗?我不明白这背后的逻辑,因为它给出的值与我在维基上发布的公式不同。为什么?