Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/excel/24.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 标准化/缩放数据集_R_Excel_Statistics_Excel Formula - Fatal编程技术网

R 标准化/缩放数据集

R 标准化/缩放数据集,r,excel,statistics,excel-formula,R,Excel,Statistics,Excel Formula,我有以下数据集: dat<-as.data.frame(rbind(10,8,2,7,10,10,1,10,14,9,2,6,10,8,10,8,10,10,7,11,10)) colnames(dat)<-"Score" print(dat) Score 10 8 2 7 10 10 1 10 14 9 2 6 10 8 10 8 10 10 7 11 10 dat您可以在R中使用此命令在0到20之间缩放: newvalue <- 20/(max(score)-min(sc

我有以下数据集:

dat<-as.data.frame(rbind(10,8,2,7,10,10,1,10,14,9,2,6,10,8,10,8,10,10,7,11,10))
colnames(dat)<-"Score"
print(dat)
Score
10
8
2
7
10
10
1
10
14
9
2
6
10
8
10
8
10
10
7
11
10

dat您可以在R中使用此命令在0到20之间缩放:

newvalue <- 20/(max(score)-min(score))*(score-min(score))

newvalue您可以在R中使用此命令在0到20之间缩放:

newvalue <- 20/(max(score)-min(score))*(score-min(score))

newvalue如果所有刻度的下限为0,则数学方法相当简单

new\u value=新上限*旧上限/旧上限

下一个公式将考虑每个比例尺上的不同楼层:

new_value=new_floor+(new_天花-old_天花)*((old_value-old_floor)/(old_天花-old_floor))
这实际上是你从维基百科发布的公式


希望这有帮助

如果所有比例的下限为0,则数学方法相当简单

new\u value=新上限*旧上限/旧上限

下一个公式将考虑每个比例尺上的不同楼层:

new_value=new_floor+(new_天花-old_天花)*((old_value-old_floor)/(old_天花-old_floor))
这实际上是你从维基百科发布的公式


希望这有帮助

在您的情况下,我将使用您在问题上发布的特征比例公式。
(x-min(x))/(max(x)-min(x))
基本上将测试分数转换为0-1之间的范围

因为边实际上是0和15,而不是2和14,所以
min(x)=0
max(x)=15
。一旦你的分数在0-1之间,你只需要乘以20

i、 e


结果直观,功能可靠。例如,得分为14/15的人应该得到最高的分数(非常接近20分),这就是这里的情况(转换后他们的得分为18.6666)。

在你的情况下,我将使用你在问题上发布的特征量表公式。
(x-min(x))/(max(x)-min(x))
基本上将测试分数转换为0-1之间的范围

因为边实际上是0和15,而不是2和14,所以
min(x)=0
max(x)=15
。一旦你的分数在0-1之间,你只需要乘以20

i、 e


结果直观,功能可靠。例如,得分为14/15的人应该得到最高的分数(非常接近20分),这是这里的情况(转换后他们的分数为18.6666)。

在Excel中,如果您希望标准化数据的最小值为0,最大值为20,那么我们需要解决:

y = A * x + b
有两点

将原始数据的最大值放入C1

=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
将原始数据的最小值放入C2

=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
将所需最大值放入D1,将所需最小值放入D2。将A系数的公式放入C3

=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
以及C4中的B系数公式:

=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
最后将缩放公式放入B1

=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
并抄写:


当然,如果您希望缩放独立于原始最大值或最小值,您可以在Excel中使用15 inC1和0 inC2,如果您希望标准化数据的最小值为0,最大值为20,那么我们需要解决:

y = A * x + b
有两点

将原始数据的最大值放入C1

=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
将原始数据的最小值放入C2

=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
将所需最大值放入D1,将所需最小值放入D2。将A系数的公式放入C3

=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
以及C4中的B系数公式:

=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
最后将缩放公式放入B1

=MAX(A:A)
=MIN(A:A)
=($D$1-$D$2)/($C$1-$C$2)
=$D$1-$C$3*$C$1
=A1*$C$3+$C$4
并抄写:


当然,如果您希望缩放独立于原始的最大值或最小值,您可以在C1中使用15,在C2中使用0,这非常简单。由于这两个等级都是线性的,一个简单的倍数就可以了。或者换言之,你们组中的每个等级都需要是*20/15。
这很简单。由于这两个等级都是线性的,一个简单的倍数就可以了。或者换言之,你们组中的每个等级都需要是*20/15。

你想比较什么?标准偏差?您是否假设所有测试分数(最大15分、最大20分、最大5分)均为正态分布?你在这里只有21分,所以你不能用太多的可靠性进行经验测试。你想比较什么?标准偏差?您是否假设所有测试分数(最大15分、最大20分、最大5分)均为正态分布?你在这里只有21分,所以你不能用太多的可靠性进行经验测试。所以对于第一个数据点(10),我将得到以下结果,对吗?20/(14-1)*(10-1)=13,84这就是你的意思吗?它可靠吗?我不明白这背后的逻辑,因为它给出的值与我在维基上发布的公式不同。为什么?对于第一个数据点(10),我将得到以下结果,对吗?20/(14-1)*(10-1)=13,84这就是你的意思吗?它可靠吗?我不明白这背后的逻辑,因为它给出的值与我在维基上发布的公式不同。为什么?