R 在两点之间缩放一系列

R 在两点之间缩放一系列,r,scaling,R,Scaling,如何缩放序列,使序列中的第一个数字为0,最后一个数字为1。我研究了“近似”、“规模”,但它们没有实现这一目标 # generate series from exponential distr s = sort(rexp(100)) # scale/interpolate 's' such that it starts at 0 and ends at 1? # approx(s) # scale(s) 使用基本算法直接创建一个小函数来完成此操作: s = sort(rexp(100)) r

如何缩放序列,使序列中的第一个数字为0,最后一个数字为1。我研究了“近似”、“规模”,但它们没有实现这一目标

# generate series from exponential distr
s = sort(rexp(100))

# scale/interpolate 's' such that it starts at 0 and ends at 1?
# approx(s)
# scale(s)

使用基本算法直接创建一个小函数来完成此操作:

s = sort(rexp(100))

range01 <- function(x){(x-min(x))/(max(x)-min(x))}

range01(s)

  [1] 0.000000000 0.003338782 0.007572326 0.012192201 0.016055006 0.017161145
  [7] 0.019949532 0.023839810 0.024421602 0.027197168 0.029889484 0.033039408
 [13] 0.033783376 0.038051265 0.045183382 0.049560233 0.056941611 0.057552543
 [19] 0.062674982 0.066001242 0.066420884 0.067689067 0.069247825 0.069432174
 [25] 0.070136067 0.076340460 0.078709590 0.080393512 0.085591881 0.087540132
 [31] 0.090517295 0.091026499 0.091251213 0.099218526 0.103236344 0.105724733
 [37] 0.107495340 0.113332392 0.116103438 0.124050331 0.125596034 0.126599323
 [43] 0.127154661 0.133392300 0.134258532 0.138253452 0.141933433 0.146748798
 [49] 0.147490227 0.149960293 0.153126478 0.154275371 0.167701855 0.170160948
 [55] 0.180313542 0.181834891 0.182554291 0.189188137 0.193807559 0.195903010
 [61] 0.208902645 0.211308713 0.232942314 0.236135220 0.251950116 0.260816843
 [67] 0.284090255 0.284150541 0.288498370 0.295515143 0.299408623 0.301264703
 [73] 0.306817872 0.307853369 0.324882091 0.353241217 0.366800517 0.389474449
 [79] 0.398838576 0.404266315 0.408936260 0.409198619 0.415165553 0.433960390
 [85] 0.440690262 0.458692639 0.464027428 0.474214070 0.517224262 0.538532221
 [91] 0.544911543 0.559945121 0.585390414 0.647030109 0.694095422 0.708385079
 [97] 0.736486707 0.787250428 0.870874773 1.000000000
s=sort(rexp(100))
range01这应该可以做到:

reshape::rescaler.default(s, type = "range")
编辑

我对这两种方法的性能感到好奇

> system.time(replicate(100, range01(s)))
   user  system elapsed 
   0.56    0.12    0.69 
> system.time(replicate(100, reshape::rescaler.default(s, type = "range")))
   user  system elapsed 
   0.53    0.18    0.70 
restrape::rescaler.default

range02 <- function(x) {
    (x - min(x, na.rm=TRUE)) / diff(range(x, na.rm=TRUE))
    }

> system.time(replicate(100, range02(s)))
   user  system elapsed 
   0.56    0.12    0.68 
range02系统时间(复制(100,range02(s)))
用户系统运行时间
0.56    0.12    0.68 
产生类似的结果。

或者:

scale(x,center=min(x),scale=diff(range(x)))
(未经测试)


它的功能是将原始的居中和缩放因子作为属性附加到输出,因此可以检索它们并在以后使用它们取消缩放数据(如果需要)。它有一个奇怪之处,它总是以(按列)矩阵的形式返回结果,即使它被传递了一个向量;如果想要向量而不是矩阵,可以使用
drop(scale(…)
(这通常无关紧要,但矩阵格式偶尔会在下游造成麻烦…根据我的经验,tibbles/tidyverse中更常见,尽管我没有停下来仔细检查这些情况下的错误)

library("scales")
rescale(s)
默认情况下,这会将给定的
s
范围缩放到0到1,但可以调整其中一个或两个范围。例如,如果要将其从0缩放到10

rescale(s, to=c(0,10))
或者,如果希望将
s
的最大值缩放为1,但将0(而不是
s
的最小值)缩放为0,则可以使用

rescale(s, from=c(0, max(s)))

您还可以使用插入符号软件包,该软件包将为您提供预处理功能,该功能非常简单,如下所示:

preProcValues <- preProcess(yourData, method = "range")
dataScaled <- predict(preProcValues, yourData)

prepocValues我在r中创建了以下函数:

ReScale <- function(x,first,last){(last-first)/(max(x)-min(x))*(x-min(x))+first}

整齐地重新缩放。这是我作为一名生物学家在数学课上一直忽略的。此外,如果你不想在0和1之间进行缩放,你可以做
range02@Optimus如何使用缩放值取消缩放?