Arrays Ruby中的并行分配性能

Arrays Ruby中的并行分配性能,arrays,ruby,performance,swap,Arrays,Ruby,Performance,Swap,设置一个临时变量来交换数组中的两个元素似乎比使用并行赋值更有效。有人能解释一下吗 require "benchmark" Benchmark.bm do |b| b.report do 40000000.times { array[1], array[2] = array[2], array[1] } end end Benchmark.bm do |b| b.report do 40000000.times do t = array[1

设置一个临时变量来交换数组中的两个元素似乎比使用并行赋值更有效。有人能解释一下吗

require "benchmark"

Benchmark.bm do |b|
  b.report do
    40000000.times { array[1], array[2] = array[2], array[1] }
  end
end

Benchmark.bm do |b|
  b.report do
    40000000.times do
      t        = array[1]
      array[1] = array[2]
      array[2] = t
    end
  end
end
结果:

   user     system      total        real
   4.470000   0.020000   4.490000 (  4.510368)
   user     system      total        real
   3.220000   0.010000   3.230000 (  3.255109)

并行分配会创建一个临时数组,然后进行splats

GC.disable

def with_temp
  a = 1
  b = 2

  t = a
  a = b
  b = t
end

def with_parallel
  a = 1
  b = 2

  a, b = b, a
end

before_all = ObjectSpace.each_object(Array).count
with_temp
after_with_temp = ObjectSpace.each_object(Array).count
with_parallel
after_with_parallel = ObjectSpace.each_object(Array).count

GC.enable

puts after_with_temp - before_all          # => 1
puts after_with_parallel - after_with_temp # => 2
一个额外的
数组
来自
对象空间。每个对象(数组)。计数
本身


另一种验证方法-查看说明:

puts RubyVM::InstructionSequence.compile("a = 1; b = 2; t = a; a = b; b = t").disasm
puts RubyVM::InstructionSequence.compile("a = 1; b = 2; a, b = b, a").disasm
==解压:@>================
本地表(大小:4,argc:0[选项:0,剩余:-1,后置:0,块:-1,功率:-1@-1,剩余:-1])
[4]a[3]b[2]t
0000跟踪1(1)
0002 putobject_OP_INT2FIX_O_1_C_
0003设置本地_OP_uuwc_uu0 4
0005 putobject 2
0007设置本地_OP__WC_0 3
0009 getlocal_OP_WC_0 4
0011设置本地_OP_uwc_uu0 2
0013 getlocal_OP_uuWC_uuu0 3
0015设置本地_OP_uuwc_uu0 4
0017 getlocal_OP_uuWC_uuu0 2
0019 dup
0020设置本地_OP_uwc_uu0 3
0022离开


==解压:@>================
本地表(大小:3,argc:0[选项:0,剩余:-1,后置:0,块:-1,千瓦:-1@-1,剩余:-1])
[3]a[2]b
0000跟踪1(1)
0002 putobject_OP_INT2FIX_O_1_C_
0003设置本地_OP_uuwc_uu0 3
0005 putobject 2
0007设置本地_OP___WC__0 2
0009 getlocal_OP__WC__0 2
0011 getlocal_OP_uuWC_uuu0 3
0013新阵列2
0015 dup
0016扩展阵列2,0
0019设置本地_OP_uwc_uu0 3
0021设置本地_OP_uwc_uu0 2
0023离开


你能用指令序列之类的东西来改进你的答案吗?“并行赋值创建了一个临时数组,它随后会进行splats。”——这就是语言规范所说的应该发生的事情。但是,任何Ruby实现都可以自由地不这样做,前提是用户无法观察到差异。我知道JRuby优化了中间
数组
,我相信Rubinius和IronRuby也是这样。我怀疑,黄玉和磁悬浮可能也会消除它。我猜JRuby+Truffle也是这样。YARV没有,但再一次,YARV以速度慢和不执行任何优化而闻名,所以这并不奇怪。Erik Michaels Ober在他的演讲中提到速度快了40%,但没有说明原因-