C# ldobj和ldind之间有什么区别。<;类型>;,为什么ldobj更快?
当使用64位大小的结构时,以下代码段C# ldobj和ldind之间有什么区别。<;类型>;,为什么ldobj更快?,c#,clr,bytecode,il,C#,Clr,Bytecode,Il,当使用64位大小的结构时,以下代码段 [StructLayout(LayoutKind.Explicit, Pack = 1, Size = 8)] unsafe struct BUF { } ((BUF*)dst) = *((BUF*)src); 产生 IL_0046: nop IL_0047: ldloc.s dst IL_0049: ldloc.2
[StructLayout(LayoutKind.Explicit, Pack = 1, Size = 8)]
unsafe struct BUF
{
}
((BUF*)dst) = *((BUF*)src);
产生
IL_0046: nop
IL_0047: ldloc.s dst
IL_0049: ldloc.2
IL_004a: ldobj MyClass/BUF
IL_004f: stobj MyClass/BUF
但是,当只使用long时,以下代码将生成
*((long*)dst) = *((long*)src);
产生:
IL_0046: nop
IL_0047: ldloc.s dst
IL_0049: ldloc.2
IL_004a: ldind.i8
IL_004b: stind.i8
有人知道ldobj/stobj和ldind.i8/stind.i8在这个例子中有什么区别吗
ldobj/stobj的性能似乎提高了20%,但我不明白为什么会这样。这两条线做的不是完全一样吗
谢谢
编辑:[64位释放模式]字节码在释放模式下编译时看起来相同。性能度量是不久前在发布模式下完成的。我复制了您使用的两种不同方法,并看到生成了相同的IL,但是在发布模式下运行时,这两种方法的jitted代码是完全相同的: 以下是我使用的测试方法:
using System;
using System.Runtime.CompilerServices;
using System.Runtime.InteropServices;
namespace Test
{
[StructLayout(LayoutKind.Explicit, Pack = 1, Size = 8)]
unsafe struct BUF
{
}
static class Program
{
static void Main()
{
BUF x, y, z;
unsafe
{
Do1(&x, &y);
Do2(&y, &z);
}
// Readline here to allow attaching debugger and dumping jitted code
Console.ReadLine();
}
// Disable inlining to permit easier identification of the code
[MethodImpl(MethodImplOptions.NoInlining)]
unsafe static void Do1(BUF* src, BUF* dst)
{
*((BUF*)dst) = *((BUF*)src);
}
// Disable inlining to permit easier identification of the code
[MethodImpl(MethodImplOptions.NoInlining)]
unsafe static void Do2(BUF* src, BUF* dst)
{
*((long*)dst) = *((long*)src);
}
}
}
这两种方法的IL与您的相匹配:
Do1
:
IL_0000: ldarg.1
IL_0001: ldarg.0
IL_0002: ldobj Test.BUF
IL_0007: stobj Test.BUF
IL_000c: ret
Test.Program.Do1(Test.BUF*, Test.BUF*)
Begin 000007ff00170190, size 7
000007ff`00170190 488b01 mov rax,qword ptr [rcx]
000007ff`00170193 488902 mov qword ptr [rdx],rax
000007ff`00170196 c3 ret
和转储jitted代码:
Do1
:
IL_0000: ldarg.1
IL_0001: ldarg.0
IL_0002: ldobj Test.BUF
IL_0007: stobj Test.BUF
IL_000c: ret
Test.Program.Do1(Test.BUF*, Test.BUF*)
Begin 000007ff00170190, size 7
000007ff`00170190 488b01 mov rax,qword ptr [rcx]
000007ff`00170193 488902 mov qword ptr [rdx],rax
000007ff`00170196 c3 ret
它们看起来与我完全相同。请指定是在32位还是64位模式下测试的,以及CLR的版本。是否在未连接调试器的发布模式下测试?这是在调试模式下测试的。现在,我将在发布模式下再次检查。我将查看JIT编译的代码以查看差异。Brian完全正确。在调试模式下测试性能不会告诉您任何信息。甚至在调试时测试版本编译的程序集也不会告诉您任何信息。在这种情况下,抖动会关闭优化,使调试更容易。谢谢铱星!这让我想到,也许我在衡量绩效时做了一些愚蠢的事情。。。让我进一步挖掘。如何在发布模式下附加调试器?当我尝试这样做时(在程序启动后),我得到一个弹出窗口,上面说“以下模块是使用优化启用或没有调试信息构建的……将其更改为调试模式”。@r3su我使用的是Windbg,而不是Visual Studio。我测试性能的方式似乎有问题(秒表太细了)。如果我想检查一下汇编代码,我会更快地意识到这一点。再次感谢Iridium!