C# NET阵列的开销?
我试图使用以下代码确定.NET阵列(在32位进程中)上的头的开销:C# NET阵列的开销?,c#,.net,arrays,overhead,C#,.net,Arrays,Overhead,我试图使用以下代码确定.NET阵列(在32位进程中)上的头的开销: long bytes1 = GC.GetTotalMemory(false); object[] array = new object[10000]; for (int i = 0; i < 10000; i++) array[i] = new int[1]; long bytes2 = GC.GetTotalMemory(false); array[0] = null; // ensure no
long bytes1 = GC.GetTotalMemory(false);
object[] array = new object[10000];
for (int i = 0; i < 10000; i++)
array[i] = new int[1];
long bytes2 = GC.GetTotalMemory(false);
array[0] = null; // ensure no garbage collection before this point
Console.WriteLine(bytes2 - bytes1);
// Calculate array overhead in bytes by subtracting the size of
// the array elements (40000 for object[10000] and 4 for each
// array), and dividing by the number of arrays (10001)
Console.WriteLine("Array overhead: {0:0.000}",
((double)(bytes2 - bytes1) - 40000) / 10001 - 4);
Console.Write("Press any key to continue...");
Console.ReadKey();
在32位进程中,对象[1]的大小应该与int[1]的大小相同,但实际上开销增加了3.28个字节,达到
237568
Array overhead: 15.755
有人知道为什么吗
(顺便说一句,如果有人好奇的话,非数组对象的开销,例如上面循环中的(object)i,大约是8字节(8.384)。我听说64位进程的开销是16字节。)因为堆管理(因为处理getTotalMemy)只能分配相当大的块,后者由较小的块分配,用于CLR的程序员目的 我认为您在测量时做出了一些错误的假设,因为循环期间的内存分配(通过GetTotalMemory)可能与仅阵列的实际所需内存不同-内存可能分配在更大的块中,内存中可能有其他对象在循环期间回收,等等 以下是有关阵列开销的一些信息:
object[]
,并附加对实际类型的type对象的引用。因此string[]
实际上只是一个对象[]
,带有对类型string
的附加类型引用。详情请参阅下文
数组中存储的值:引用类型的数组保存对对象的引用,因此数组中的每个条目都是引用的大小(即32位上的4个字节)。值类型数组内联存储值,因此每个元素将占用所讨论类型的大小
这一问题也可能令人感兴趣:
血淋淋的细节
考虑以下代码
var strings = new string[1];
var ints = new int[1];
strings[0] = "hello world";
ints[0] = 42;
连接WinDbg显示以下内容:
首先,让我们看一下值类型数组。
0:000> !dumparray -details 017e2acc
Name: System.Int32[]
MethodTable: 63b9aa40
EEClass: 6395b4d4
Size: 16(0x10) bytes
Array: Rank 1, Number of elements 1, Type Int32
Element Methodtable: 63b9aaf0
[0] 017e2ad4
Name: System.Int32
MethodTable 63b9aaf0
EEClass: 6395b548
Size: 12(0xc) bytes
(C:\Windows\assembly\GAC_32\mscorlib\2.0.0.0__b77a5c561934e089\mscorlib.dll)
Fields:
MT Field Offset Type VT Attr Value Name
63b9aaf0 40003f0 0 System.Int32 1 instance 42 m_value <=== Our value
0:000> !objsize 017e2acc
sizeof(017e2acc) = 16 ( 0x10) bytes (System.Int32[])
0:000> dd 017e2acc -0x4
017e2ac8 00000000 63b9aa40 00000001 0000002a <=== That's the value
首先,我们转储数组和字符串。接下来,我们转储字符串[]
的大小。请注意,WinDbg在此处将类型列为System.Object[]
。本例中的对象大小包括字符串本身,因此总大小是数组中的20加上字符串的40
通过转储实例的原始字节,我们可以看到以下内容:首先是SyncBlock,然后是object[]
的方法表,然后是数组的长度。之后,我们找到了额外的4个字节,并引用了字符串的方法表。如上图所示,这可以通过dumpmt命令进行验证。最后,我们找到对实际字符串实例的单个引用
总之
阵列的开销可以分解如下(即在32位上)
- 4字节同步块
- 数组本身的方法表(类型引用)为4字节
- 4字节表示数组的长度
- 引用类型数组增加了另外4个字节来保存实际元素类型的方法表(引用类型数组是
在引擎盖下)object[]
即,对于值类型数组,开销为12字节;对于引用类型数组,开销为16字节 很抱歉,今天早上我发现了关于内存过热的有趣信息 我们有一个处理大量数据(高达2GB)的项目。作为主要存储,我们使用
字典
。事实上,成千上万的字典被创造出来了。将键更改为List
,将值更改为List
(我们自己实现了IDictionary
),内存使用率降低了约30-40%
为什么?这里有一个稍微简洁(IMO)的简短但完整的程序来演示同样的事情:
using System;
class Test
{
const int Size = 100000;
static void Main()
{
object[] array = new object[Size];
long initialMemory = GC.GetTotalMemory(true);
for (int i = 0; i < Size; i++)
{
array[i] = new string[0];
}
long finalMemory = GC.GetTotalMemory(true);
GC.KeepAlive(array);
long total = finalMemory - initialMemory;
Console.WriteLine("Size of each element: {0:0.000} bytes",
((double)total) / Size);
}
}
我们的结局如下:
Variables:
x=(0x1f228c8) <System.Object[]>
y=(0x1f228dc) <System.String[]>
z=(0x1f228f0) <System.Int32[]>
Memory:
0x1f228c4: 00000000 003284dc 00000001 00326d54 00000000 // Data for x
0x1f228d8: 00000000 003284dc 00000001 00329134 00000000 // Data for y
0x1f228ec: 00000000 00d443fc 00000001 12345678 // Data for z
这就是我前面提到的协方差。现在考虑到每一个任务都会发生这种情况,减少间接操作的数量是有意义的。特别是,我怀疑您不是真的想通过为每个assignment转到type对象来获取元素类型来破坏缓存。我怀疑(我的x86程序集不够好,无法验证这一点)测试类似于:
- 要复制的值是否为空引用?如果是的话,没关系。(完成)
- 获取引用点所在对象的类型指针
- 该类型指针与元素类型指针(简单二进制相等检查)相同吗?如果是的话,没关系。(完成)
- 该类型指针赋值是否与元素类型指针兼容?(检查要复杂得多,涉及继承和接口。)如果是这样,没关系——否则,抛出异常
好问题-深入研究它真的很有趣:)这是在调试还是发布版本中?嗯,我实际上不知道,我在使用SnippetCompiler。当我切换到VisualStudio时,结果略有变化:int[1]为11.92,object[1]为15.94,无论
using System;
class Test
{
const int Size = 100000;
static void Main()
{
object[] array = new object[Size];
long initialMemory = GC.GetTotalMemory(true);
for (int i = 0; i < Size; i++)
{
array[i] = new string[0];
}
long finalMemory = GC.GetTotalMemory(true);
GC.KeepAlive(array);
long total = finalMemory - initialMemory;
Console.WriteLine("Size of each element: {0:0.000} bytes",
((double)total) / Size);
}
}
object[] x = new object[1];
string[] y = new string[1];
int[] z = new int[1];
z[0] = 0x12345678;
lock(z) {}
Variables:
x=(0x1f228c8) <System.Object[]>
y=(0x1f228dc) <System.String[]>
z=(0x1f228f0) <System.Int32[]>
Memory:
0x1f228c4: 00000000 003284dc 00000001 00326d54 00000000 // Data for x
0x1f228d8: 00000000 003284dc 00000001 00329134 00000000 // Data for y
0x1f228ec: 00000000 00d443fc 00000001 12345678 // Data for z
object[] x = new object[1];
object[] y = new string[1];
x[0] = new object(); // Valid
y[0] = new object(); // Invalid - will throw an exception