Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/postgresql/9.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C++ 使用大数组索引增加访问时间 问题_C++_Arrays_Visual Studio 2012_Assembly_Disassembly - Fatal编程技术网

C++ 使用大数组索引增加访问时间 问题

C++ 使用大数组索引增加访问时间 问题,c++,arrays,visual-studio-2012,assembly,disassembly,C++,Arrays,Visual Studio 2012,Assembly,Disassembly,我目前正在编写一个带有大型数组的程序,我对不同数组的处理时间感到非常困惑。一方面,我有7个“更小”的数组(发布模式(属性表中的优化被禁用[/Od]): 但是,如果我稍微修改一下代码,并用赋值替换增量,则输出会有点不同: [...] int until; int value; clock_t start,stop; cout << "Until: "; cin >> until; cout << "Value: "; cin >> value;

我目前正在编写一个带有大型数组的程序,我对不同数组的处理时间感到非常困惑。一方面,我有7个“更小”的数组(发布模式(属性表中的优化被禁用[/Od]):

但是,如果我稍微修改一下代码,并用赋值替换增量,则输出会有点不同:

[...]
int until;
int value;

clock_t start,stop;
cout << "Until: "; cin >> until;
cout << "Value: "; cin >> value;

start = clock();
for(i=0 ; i<until; i++)
{
    ExampleArray1[1]=value;
    ExampleArray2[1]=value;
    ExampleArray3[1]=value;
}
stop = clock();
cout << "Time: " << static_cast<float>(stop-start)/CLOCKS_PER_SEC << " sec.\n";

start = clock();
for(i=0 ; i<until; i++)
{
    ExampleArray4[1]=value;
    ExampleArray5[1]=value;
    ExampleArray6[1]=value;
}
stop = clock();
cout << "Time: " << static_cast<float>(stop-start)/CLOCKS_PER_SEC << " sec.\n";
[...]
输出->释放模式(完全启用Opitmization[/Ox]):

输出->释放模式(禁用优化[/Od]):

我认为数组的访问时间总是相同的。 我使用的是Visual Studio 2012 32位Express和Windows 7 64位。 我对每件东西都做了几次测试。测试时间大致相同(但最多+/-6秒),我取了一个四舍五入的平均值。 我的问题是:

问题
  • 为什么不同阵列大小的时间相差如此之大?->如果不拆分大型阵列,这是可以避免的吗
  • 为什么调试模式需要的时间比发布模式少
  • 没有优化的发布模式比有优化的发布模式更快的原因是什么
提前谢谢

编辑:

系统数据:
  • 项目负责人:AMD Phenom II X6 1045T(6 x 2,7GHz)
  • 一级缓存:768 KB(2x6x64 KB)2路|二级缓存:3072 KB(6x512 KB)16路|三级缓存:6 MB 48路
  • 内存:2x 4GB DDR3
  • SSD硬盘驱动器
反汇编(带递增的第一个代码) 拆卸-VS 2012(快速) 调试模式下的反汇编在每种情况下(大阵列和小阵列)都是相同的。 例如,数组1和第一个循环的标头:

    for (i = 0; i<until; i++)
01275FEA  mov         dword ptr [i],0  
01275FF1  jmp         main+21Ch (01275FFCh)  
01275FF3  mov         eax,dword ptr [i]  
01275FF6  add         eax,1  
01275FF9  mov         dword ptr [i],eax  
01275FFC  mov         eax,dword ptr [i]  
01275FFF  cmp         eax,dword ptr [until]  
01276002  jge         main+283h (01276063h)  
    {
        ExampleArray1[1]++;
01276004  mov         eax,4  
01276009  shl         eax,0  
0127600C  mov         ecx,dword ptr [ExampleArray1]  
0127600F  mov         edx,dword ptr [ecx+eax]  
01276012  add         edx,1  
01276015  mov         eax,4  
0127601A  shl         eax,0  
0127601D  mov         ecx,dword ptr [ExampleArray1]  
01276020  mov         dword ptr [ecx+eax],edx  
    for(i=0 ; i<until; i++)
00AD10D9  xor         ecx,ecx  
00AD10DB  mov         dword ptr [esp+24h],eax  
00AD10DF  cmp         dword ptr [esp+10h],ecx  
00AD10E3  jle         main+0F5h (0AD10F5h)  
    {
        ExampleArray1[1]++;
00AD10E5  inc         dword ptr [esi+4]  
        ExampleArray2[1]++;
00AD10E8  inc         dword ptr [ebx+4]  
        ExampleArray3[1]++;
00AD10EB  inc         dword ptr [edi+4]  
00AD10EE  inc         ecx  
00AD10EF  cmp         ecx,dword ptr [esp+10h]  
00AD10F3  jl          main+0E5h (0AD10E5h)
    for(i=0 ; i<until; i++)
001A17A2  mov         dword ptr [i],0  
001A17A9  jmp         main+1C4h (01A17B4h)  
001A17AB  mov         edx,dword ptr [i]  
001A17AE  add         edx,1  
001A17B1  mov         dword ptr [i],edx  
001A17B4  mov         eax,dword ptr [i]  
001A17B7  cmp         eax,dword ptr [until]  
001A17BA  jge         main+22Bh (01A181Bh)  
    {
        ExampleArray1[1]++;
001A17BC  mov         ecx,4  
001A17C1  shl         ecx,0  
001A17C4  mov         edx,dword ptr [ExampleArray1]  
001A17C7  mov         eax,dword ptr [edx+ecx]  
001A17CA  add         eax,1  
001A17CD  mov         ecx,4  
001A17D2  shl         ecx,0  
001A17D5  mov         edx,dword ptr [ExampleArray1]  
001A17D8  mov         dword ptr [edx+ecx],eax  
        ExampleArray2[1]++;
001A17DB  mov         eax,4  
001A17E0  shl         eax,0  
001A17E3  mov         ecx,dword ptr [ExampleArray2]  
001A17E6  mov         edx,dword ptr [ecx+eax]  
001A17E9  add         edx,1  
001A17EC  mov         eax,4  
001A17F1  shl         eax,0  
001A17F4  mov         ecx,dword ptr [ExampleArray2]  
001A17F7  mov         dword ptr [ecx+eax],edx  
        ExampleArray3[1]++;
001A17FA  mov         edx,4  
001A17FF  shl         edx,0  
001A1802  mov         eax,dword ptr [ExampleArray3]  
001A1805  mov         ecx,dword ptr [eax+edx]  
001A1808  add         ecx,1  
001A180B  mov         edx,4  
001A1810  shl         edx,0  
001A1813  mov         eax,dword ptr [ExampleArray3]  
001A1816  mov         dword ptr [eax+edx],ecx  
    for (i = 0; i<until; i++)
01391384  xor         ecx,ecx  
01391386  mov         dword ptr [esp+10h],eax  
0139138A  cmp         dword ptr [esp+20h],ecx  
0139138E  jle         main+100h (013913A0h)  
    {
        ExampleArray1[1]++;
01391390  inc         dword ptr [esi+4]  
01391393  inc         ecx  
        ExampleArray2[1]++;
01391394  inc         dword ptr [ebx+4]  
        ExampleArray3[1]++;
01391397  inc         dword ptr [edi+4]  
0139139A  cmp         ecx,dword ptr [esp+20h]  
0139139E  jl          main+0F0h (01391390h)  
    }
    for (i = 0; i<until; i++)
00DC182C  mov         dword ptr [i],0  
00DC1833  jmp         main+1CEh (0DC183Eh)  
00DC1835  mov         edx,dword ptr [i]  
00DC1838  add         edx,1  
00DC183B  mov         dword ptr [i],edx  
00DC183E  mov         eax,dword ptr [i]  
00DC1841  cmp         eax,dword ptr [until]  
00DC1844  jge         main+235h (0DC18A5h)  
    {
        ExampleArray1[1]++;
00DC1846  mov         ecx,4  
00DC184B  shl         ecx,0  
00DC184E  mov         edx,dword ptr [ExampleArray1]  
00DC1851  mov         eax,dword ptr [edx+ecx]  
00DC1854  add         eax,1  
00DC1857  mov         ecx,4  
00DC185C  shl         ecx,0  
00DC185F  mov         edx,dword ptr [ExampleArray1]  
00DC1862  mov         dword ptr [edx+ecx],eax  
        ExampleArray2[1]++;
00DC1865  mov         eax,4  
00DC186A  shl         eax,0  
00DC186D  mov         ecx,dword ptr [ExampleArray2]  
00DC1870  mov         edx,dword ptr [ecx+eax]  
00DC1873  add         edx,1  
00DC1876  mov         eax,4  
00DC187B  shl         eax,0  
00DC187E  mov         ecx,dword ptr [ExampleArray2]  
00DC1881  mov         dword ptr [ecx+eax],edx  
        ExampleArray3[1]++;
00DC1884  mov         edx,4  
00DC1889  shl         edx,0  
00DC188C  mov         eax,dword ptr [ExampleArray3]  
00DC188F  mov         ecx,dword ptr [eax+edx]  
00DC1892  add         ecx,1  
00DC1895  mov         edx,4  
00DC189A  shl         edx,0  
00DC189D  mov         eax,dword ptr [ExampleArray3]  
00DC18A0  mov         dword ptr [eax+edx],ecx  
        }

for(i=0;i在我看来,这就像缓存问题

如果,而不是

for(i=0 ; i<until; i++)
{
    ExampleArray4[1]++;
    ExampleArray5[1]++;
    ExampleArray6[1]++;
}

用于(i=0;i使用Visual Studio 2013,使用硬编码到10亿,调试时间为2.5/2.8秒,发布时间为1.6/1.7秒。您可能会遇到缓存大小问题,但不知道您的处理器、ram以及机器上运行的其他任何东西,这只是一个猜测。也有可能您的rel中的事情顺序不同轻松构建,这样您就可以计时键入数字所需的时间。查看反汇编。我看到的(近似但一致)时间是(与问题中给出的顺序相同,均以秒为单位):
4.7,6.9;1.7,3.3;4.7,6.9
。我在VS2013(VC12)上编译。这意味着我似乎无法复制您的代码“优化异常”。但小型阵列和大型阵列之间确实存在差异。我认为这可能是一个“缓存关联性”问题(但我不知道具体如何或为什么)。我将代码更改为在两个内部循环(小型阵列和大型阵列)中进行2次更新,而不是3次更新,优化发布版本的时间现在分别为2.1秒和2.2秒。(是的,小型阵列的更新速度变慢了!)我无法使用Visual Studio 2013 Pro进行复制。我的调试时间为2.5/3.5,发布模式时间为2.1/2.17。这与人们所期望的一样。反汇编的重要部分缺失,即开始/结束时钟值是相对于代码其余部分分配的。使用硬编码的
直到
值rath,您会得到什么结果而不是从cin获得它?
Time: 24 sec.
Time: 28 sec.
    for (i = 0; i<until; i++)
01275FEA  mov         dword ptr [i],0  
01275FF1  jmp         main+21Ch (01275FFCh)  
01275FF3  mov         eax,dword ptr [i]  
01275FF6  add         eax,1  
01275FF9  mov         dword ptr [i],eax  
01275FFC  mov         eax,dword ptr [i]  
01275FFF  cmp         eax,dword ptr [until]  
01276002  jge         main+283h (01276063h)  
    {
        ExampleArray1[1]++;
01276004  mov         eax,4  
01276009  shl         eax,0  
0127600C  mov         ecx,dword ptr [ExampleArray1]  
0127600F  mov         edx,dword ptr [ecx+eax]  
01276012  add         edx,1  
01276015  mov         eax,4  
0127601A  shl         eax,0  
0127601D  mov         ecx,dword ptr [ExampleArray1]  
01276020  mov         dword ptr [ecx+eax],edx  
    for(i=0 ; i<until; i++)
00AD10D9  xor         ecx,ecx  
00AD10DB  mov         dword ptr [esp+24h],eax  
00AD10DF  cmp         dword ptr [esp+10h],ecx  
00AD10E3  jle         main+0F5h (0AD10F5h)  
    {
        ExampleArray1[1]++;
00AD10E5  inc         dword ptr [esi+4]  
        ExampleArray2[1]++;
00AD10E8  inc         dword ptr [ebx+4]  
        ExampleArray3[1]++;
00AD10EB  inc         dword ptr [edi+4]  
00AD10EE  inc         ecx  
00AD10EF  cmp         ecx,dword ptr [esp+10h]  
00AD10F3  jl          main+0E5h (0AD10E5h)
        for(i=0 ; i<until; i++)
003B13B4  xor         ecx,ecx  
003B13B6  mov         dword ptr [esp+24h],eax  
003B13BA  cmp         dword ptr [esp+10h],ecx  
003B13BE  jle         main+174h (03B13E4h)  
        for(i=0 ; i<until; i++)
003B13C0  mov         eax,dword ptr [esp+1Ch]  
003B13C4  mov         edx,dword ptr [esp+18h]  
003B13C8  mov         edi,dword ptr [esp+20h]  
003B13CC  lea         esp,[esp]  
    {
        ExampleArray4[1]++;
003B13D0  inc         dword ptr [eax+4]  
        ExampleArray5[1]++;
003B13D3  inc         dword ptr [edx+4]  
        ExampleArray6[1]++;
003B13D6  inc         dword ptr [edi+4]  
003B13D9  inc         ecx  
003B13DA  cmp         ecx,dword ptr [esp+10h]  
003B13DE  jl          main+160h (03B13D0h)  
003B13E0  mov         edi,dword ptr [esp+14h]  
    }
    for(i=0 ; i<until; i++)
001A17A2  mov         dword ptr [i],0  
001A17A9  jmp         main+1C4h (01A17B4h)  
001A17AB  mov         edx,dword ptr [i]  
001A17AE  add         edx,1  
001A17B1  mov         dword ptr [i],edx  
001A17B4  mov         eax,dword ptr [i]  
001A17B7  cmp         eax,dword ptr [until]  
001A17BA  jge         main+22Bh (01A181Bh)  
    {
        ExampleArray1[1]++;
001A17BC  mov         ecx,4  
001A17C1  shl         ecx,0  
001A17C4  mov         edx,dword ptr [ExampleArray1]  
001A17C7  mov         eax,dword ptr [edx+ecx]  
001A17CA  add         eax,1  
001A17CD  mov         ecx,4  
001A17D2  shl         ecx,0  
001A17D5  mov         edx,dword ptr [ExampleArray1]  
001A17D8  mov         dword ptr [edx+ecx],eax  
        ExampleArray2[1]++;
001A17DB  mov         eax,4  
001A17E0  shl         eax,0  
001A17E3  mov         ecx,dword ptr [ExampleArray2]  
001A17E6  mov         edx,dword ptr [ecx+eax]  
001A17E9  add         edx,1  
001A17EC  mov         eax,4  
001A17F1  shl         eax,0  
001A17F4  mov         ecx,dword ptr [ExampleArray2]  
001A17F7  mov         dword ptr [ecx+eax],edx  
        ExampleArray3[1]++;
001A17FA  mov         edx,4  
001A17FF  shl         edx,0  
001A1802  mov         eax,dword ptr [ExampleArray3]  
001A1805  mov         ecx,dword ptr [eax+edx]  
001A1808  add         ecx,1  
001A180B  mov         edx,4  
001A1810  shl         edx,0  
001A1813  mov         eax,dword ptr [ExampleArray3]  
001A1816  mov         dword ptr [eax+edx],ecx  
    for(i=0 ; i<until; i++)
001A186F  mov         dword ptr [i],0  
001A1876  jmp         main+291h (01A1881h)  
001A1878  mov         eax,dword ptr [i]  
001A187B  add         eax,1  
001A187E  mov         dword ptr [i],eax  
001A1881  mov         ecx,dword ptr [i]  
001A1884  cmp         ecx,dword ptr [until]  
001A1887  jge         main+2F8h (01A18E8h)  
    {
        ExampleArray4[1]++;
001A1889  mov         edx,4  
001A188E  shl         edx,0  
001A1891  mov         eax,dword ptr [ExampleArray4]  
001A1894  mov         ecx,dword ptr [eax+edx]  
001A1897  add         ecx,1  
001A189A  mov         edx,4  
001A189F  shl         edx,0  
001A18A2  mov         eax,dword ptr [ExampleArray4]  
    {
        ExampleArray4[1]++;
001A18A5  mov         dword ptr [eax+edx],ecx  
        ExampleArray5[1]++;
001A18A8  mov         ecx,4  
001A18AD  shl         ecx,0  
001A18B0  mov         edx,dword ptr [ExampleArray5]  
001A18B3  mov         eax,dword ptr [edx+ecx]  
001A18B6  add         eax,1  
001A18B9  mov         ecx,4  
001A18BE  shl         ecx,0  
001A18C1  mov         edx,dword ptr [ExampleArray5]  
001A18C4  mov         dword ptr [edx+ecx],eax  
        ExampleArray6[1]++;
001A18C7  mov         eax,4  
001A18CC  shl         eax,0  
001A18CF  mov         ecx,dword ptr [ExampleArray6]  
001A18D2  mov         edx,dword ptr [ecx+eax]  
001A18D5  add         edx,1  
001A18D8  mov         eax,4  
001A18DD  shl         eax,0  
001A18E0  mov         ecx,dword ptr [ExampleArray6]  
001A18E3  mov         dword ptr [ecx+eax],edx  
    }
    for (i = 0; i<until; i++)
01391384  xor         ecx,ecx  
01391386  mov         dword ptr [esp+10h],eax  
0139138A  cmp         dword ptr [esp+20h],ecx  
0139138E  jle         main+100h (013913A0h)  
    {
        ExampleArray1[1]++;
01391390  inc         dword ptr [esi+4]  
01391393  inc         ecx  
        ExampleArray2[1]++;
01391394  inc         dword ptr [ebx+4]  
        ExampleArray3[1]++;
01391397  inc         dword ptr [edi+4]  
0139139A  cmp         ecx,dword ptr [esp+20h]  
0139139E  jl          main+0F0h (01391390h)  
    }
    for (i = 0; i<until; i++)
013913EF  xor         ecx,ecx  
013913F1  mov         dword ptr [esp+10h],eax  
013913F5  cmp         dword ptr [esp+20h],ecx  
013913F9  jle         main+17Bh (0139141Bh)  
013913FB  mov         eax,dword ptr [esp+18h]  
013913FF  mov         edx,dword ptr [esp+0Ch]  
01391403  mov         edi,dword ptr [esp+1Ch]  
    {
        ExampleArray4[1]++;
01391407  inc         dword ptr [eax+4]  
0139140A  inc         ecx  
        ExampleArray5[1]++;
0139140B  inc         dword ptr [edx+4]  
        ExampleArray6[1]++;
0139140E  inc         dword ptr [edi+4]  
01391411  cmp         ecx,dword ptr [esp+20h]  
01391415  jl          main+167h (01391407h)  
01391417  mov         edi,dword ptr [esp+14h]  
    }
    for (i = 0; i<until; i++)
00DC182C  mov         dword ptr [i],0  
00DC1833  jmp         main+1CEh (0DC183Eh)  
00DC1835  mov         edx,dword ptr [i]  
00DC1838  add         edx,1  
00DC183B  mov         dword ptr [i],edx  
00DC183E  mov         eax,dword ptr [i]  
00DC1841  cmp         eax,dword ptr [until]  
00DC1844  jge         main+235h (0DC18A5h)  
    {
        ExampleArray1[1]++;
00DC1846  mov         ecx,4  
00DC184B  shl         ecx,0  
00DC184E  mov         edx,dword ptr [ExampleArray1]  
00DC1851  mov         eax,dword ptr [edx+ecx]  
00DC1854  add         eax,1  
00DC1857  mov         ecx,4  
00DC185C  shl         ecx,0  
00DC185F  mov         edx,dword ptr [ExampleArray1]  
00DC1862  mov         dword ptr [edx+ecx],eax  
        ExampleArray2[1]++;
00DC1865  mov         eax,4  
00DC186A  shl         eax,0  
00DC186D  mov         ecx,dword ptr [ExampleArray2]  
00DC1870  mov         edx,dword ptr [ecx+eax]  
00DC1873  add         edx,1  
00DC1876  mov         eax,4  
00DC187B  shl         eax,0  
00DC187E  mov         ecx,dword ptr [ExampleArray2]  
00DC1881  mov         dword ptr [ecx+eax],edx  
        ExampleArray3[1]++;
00DC1884  mov         edx,4  
00DC1889  shl         edx,0  
00DC188C  mov         eax,dword ptr [ExampleArray3]  
00DC188F  mov         ecx,dword ptr [eax+edx]  
00DC1892  add         ecx,1  
00DC1895  mov         edx,4  
00DC189A  shl         edx,0  
00DC189D  mov         eax,dword ptr [ExampleArray3]  
00DC18A0  mov         dword ptr [eax+edx],ecx  
        }
    for (i = 0; i<until; i++)
00DC18F9  mov         dword ptr [i],0  
00DC1900  jmp         main+29Bh (0DC190Bh)  
00DC1902  mov         eax,dword ptr [i]  
00DC1905  add         eax,1  
00DC1908  mov         dword ptr [i],eax  
00DC190B  mov         ecx,dword ptr [i]  
00DC190E  cmp         ecx,dword ptr [until]  
00DC1911  jge         main+302h (0DC1972h)  
    {
        ExampleArray4[1]++;
 00DC1913  mov         edx,4  
    {
        ExampleArray4[1]++;
00DC1918  shl         edx,0  
00DC191B  mov         eax,dword ptr [ExampleArray4]  
00DC191E  mov         ecx,dword ptr [eax+edx]  
00DC1921  add         ecx,1  
00DC1924  mov         edx,4  
00DC1929  shl         edx,0  
00DC192C  mov         eax,dword ptr [ExampleArray4]  
00DC192F  mov         dword ptr [eax+edx],ecx  
        ExampleArray5[1]++;
00DC1932  mov         ecx,4  
00DC1937  shl         ecx,0  
00DC193A  mov         edx,dword ptr [ExampleArray5]  
00DC193D  mov         eax,dword ptr [edx+ecx]  
00DC1940  add         eax,1  
00DC1943  mov         ecx,4  
00DC1948  shl         ecx,0  
00DC194B  mov         edx,dword ptr [ExampleArray5]  
00DC194E  mov         dword ptr [edx+ecx],eax  
        ExampleArray6[1]++;
00DC1951  mov         eax,4  
00DC1956  shl         eax,0  
00DC1959  mov         ecx,dword ptr [ExampleArray6]  
00DC195C  mov         edx,dword ptr [ecx+eax]  
00DC195F  add         edx,1  
00DC1962  mov         eax,4  
00DC1967  shl         eax,0  
00DC196A  mov         ecx,dword ptr [ExampleArray6]  
00DC196D  mov         dword ptr [ecx+eax],edx  
    }
for(i=0 ; i<until; i++)
{
    ExampleArray4[1]++;
    ExampleArray5[1]++;
    ExampleArray6[1]++;
}
for(i=0 ; i<until; i++) ExampleArray4[1]++;
for(i=0 ; i<until; i++) ExampleArray5[1]++;
for(i=0 ; i<until; i++) ExampleArray6[1]++;