C++ 未使用的函数会改变性能_C++_Performance_Gcc

C++ 未使用的函数会改变性能

c++ performance gcc

C++ 未使用的函数会改变性能,c++,performance,gcc,C++,Performance,Gcc,在试图估计push_back和std:：inserter之间的性能差异时，我遇到了一个非常奇怪的性能问题让我们考虑下面的代码： #include <vector> using container = std::vector<int>; const int size = 1000000; const int count = 1000; #ifdef MYOWNFLAG void foo(std::insert_iterator<container> ist

在试图估计

push_back

和

std:：inserter

之间的性能差异时，我遇到了一个非常奇怪的性能问题

让我们考虑下面的代码：

#include <vector>
using container = std::vector<int>;
const int size  = 1000000;
const int count = 1000;

#ifdef MYOWNFLAG
void foo(std::insert_iterator<container> ist)
{
    for(int i=0; i<size; ++i)
        *ist++ = i;
}
#endif

void bar(container& cnt)
{
    for(int i=0; i<size; ++i)
        cnt.push_back(i);
}
int main()
{
    container cnt;
    for (int i=0; i<count; ++i)
    {
        cnt.clear();
        bar(cnt);
    }
    return 0;
}

请注意，如果我将

foo

的protopyte更改为使用

std:：back\u insert\u迭代器

，我将获得类似的性能，就像我没有设置标志一样

编译器的优化是怎么回事

编辑我使用gcc 4.9.2 20150304（预发布）

重新提出

由stefan在ideone上复制
由我在另一台带有gcc 4.9.2的机器上复制
我没有在另一台带有gcc 4.6.3和标志-std=c++0x的机器上复制

--param inline min speedup=2

快和慢的区别是什么？在慢速版本中，我们对
```
bar（）
```
中的
```
emplace\u back\u aux
```
调用无效，当您的foo未注释时，它会神奇地内联。所以我们可以得出这样的结论，酒吧很热，内线很深。很可能所有这些bug都是关于内联的
现在使用选项
```
-fdump ipa inline details
```
让我们看看内联转储。您将看到不同的时间/大小考虑。它很难阅读，我不想把所有的细节都贴在这里。但研究这些信息的一般结果是：GCC认为，模块大小的增长（以百分比为单位）不值得估计加速
怎么办？两种可能性：
3.1。使用未使用的
```
foo
```
代码增加模块大小和总体加速估计，即使用正确的类型（如插入迭代器）调用emplace\u，并使移动比率更大并达到内联限制（请注意，这种方式非常不稳定——在使用改进的内联算法的其他编译器版本中，一切都可能爆炸，而且您还需要非常幸运地猜测代码是否正常工作）
3.2.或移动内联限制。我对GCC所说的参数是“请考虑内联速度更低的大函数”

push_back

push_back

*ist++=0

*ist++=i

emplace\u back\u aux

$ g++ -g -pipe -march=native -pedantic -std=c++11 -W -Wall -Wextra -Werror -O3 -o bin/inserter src/inserter.cc && time ./bin/inserter
./bin/inserter  4,73s user 0,00s system 100% cpu 4,728 total

$ g++ -g -pipe -march=native -pedantic -std=c++11 -W -Wall -Wextra -Werror -O3 -o bin/inserter src/inserter.cc -DMYOWNFLAG && time ./bin/inserter
./bin/inserter  2,09s user 0,00s system 99% cpu 2,094 total

g++ -g -pipe -march=native -pedantic -std=c++11 -W -Wall -Wextra -Werror -O3 -o bin/inserter src/inserter.cc --param inline-unit-growth=200 && time ./bin/inserter
real    0m2.197s
user    0m2.200s
sys     0m0.000s

g++ -g -pipe -march=native -pedantic -std=c++11 -W -Wall -Wextra -Werror -O3 -o bin/inserter src/inserter.cc --param inline-min-speedup=2 && time ./bin/inserter
real    0m1.114s
user    0m1.100s
sys 0m0.010s