为什么我的程序只根据我给源文件操作数给Clang的顺序执行不同的操作？_C_Scope_Linker_Clang

为什么我的程序只根据我给源文件操作数给Clang的顺序执行不同的操作？

c linker clang

为什么我的程序只根据我给源文件操作数给Clang的顺序执行不同的操作？,c,scope,linker,clang,C,Scope,Linker,Clang,我有一个Brainfuck解释器项目，它有两个源文件，改变源文件作为操作数给Clang的顺序，没有别的，会导致一致的性能差异我使用的是Clang，具有以下参数： clang-I../ext-D VERSION=\'1.0.0\'main.c lex.c clang-I../ext-D VERSION=\'1.0.0\'lex.c main.c 无论优化级别如何，都可以看到性能差异基准结果： -O0lex-before-main:13.68s，main-before-lex:13.02s

我有一个Brainfuck解释器项目，它有两个源文件，改变源文件作为操作数给Clang的顺序，没有别的，会导致一致的性能差异

我使用的是Clang，具有以下参数：

clang-I../ext-D VERSION=\'1.0.0\'main.c lex.c

clang-I../ext-D VERSION=\'1.0.0\'lex.c main.c

无论优化级别如何，都可以看到性能差异

基准结果：

```
-O0
```
lex-before-main:13.68s，main-before-lex:13.02s
```
-01
```
lex-before-main:6.91s，main-before-lex:6.65s
```
-O2
```
lex-before-main:7.58s，main-before-lex:7.50s
```
-O3
```
lex-before-main:6.25s，main-before-lex:7.40s

优化级别之间，哪个顺序执行得更差并不总是一致的，但对于每个级别，相同的操作数顺序总是比另一个操作数顺序执行得更差

注:

可以找到源代码
我在解释器中使用的mandelbrot基准可以找到

编辑：

每个优化级别的可执行文件大小完全相同，但结构不同
对象文件与任一操作数顺序相同
无论操作数顺序如何，I/O和解析过程都非常快，即使在其中运行500 MiB随机文件也不会导致任何变化，因此在运行循环中会出现性能变化
在比较每个可执行文件的objdump时，我觉得主要的区别（如果不是唯一的话）是节（、等）的顺序，以及因此而更改的内存地址
可以找到objdump

$ gcc -I../ext -D VERSION=\"1.0.0\" main.c lex.c -O3 -o mainlex
$ gcc -I../ext -D VERSION=\"1.0.0\" lex.c main.c -O3 -o lexmain

static char arr[30000] = { 0 }, *ptr = arr;
static tok_t **dat; static size_t cap, top;

main

lex

数组

这只是一个假设，不是一个理论。

int main(int argc, char *argv[]) {
    char arr[30000] = { 0 }, *ptr = arr;
    tok_t **dat=NULL; size_t cap=0, top=0;

$ time ./mainlex.exe input.txt > /dev/null

real    0m6.385s
user    0m6.359s
sys     0m0.015s

$ time ./lexmain.exe input.txt > /dev/null

real    0m6.353s
user    0m6.343s
sys     0m0.015s

30K

lex

main

fputc

$ time ./mainlex.exe input.txt > /dev/null

real    0m6.385s
user    0m6.359s
sys     0m0.015s

$ time ./lexmain.exe input.txt > /dev/null

real    0m6.353s
user    0m6.343s
sys     0m0.015s