Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/clojure/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Gcc 为什么objdump的程序集编码不同?_Gcc_Assembly_X86_Objdump_Intel Syntax_Att - Fatal编程技术网

Gcc 为什么objdump的程序集编码不同?

Gcc 为什么objdump的程序集编码不同?,gcc,assembly,x86,objdump,intel-syntax,att,Gcc,Assembly,X86,Objdump,Intel Syntax,Att,我在阅读这篇关于位置无关代码的文章时,遇到了一个函数的汇编列表 0000043c <ml_func>: 43c: 55 push ebp 43d: 89 e5 mov ebp,esp 43f: e8 16 00 00 00 call 45a <__i686.get_pc_thunk.cx> 444: 81 c1 b0 1b 00 00

我在阅读这篇关于位置无关代码的文章时,遇到了一个函数的汇编列表

0000043c <ml_func>:
 43c:   55                      push   ebp
 43d:   89 e5                   mov    ebp,esp
 43f:   e8 16 00 00 00          call   45a <__i686.get_pc_thunk.cx>
 444:   81 c1 b0 1b 00 00       add    ecx,0x1bb0
 44a:   8b 81 f0 ff ff ff       mov    eax,DWORD PTR [ecx-0x10]
 450:   8b 00                   mov    eax,DWORD PTR [eax]
 452:   03 45 08                add    eax,DWORD PTR [ebp+0x8]
 455:   03 45 0c                add    eax,DWORD PTR [ebp+0xc]
 458:   5d                      pop    ebp
 459:   c3                      ret

0000045a <__i686.get_pc_thunk.cx>:
 45a:   8b 0c 24                mov    ecx,DWORD PTR [esp]
 45d:   c3                      ret
0000043c:
43c:55推式ebp
43d:89 e5 mov ebp,esp
43f:e8 16 00呼叫45a
444:81 c1 b0 1b 00添加ecx,0x1bb0
44a:8b 81 f0 ff mov eax,DWORD PTR[ecx-0x10]
450:8b 00 mov eax,德沃德PTR[eax]
452:03 45 08添加eax,DWORD PTR[ebp+0x8]
455:03 45 0c添加eax,DWORD PTR[ebp+0xc]
458:5d pop ebp
459:c3 ret
0000045a:
45a:8b 0c 24 mov ecx,德沃德PTR[esp]
45d:c3 ret
然而,在我的机器(gcc-7.3.0、Ubuntu 18.04 x86_64)上,我得到的结果略有不同,如下所示:

0000044d <ml_func>:
 44d:   55                      push   %ebp
 44e:   89 e5                   mov    %esp,%ebp
 450:   e8 29 00 00 00          call   47e <__x86.get_pc_thunk.ax>
 455:   05 ab 1b 00 00          add    $0x1bab,%eax
 45a:   8b 90 f0 ff ff ff       mov    -0x10(%eax),%edx
 460:   8b 0a                   mov    (%edx),%ecx
 462:   8b 55 08                mov    0x8(%ebp),%edx
 465:   01 d1                   add    %edx,%ecx
 467:   8b 90 f0 ff ff ff       mov    -0x10(%eax),%edx
 46d:   89 0a                   mov    %ecx,(%edx)
 46f:   8b 80 f0 ff ff ff       mov    -0x10(%eax),%eax
 475:   8b 10                   mov    (%eax),%edx
 477:   8b 45 0c                mov    0xc(%ebp),%eax
 47a:   01 d0                   add    %edx,%eax
 47c:   5d                      pop    %ebp
 47d:   c3                      ret 
0000044d:
44d:55推力%ebp
44e:89 e5 mov%esp,%ebp
450:e8 29 00 00呼叫47e
455:05 ab 1b 00 00添加$0x1bab,%eax
45a:8b 90 f0 ff mov-0x10(%eax),%edx
460:8b 0a mov(%edx),%ecx
462:8b 55 08 mov 0x8(%ebp),%edx
465:01 d1添加%edx,%ecx
467:8b 90 f0 ff mov-0x10(%eax),%edx
46d:89 0a mov%ecx,(%edx)
46f:8b 80 f0 ff mov-0x10(%eax),%eax
475:8b 10 mov(%eax),%edx
477:8b 45 0c mov 0xc(%ebp),%eax
47a:01 d0添加%edx,%eax
47c:5d pop%ebp
47d:c3 ret
我发现的主要区别在于
mov
指令的语义。在上面的列表中,
mov-ebp,esp
实际上将
esp
移动到
ebp
,而在下面的列表中,
mov%esp,%ebp
执行相同的操作,但操作数的顺序不同


这是相当令人困惑的,即使我必须编写手工编写的程序集。总而言之,我的问题是:(1)为什么我对相同的指令使用不同的汇编表示法;(2)在编写汇编代码时(例如,使用
\uu asm(::);

obdjump
默认为
-Matt
AT&T语法(如第二个代码块)。见vs。标记wiki有一些关于语法差异的信息:vs

这两种语法都有相同的限制,这是由机器本身的功能和机器代码的可编码性所造成的。它们只是在文本中表达的不同方式


英特尔语法使用
objdump-d-Mintel
。我在C++的代码中使用<强> >别名DASW-DRWC-Munelt' < /Calp> BasHrc<代码>,因此我可以<代码> Dasas Fo.O./Cord>并获得我想要的格式,打印了重置(重要的是有意义的非链接<代码> .O/COD>),没有长指令的线包装,并且C++符号名称有散乱。


在内联asm中,您可以使用任意一种语法,只要它符合编译器的期望。默认设置是AT&T,我建议使用它与clang兼容。也许有办法,但clang的工作方式与GCC的工作方式不同,它使用
-masm=intel

此外,AT&T基本上是x86上GNUC内联asm的标准,这意味着您的代码不需要特殊的构建选项即可工作

但是您可以使用
gcc-masm=intel
编译在
asm
语句中使用intel语法的源文件。如果你不在乎叮当声,这是你自己用的


如果您正在为标头编写代码,您可以使用方言替代方案使其在AT&T和Intel语法之间可移植,至少对于GCC:

static inline
void atomic_inc(volatile int *p) {
    // use __asm__ instead of asm in headers, so it works even with -std=c11 instead of gnu11
    __asm__("lock {addl $1, %0 | add %0, 1}": "+m"(*p));
// TODO: flag output for return value?
   // maybe doesn't need to be asm volatile; compilers know that modifying pointed-to memory is a visible side-effect unless it's a local that fully optimizes away.
   // If you want this to work as a memory barrier, use a `"memory"` clobber to stop compile-time memory reordering.  The lock prefix provides a runtime full barrier
}
gcc/clang的source+asm输出

使用
g++-O3
(默认值或
-masm=att
),我们得到

使用
g++-O3-masm=intel
,我们可以

atomic_inc(int volatile*):
    lock addl $1, (%rdi)              # operand-size is from my explicit addl suffix
    ret
atomic_inc(int volatile*):
    lock  add DWORD PTR [rdi], 1      # operand-size came from the %0 expansion
    ret
clang适用于AT&T版本,但不适用于
-masm=intel
(或
-mllvm--x86 asm syntax=intel
,这意味着),因为这显然只适用于LLVM发出的代码,而不适用于前端如何填充asm模板

叮当声错误消息为:

<source>:4:13: error: unknown use of instruction mnemonic without a size suffix
    __asm__("lock {addl $1, %0 | add %0, 1}": "+m"(*p));
            ^
<inline asm>:1:2: note: instantiated into assembly here
        lock  add (%rdi), 1
        ^
1 error generated.
:4:13:错误:未知使用没有大小后缀的指令助记符
__asm_uuu(“锁{addl$1,%0 | add%0,1}”):“+m”(*p));
^
:1:2:注意:此处实例化为程序集
锁定添加(%rdi),1
^
生成1个错误。

它选择了“英特尔”语法选项,但仍使用AT&T内存操作数填充模板。

顶部为英特尔语法,底部为AT&T语法。AT&T语法不同,源和目标是相反的,所以它是源,目标。如果要将英特尔语法与OBJDUMP结合使用,请使用选项
-Mintel
作为第二个问题如果要使用GCC编译并在内联汇编中使用英特尔语法,则可以将
-masm Intel
选项与GCC结合使用。默认设置为AT&T语法。查看intel vs AT&T的一种快速方法是查找具有立即值的行,如add ecx、0x1bb0或add$0x1bab,%eax,这些行将建立语法,然后您可以在阅读时将其翻转或不翻转到您认为正确的位置。关于代码中使用的特定年龄或语法(汇编语言由汇编程序定义,工具,而不是某些标准)的其他线索是查找寄存器上的mips样式百分号、mips样式-0x10(%eax)语法或英特尔样式的DWORD PTR[eax]带括号,不是英特尔与AT&T中的英特尔风格,而是通常独立于AT&T与否的英特尔风格。第一个示例是经典英特尔风格的英特尔语法汇编语言,后者是gnu汇编语言风格,gnu汇编语言是w