C++ 传递值结构是否推送到堆栈上?
如果程序员指定了一个大的结构,c/c++编译器是否会按值将结构推送到堆栈上,将数百字节复制到堆栈上?返回的结构会受到同样的惩罚吗?是的,大多数编译器都会推送堆栈,或者复制到堆栈值传递的结构(和C++ 传递值结构是否推送到堆栈上?,c++,c,compiler-construction,C++,C,Compiler Construction,如果程序员指定了一个大的结构,c/c++编译器是否会按值将结构推送到堆栈上,将数百字节复制到堆栈上?返回的结构会受到同样的惩罚吗?是的,大多数编译器都会推送堆栈,或者复制到堆栈值传递的结构(和类类)。它通常是相对于编译器、处理器和操作系统的(应用程序二进制接口)规范所要求的 有关详细信息,请参见例如和(至少对于Linux,x86-64) 实际上,大型结构位于堆栈上,通过寄存器(静默)传递指向它们的指针 ABI定义这些结构是否在调用方或被调用方调用帧中 对于两个字大小的struct-s,Linux
类类)。它通常是相对于编译器、处理器和操作系统的(应用程序二进制接口)规范所要求的
有关详细信息,请参见例如和(至少对于Linux,x86-64)
实际上,大型结构位于堆栈上,通过寄存器(静默)传递指向它们的指针
ABI定义这些结构是否在调用方或被调用方调用帧中
对于两个字大小的struct
-s,Linux x86-64 ABI通常通过一对寄存器传递它们(作为参数和结果)
使用,尝试使用gcc-O-S-fverbose asm foo.c
编译程序集代码foo.S
;您还可以使用或gcc-fdump tree all
来理解内部(Gimple)表示
<>注意,C++中一些非常复杂的<代码>类< /C>可能有一个小的值大小,因为内部涉及很多指针。例如,在Linux/AMD64上,sizeof(std::string)
只是一个(8字节)字(包含指向某些复杂内容的指针),它可能是通过寄存器传递的。同样,C++标准库中的许多容器都有一个小的值大小(大多数真实数据是通过指针间接访问的)。细节显然是特定于实现的。是的,大多数编译器都会推送堆栈,或者复制到堆栈值传递结构(和类es)。它通常是相对于编译器、处理器和操作系统的(应用程序二进制接口)规范所要求的
有关详细信息,请参见例如和(至少对于Linux,x86-64)
实际上,大型结构位于堆栈上,通过寄存器(静默)传递指向它们的指针
ABI定义这些结构是否在调用方或被调用方调用帧中
对于两个字大小的struct
-s,Linux x86-64 ABI通常通过一对寄存器传递它们(作为参数和结果)
使用,尝试使用gcc-O-S-fverbose asm foo.c
编译程序集代码foo.S
;您还可以使用或gcc-fdump tree all
来理解内部(Gimple)表示
<>注意,C++中一些非常复杂的<代码>类< /C>可能有一个小的值大小,因为内部涉及很多指针。例如,在Linux/AMD64上,sizeof(std::string)
只是一个(8字节)字(包含指向某些复杂内容的指针),它可能是通过寄存器传递的。同样,C++标准库中的许多容器都有一个小的值大小(大多数真实数据是通过指针间接访问的)。细节显然是特定于实现的。是的,如果您需要的话,编译器几乎肯定会像memcpy一样将数百字节的结构或类复制到堆栈上。如果不是这样的话,像这样的事情是行不通的:
std::string s = "A large amount of text";
std::string r = rev(s);
std::cout << s << " reversed is " << r << std::endl;
...
std::string rev(std::string s)
{
std::string::size_type len = s.length();
for(std::string::size_type i = 0; i < len / 2; i++)
{
swap(s[i], s[len-i]);
}
return s;
}
实际上,这将为堆栈上的两个mystring
对象腾出空间,一个用于s
进入rev\u my\u str
,另一个用于返回值
编辑:
由g++-O1
[1]为调用rev_my_string
生成的汇编程序,如上所述。有趣的是rep movsq
以及%ecx
、%rsi
和%rdi
的设置(分别为计数、源和目标)$26是它将复制的8字节单元数。26*8=208字节<代码>%rsp
是堆栈指针。这几乎就是memcpy
以简单形式内联时的样子[实际memcpy
很可能有一大堆额外的工作来处理未对齐的开始/结束和使用SSE指令等]
movl $26, %ecx
movq %rsp, %rdi
movq %rbx, %rsi
rep movsq
leaq 416(%rsp), %rdi
call _Z10rev_my_str8mystring
rev_my_字符串本身看起来像这样。注意函数底部的rep movsq
。这就是它存储结果字符串的地方
_Z10rev_my_str8mystring:
.LFB990:
.cfi_startproc
movq %rdi, %rax
movq 208(%rsp), %r9
movq %r9, %r10
shrq %r10
je .L5
addq $1, %r10
movl $1, %edx
.L6:
movl %r9d, %ecx
subl %edx, %ecx
leaq 7(%rsp), %rsi
addq %rdx, %rsi
movzbl (%rsi), %edi
movslq %ecx, %rcx
movzbl 8(%rsp,%rcx), %r8d
movb %r8b, (%rsi)
movb %dil, 8(%rsp,%rcx)
addq $1, %rdx
cmpq %r10, %rdx
jne .L6
.L5:
movl $26, %ecx
movq %rax, %rdi
leaq 8(%rsp), %rsi
rep movsq
ret
[1] 使用比这更高的优化会使编译器内联太多的代码(例如rev_my_string函数内联),并且很难看到发生了什么 是的,如果您需要的话,编译器几乎肯定会像memcpy一样将数百字节的结构或类复制到堆栈上。如果不是这样的话,像这样的事情是行不通的:
std::string s = "A large amount of text";
std::string r = rev(s);
std::cout << s << " reversed is " << r << std::endl;
...
std::string rev(std::string s)
{
std::string::size_type len = s.length();
for(std::string::size_type i = 0; i < len / 2; i++)
{
swap(s[i], s[len-i]);
}
return s;
}
实际上,这将为堆栈上的两个mystring
对象腾出空间,一个用于s
进入rev\u my\u str
,另一个用于返回值
编辑:
由g++-O1
[1]为调用rev_my_string
生成的汇编程序,如上所述。有趣的是rep movsq
以及%ecx
、%rsi
和%rdi
的设置(分别为计数、源和目标)$26是它将复制的8字节单元数。26*8=208字节<代码>%rsp
是堆栈指针。这几乎就是memcpy
以简单形式内联时的样子[实际memcpy
很可能有一大堆额外的工作来处理未对齐的开始/结束和使用SSE指令等]
movl $26, %ecx
movq %rsp, %rdi
movq %rbx, %rsi
rep movsq
leaq 416(%rsp), %rdi
call _Z10rev_my_str8mystring
rev_my_字符串本身看起来像这样。注意函数底部的rep movsq
。这就是它存储结果字符串的地方
_Z10rev_my_str8mystring:
.LFB990:
.cfi_startproc
movq %rdi, %rax
movq 208(%rsp), %r9
movq %r9, %r10
shrq %r10
je .L5
addq $1, %r10
movl $1, %edx
.L6:
movl %r9d, %ecx
subl %edx, %ecx
leaq 7(%rsp), %rsi
addq %rdx, %rsi
movzbl (%rsi), %edi
movslq %ecx, %rcx
movzbl 8(%rsp,%rcx), %r8d
movb %r8b, (%rsi)
movb %dil, 8(%rsp,%rcx)
addq $1, %rdx
cmpq %r10, %rdx
jne .L6
.L5:
movl $26, %ecx
movq %rax, %rdi
leaq 8(%rsp), %rsi
rep movsq
ret
[1] 使用比这更高的优化会使编译器内联太多的代码(例如rev_my_string函数内联),并且很难看到发生了什么 顺便说一句,如果你定义了编译器&ABI,你将如何传递堆栈外的大型结构???顺便说一句,如果你定义了编译器&ABI,你将如何传递