Linux kernel armlinux:进程地址空间
我正在使用一个带有ARM cortex_A9_MPCORE处理器的开发板(snowball),它运行的linux内核为3.0.8+。 我使用GDB和openocd进行调试 我正在寻找一种方法来查找用户模式进程的地址空间,特别是文本段和用户模式堆栈 首先,我查看了/proc/“PID”/maps,例如,我得到了一个正在运行的进程的输出:Linux kernel armlinux:进程地址空间,linux-kernel,arm,embedded-linux,Linux Kernel,Arm,Embedded Linux,我正在使用一个带有ARM cortex_A9_MPCORE处理器的开发板(snowball),它运行的linux内核为3.0.8+。 我使用GDB和openocd进行调试 我正在寻找一种方法来查找用户模式进程的地址空间,特别是文本段和用户模式堆栈 首先,我查看了/proc/“PID”/maps,例如,我得到了一个正在运行的进程的输出: # cat /proc/1124/maps 00008000-000d5000 r-xp 00000000 b3:02 181 /system/bi
# cat /proc/1124/maps
00008000-000d5000 r-xp 00000000 b3:02 181 /system/bin/lbsd
000d5000-000f8000 rw-p 000cd000 b3:02 181 /system/bin/lbsd
000f8000-0014a000 rw-p 00000000 00:00 0 [heap]
0014a000-0014c000 rw-p 00000000 00:00 0 [heap]
.
.
.
b0001000-b0009000 r-xp 00001000 b3:02 183 /system/bin/linker
b0009000-b000a000 rw-p 00009000 b3:02 183 /system/bin/linker
b000a000-b0015000 rw-p 00000000 00:00 0
bea00000-bea21000 rw-p 00000000 00:00 0 [stack]
ffff0000-ffff1000 r-xp 00000000 00:00 0 [vectors]
然后,我使用GDB编写了一个脚本,从init_task开始解析板上运行的任务列表,对于每个任务,它都会获取task_struct中的mm_struct的值,然后提取start_code、end_code和start_stack的值。最后,脚本解析mmap所指向的不同内存区域。
脚本在板处于调试状态时运行,cortex a9的两个核心都暂停
以下是与上述相同流程的GDB脚本输出:
taskaddr 0xdf29f140
Name: lbsd
mm start text 8000
mm end text d4ba4
mm start stack bee63df0
####MEMORY REGIONS#####
vm_start 0x8000
vm_end 0xd5000
vm_flags 0x8001875
-----------------------
vm_start 0xd5000
vm_end 0xf8000
vm_flags 0x8101873
-----------------------
vm_start 0xf8000
vm_end 0x14a000
vm_flags 0x100073
-----------------------
vm_start 0x14a000
vm_end 0x14c000
vm_flags 0x100073
-----------------------
.
.
.
-----------------------
vm_start 0xb0001000
vm_end 0xb0009000
vm_flags 0x8000875
-----------------------
vm_start 0xb0009000
vm_end 0xb000a000
vm_flags 0x8100873
-----------------------
vm_start 0xb000a000
vm_end 0xb0015000
vm_flags 0x100073
-----------------------
vm_start 0xbee42000
vm_end 0xbee64000
vm_flags 0x100173
-----------------------
vm_start 0xffff0000
vm_end 0xffff1000
vm_flags 0x40c0055
-----------------------
除堆栈外,内存区域与使用的两种方法都匹配,在/proc方法的输出中,它从BEA0000开始,而在mm_结构的start_stack字段中,它位于bee63df0,vm_struct指向的内存区域指示bee42000。
有人能解释一下这些值的区别吗
我的第二个问题是关于00008000和000d5000之间的第一个内存区域的值,它对应于进程的文本部分。我注意到很多进程共享这些地址。内核如何获得文本内存区域的实际地址?在ARM上,堆栈向下扩展。这意味着堆栈从更高的地址开始。这在堆栈
vma
的vm_标志中可见,该堆栈设置了vm_GROWSDOWN
位
堆栈vma
的vm_end
值为0xbee64000
,比0xbee63df0
的start_堆栈
高528字节。之所以会发生这种情况,是因为在同一个VMA中,堆栈顶部有一些东西:命令行、环境和辅助向量
我不知道为什么堆栈(只有它)位于/proc//maps
的不同地址。查看内核源代码,我看到vma
可以显示为[stack]
当且仅当start\u stack
在其中时,因此如果start\u stack
在查看/proc//maps
时是相同的,vma
不能被标记为[stack]
。我能想到的唯一解释是,它来自不同的可执行文件运行,并且除了堆栈之外,其他所有内容都禁用了地址布局随机化
现在是第二个问题
进程运行时,硬件使用页表从虚拟地址(例如0x8000
)映射到页的物理地址。内核也可以这样做;它有一个指向其mm_结构中进程的根页表(pgd
)的指针。一旦有了物理页码(pfn
),它就可以进入相应的struct页面
。有大量的宏和函数来执行所有这些操作
但可能缺少一页。例如,您的可执行文件的一个页面可能尚未出现故障。页面表中该页面的条目将显示为缺失。然后,内核查看相应的vma
,在vma
中给定一个偏移量,该偏移量有足够的信息从某处获取页面,并将其插入页面表中。在ARM上,堆栈向下扩展。这意味着堆栈从更高的地址开始。这在堆栈vma
的vm_标志中可见,该堆栈设置了vm_GROWSDOWN
位
堆栈vma
的vm_end
值为0xbee64000
,比0xbee63df0
的start_堆栈
高528字节。之所以会发生这种情况,是因为在同一个VMA中,堆栈顶部有一些东西:命令行、环境和辅助向量
我不知道为什么堆栈(只有它)位于/proc//maps
的不同地址。查看内核源代码,我看到vma
可以显示为[stack]
当且仅当start\u stack
在其中时,因此如果start\u stack
在查看/proc//maps
时是相同的,vma
不能被标记为[stack]
。我能想到的唯一解释是,它来自不同的可执行文件运行,并且除了堆栈之外,其他所有内容都禁用了地址布局随机化
现在是第二个问题
进程运行时,硬件使用页表从虚拟地址(例如0x8000
)映射到页的物理地址。内核也可以这样做;它有一个指向其mm_结构中进程的根页表(pgd
)的指针。一旦有了物理页码(pfn
),它就可以进入相应的struct页面
。有大量的宏和函数来执行所有这些操作
但可能缺少一页。例如,您的可执行文件的一个页面可能尚未出现故障。页面表中该页面的条目将显示为缺失。内核然后查看相应的vma
,在vma
中给定一个偏移量,该偏移量有足够的信息从某处获取页面,并将其插入页面表中