Assembly 臂组件问题(没有足够的寄存器!)
嗨,我正在尝试编写代码来进行模式搜索,并将前三位最流行的模式排名,以及它统计模式的次数。 我可以制作排名前2位的代码。但是我做不到 (我以这种方式分配寄存器)Assembly 臂组件问题(没有足够的寄存器!),assembly,arm,cpu-registers,Assembly,Arm,Cpu Registers,嗨,我正在尝试编写代码来进行模式搜索,并将前三位最流行的模式排名,以及它统计模式的次数。 我可以制作排名前2位的代码。但是我做不到 (我以这种方式分配寄存器) R7:top1模式的计数 R8:top1模式 R10:top2模式的计数 R11:top2模式 这是我实际使用的代码 void ex3(){ int result[4]; example3(0x00,0x100, 0x0, result); sendstr("Top 1 pattern : "); printDecimal(result
R7:top1模式的计数
R8:top1模式
R10:top2模式的计数
R11:top2模式 这是我实际使用的代码
void ex3(){
int result[4];
example3(0x00,0x100, 0x0, result);
sendstr("Top 1 pattern : ");
printDecimal(result[0]);
sendstr("\n");
sendstr("Top 1 pattern count : ");
printDecimal(result[1]);
sendstr("\n");
sendstr("Top 2 pattern : ");
printDecimal(result[2]);
sendstr("\n");
sendstr("Top 2 pattern count : ");
printDecimal(result[3]);
sendstr("\n");
}
PRESERVE8
AREA Ex3, CODE, READONLY
EXPORT example3
example3
STMFD sp!,{r4-r9,lr}
MOV R4, r2
MOV R6, R3
MOV R7, #0
MOV R8, #0
Loop2
MOV r3, #0
MOV r9, r0
Loop
LDRB r5, [r9], #1
CMP r4, r5
ADDEQ r3, r3, #1
CMP r9, r1
BLS Loop
CMP R3, R7
BLT Com2
Com1
MOVGT R10,R7
MOVGT R11,R8
MOVGT R7, R3
MOVGT R8, R4
B Here
Com2
CMP R3,R10
BLT Here
MOVGT R10,R3
MOVGT R11,R4
CMP R4, #0XFF
ADDLT R4, R4, #1
BLT Loop2
STR r8, [r6]
STR r7, [r6,#4]
STR r11, [r6,#8]
STR r10, [r6,#12]
LDMFD sp!,{r4-r9,lr}
MOV PC, lr
END
但当我尝试使用相同逻辑的rank3代码时,只是以这种方式更改了寄存器分配
r7 count of top1 pattern
r8 top1 pattern
r9 top2 count
r10 TOP2
r11 top3 count
r12 top3
它显示了奇怪的结果,因为(在我看来)错误的寄存器分配(我需要更多empy寄存器…)。解决注册不足的简单方法或正确方法是什么
PRESERVE8
AREA Ex3, CODE, READONLY
EXPORT example3
example3
STMFD sp!,{r4-r9,lr}
MOV R4, r2
MOV R6, R3
MOV R7, #0
MOV R8, #0
Loop2
MOV r3, #0
MOV r9, r0
Loop
LDRB r5, [r9], #1
CMP r4, r5
ADDEQ r3, r3, #1
CMP r9, r1
BLS Loop
CMP R3, R7
BLT Com2
Com1
MOVGT R11,R9
MOVGT R12,R10
MOVGT R9,R7
MOVGT R10,R8
MOVGT R7, R3
MOVGT R8, R4
B Here
Com2
CMP R3,R9
BLT Com3
MOVGT R11,R9
MOVGT R12,R10
MOVGT R9,R3
MOVGT R10,R4
B Here
Com3
CMP R3,R11
MOVGT R11,R3
MOVGT R12,R4
Here
CMP R4, #0XFF
ADDLT R4, R4, #1
BLT Loop2
STR r8, [r6]
STR r7, [r6,#4]
STR r10, [r6,#8]
STR r9, [r6,#12]
STR r12, [r6,#16]
STR r11, [r6,#20]
LDMFD sp!,{r4-r9,lr}
MOV PC, lr
END
编译器将如何做到这一点?尝试编写一些C来做同样的事情,并让编译器生成汇编语言(如果您使用的是GCC,那么它就是
GCC-s
)。这是学习有效汇编语言的好方法;并非编译器所做的每一件事都是最有效的,但它将始终工作并符合逻辑,如果禁用了优化,那么应该很容易遵循
如果寄存器完全用完,您唯一的选择就是将堆栈用于本地存储,根据需要推送和弹出寄存器,或者根据需要从该区域分配一点堆栈空间和LDR
/STR
值。但是,在您的情况下,您没有从函数中调用任何其他函数,因此没有理由避免调用失败的r0-r3
或r12
请注意,您所展示的代码至少包含一个bug,因为您使用的是
r10-r11
,并且没有通过STMFD
和LDMFD
指令保存它们的内容。编译器会如何做?尝试编写一些C来做同样的事情,并让编译器生成汇编语言(如果您使用的是GCC,那么它就是GCC-s
)。这是学习有效汇编语言的好方法;并非编译器所做的每一件事都是最有效的,但它将始终工作并符合逻辑,如果禁用了优化,那么应该很容易遵循
如果寄存器完全用完,您唯一的选择就是将堆栈用于本地存储,根据需要推送和弹出寄存器,或者根据需要从该区域分配一点堆栈空间和LDR
/STR
值。但是,在您的情况下,您没有从函数中调用任何其他函数,因此没有理由避免调用失败的r0-r3
或r12
请注意,您展示的代码至少包含一个bug,因为您使用的是
r10-r11
,并且没有通过STMFD
和LDMFD
说明保存其内容。我想推荐gcc-O1
至少,因为-O0
将所有内容都视为易失性
,以便进行一致的调试。每个语句之间的额外存储/重新加载都会产生大量噪音,难以理解。有x86示例,但适用于ARM的所有内容(有ARM gcc)可能都是一个很好的调用,至少值得尝试与-O0
进行比较。我想至少推荐gcc-O1
,因为-O0
将所有内容都视为易失性,以便进行一致的调试。每个语句之间的额外存储/重新加载都会产生大量噪音,难以理解。有x86示例,但适用于ARM的所有内容(有ARM gcc)可能都是一个很好的调用,至少值得尝试与-O0
进行比较。