Assembly 臂组件问题(没有足够的寄存器!)

Assembly 臂组件问题(没有足够的寄存器!),assembly,arm,cpu-registers,Assembly,Arm,Cpu Registers,嗨,我正在尝试编写代码来进行模式搜索,并将前三位最流行的模式排名,以及它统计模式的次数。 我可以制作排名前2位的代码。但是我做不到 (我以这种方式分配寄存器) R7:top1模式的计数 R8:top1模式 R10:top2模式的计数 R11:top2模式 这是我实际使用的代码 void ex3(){ int result[4]; example3(0x00,0x100, 0x0, result); sendstr("Top 1 pattern : "); printDecimal(result

嗨,我正在尝试编写代码来进行模式搜索,并将前三位最流行的模式排名,以及它统计模式的次数。 我可以制作排名前2位的代码。但是我做不到

(我以这种方式分配寄存器)
R7:top1模式的计数
R8:top1模式
R10:top2模式的计数
R11:top2模式

这是我实际使用的代码

void ex3(){
int result[4];

example3(0x00,0x100, 0x0, result);
sendstr("Top 1 pattern : ");
printDecimal(result[0]);
sendstr("\n");

sendstr("Top 1 pattern count : ");
printDecimal(result[1]);
sendstr("\n");

sendstr("Top 2 pattern : ");
    printDecimal(result[2]);
sendstr("\n");

    sendstr("Top 2 pattern count : ");
printDecimal(result[3]);
sendstr("\n");

}


PRESERVE8
AREA Ex3, CODE, READONLY

EXPORT  example3

example3
    STMFD       sp!,{r4-r9,lr}              
    MOV         R4, r2                          
    MOV         R6, R3
    MOV         R7, #0
    MOV         R8, #0

Loop2   
    MOV         r3, #0                          
    MOV         r9, r0

Loop
    LDRB        r5, [r9], #1                        
    CMP         r4, r5                          
    ADDEQ       r3, r3, #1                      
    CMP         r9, r1                          
    BLS         Loop
    CMP         R3, R7
    BLT         Com2




Com1

    MOVGT   R10,R7
    MOVGT   R11,R8
    MOVGT   R7, R3                          
    MOVGT   R8, R4
    B               Here

Com2
    CMP         R3,R10
    BLT         Here
    MOVGT   R10,R3
    MOVGT   R11,R4


    CMP         R4, #0XFF
    ADDLT       R4, R4, #1
    BLT         Loop2

    STR         r8, [r6]
    STR         r7, [r6,#4]

    STR         r11, [r6,#8]
    STR         r10, [r6,#12]


    LDMFD       sp!,{r4-r9,lr}

    MOV         PC, lr

    END
但当我尝试使用相同逻辑的rank3代码时,只是以这种方式更改了寄存器分配

r7 count of top1 pattern  
r8 top1 pattern    

r9 top2 count  
r10 TOP2    

r11 top3 count  
r12 top3    
它显示了奇怪的结果,因为(在我看来)错误的寄存器分配(我需要更多empy寄存器…)。解决注册不足的简单方法或正确方法是什么

PRESERVE8
AREA Ex3, CODE, READONLY

EXPORT  example3

example3
    STMFD       sp!,{r4-r9,lr}              
    MOV         R4, r2                          
    MOV         R6, R3
    MOV         R7, #0
    MOV         R8, #0

Loop2   
    MOV         r3, #0                          
    MOV         r9, r0

Loop
    LDRB        r5, [r9], #1                        
    CMP         r4, r5                          
    ADDEQ       r3, r3, #1                      
    CMP         r9, r1                          
    BLS         Loop
    CMP         R3, R7
    BLT         Com2




Com1
    MOVGT   R11,R9
    MOVGT   R12,R10
    MOVGT   R9,R7
    MOVGT   R10,R8
    MOVGT   R7, R3                          
    MOVGT   R8, R4
    B               Here

Com2
    CMP         R3,R9
    BLT         Com3
    MOVGT   R11,R9
    MOVGT   R12,R10
    MOVGT   R9,R3
    MOVGT   R10,R4
    B               Here


Com3
    CMP         R3,R11
    MOVGT   R11,R3
    MOVGT   R12,R4


Here
    CMP         R4, #0XFF
    ADDLT       R4, R4, #1
    BLT         Loop2

    STR         r8, [r6]
    STR         r7, [r6,#4]

    STR         r10, [r6,#8]
    STR         r9, [r6,#12]
    STR         r12, [r6,#16]
    STR         r11, [r6,#20]


    LDMFD       sp!,{r4-r9,lr}

    MOV         PC, lr

    END

编译器将如何做到这一点?尝试编写一些C来做同样的事情,并让编译器生成汇编语言(如果您使用的是GCC,那么它就是
GCC-s
)。这是学习有效汇编语言的好方法;并非编译器所做的每一件事都是最有效的,但它将始终工作并符合逻辑,如果禁用了优化,那么应该很容易遵循

如果寄存器完全用完,您唯一的选择就是将堆栈用于本地存储,根据需要推送和弹出寄存器,或者根据需要从该区域分配一点堆栈空间和
LDR
/
STR
值。但是,在您的情况下,您没有从函数中调用任何其他函数,因此没有理由避免调用失败的
r0-r3
r12


请注意,您所展示的代码至少包含一个bug,因为您使用的是
r10-r11
,并且没有通过
STMFD
LDMFD
指令保存它们的内容。

编译器会如何做?尝试编写一些C来做同样的事情,并让编译器生成汇编语言(如果您使用的是GCC,那么它就是
GCC-s
)。这是学习有效汇编语言的好方法;并非编译器所做的每一件事都是最有效的,但它将始终工作并符合逻辑,如果禁用了优化,那么应该很容易遵循

如果寄存器完全用完,您唯一的选择就是将堆栈用于本地存储,根据需要推送和弹出寄存器,或者根据需要从该区域分配一点堆栈空间和
LDR
/
STR
值。但是,在您的情况下,您没有从函数中调用任何其他函数,因此没有理由避免调用失败的
r0-r3
r12


请注意,您展示的代码至少包含一个bug,因为您使用的是
r10-r11
,并且没有通过
STMFD
LDMFD
说明保存其内容。

我想推荐
gcc-O1
至少,因为
-O0
将所有内容都视为
易失性
,以便进行一致的调试。每个语句之间的额外存储/重新加载都会产生大量噪音,难以理解。有x86示例,但适用于ARM的所有内容(有ARM gcc)可能都是一个很好的调用,至少值得尝试与
-O0
进行比较。我想至少推荐
gcc-O1
,因为
-O0
将所有内容都视为
易失性
,以便进行一致的调试。每个语句之间的额外存储/重新加载都会产生大量噪音,难以理解。有x86示例,但适用于ARM的所有内容(有ARM gcc)可能都是一个很好的调用,至少值得尝试与
-O0
进行比较。