C（MIPS）-如何告诉编译器加载单精度浮点与GPRs兼容？_C_Gcc_Floating Point_Mips

C（MIPS）-如何告诉编译器加载单精度浮点与GPRs兼容？

c gcc floating-point mips

C（MIPS）-如何告诉编译器加载单精度浮点与GPRs兼容？,c,gcc,floating-point,mips,C,Gcc,Floating Point,Mips,最近，我试图用gcc为n64编写一些实用程序，但在优化策略方面遇到了一些问题请考虑以下例子： // cctest.c extern struct { float x; float y; float z; } var; void *test() { float t; t = 5.0; var.x = var.x + t; var.y = 10.0; var.z = 60.0; return (void*)&va

最近，我试图用gcc为n64编写一些实用程序，但在优化策略方面遇到了一些问题

请考虑以下例子：

// cctest.c

extern struct {
    float x;
    float y;
    float z;
} var;

void *test() {
    float t;

    t = 5.0;
    var.x = var.x + t;
    var.y = 10.0;
    var.z = 60.0;
    return (void*)&var;
}

我的输出类似于：

    lui $2, %hi(var)
    lui $1, 0x40A0
    addiu   $2,$2,%lo(var)
    mtc1 $1, $f2
    lwc1 $f0, 0x0($2)
    lui $3, 0x4120
    lui $4, 0x4270
    sw $3, 0x4($2)
    add.s $f0, $f0, $f2
    sw $4, 0x8($2)
    jr $31
    swc1 $f0, 0x0($2)

但是，编译器会生成：

; cctest.s

; In .text
    lui $3,%hi(var)
    lui $2,%hi($LC0)
    lwc1    $f0,%lo(var)($3)
    lwc1    $f2,%lo($LC0)($2)
    lui $5,%hi($LC1)
    add.s   $f0,$f0,$f2
    addiu   $2,$3,%lo(var)
    lui $4,%hi($LC2)
    swc1    $f0,%lo(var)($3)
    lwc1    $f0,%lo($LC1)($5)
    swc1    $f0,4($2)
    lwc1    $f0,%lo($LC2)($4)
    jr  $31
    swc1    $f0,8($2)

; In .rodata
    .align  2
$LC0:
    .word   1084227584
    .align  2
$LC1:
    .word   1092616192
    .align  2
$LC2:
    .word   1114636288

给出了以下标志：

-G0 -fomit-frame-pointer -fno-PIC -mips3 -march=vr4300 -mtune=vr4300 -mabi=32 -mlong32 -mno-shared -mgp32 -mhard-float -mno-check-zero-division -fno-stack-protector -fno-common -fno-zero-initialized-in-bss -mno-abicalls -mno-memcpy -mbranch-likely -O3

我对mips3不是很有经验；但由于目标机器（n64）的RAM和DCache非常有限，我认为将所有内容放入内存似乎不是一个好主意

我去了gcc的MIPS选项页面，但没有发现任何有用的东西

使用gcc-10.2.0（mips64 elf）将环境命名为mingw64（msys2），其中gcc配置为

    --build=x86_64-w64-mingw32 \
    --host=x86_64-w64-mingw32 \
    --prefix="./" \
    --target=mips64-elf --with-arch=vr4300 \
    --enable-languages=c,c++ --without-headers --with-newlib \
    --with-gnu-as=./bin/mips64-elf-as.exe \
    --with-gnu-ld=./bin/mips64-elf-ld.exe \
    --enable-checking=release \
    --enable-shared \
    --enable-shared-libgcc \
    --disable-decimal-float \
    --disable-gold \
    --disable-libatomic \
    --disable-libgomp \
    --disable-libitm \
    --disable-libquadmath \
    --disable-libquadmath-support \
    --disable-libsanitizer \
    --disable-libssp \
    --disable-libunwind-exceptions \
    --disable-libvtv \
    --disable-multilib \
    --disable-nls \
    --disable-rpath \
    --disable-symvers \
    --disable-threads \
    --disable-win32-registry \
    --enable-lto \
    --enable-plugin \
    --enable-static \
    --without-included-gettext

如果低16位为零，有没有办法告诉gcc将这些单精度浮点常量放在GPRs中而不是内存中

编辑1

尝试将clang（11.0）与标志一起使用

clang -S --target=mips-none-elf -O2 -G0 -ffreestanding -fomit-frame-pointer -ffast-math -mabi=o32 -mno-check-zero-division -mfp32

结果是：

; cctest.llvm.s

; In .rodata ...
$CPI0_0:
    .4byte  0x40a00000

; In .text ...
    lui $1, %hi(var)
    addiu   $2, $1, %lo(var)
    lui $3, 17008
    sw  $3, 8($2)
    lui $3, 16672
    sw  $3, 4($2)
    lui $3, %hi($CPI0_0)
    lwc1    $f0, %lo($CPI0_0)($3)
    lwc1    $f1, %lo(var)($1)
    add.s   $f0, $f1, $f0
    jr  $ra
    swc1    $f0, %lo(var)($1)

与gcc相比，

5.0

仍在内存中，但它使用

$3

将

10.0

加载到

var.y

和

60.0

加载到

var.z

请注意，clang在64位处理器上不支持o32 ABI，并且没有针对特定处理器的修复程序