Memory glibc memcpy arm64霓虹灯优化

Memory glibc memcpy arm64霓虹灯优化,memory,arm,glibc,arm64,Memory,Arm,Glibc,Arm64,我正在研究arm64(sysdeps/aarch64/memcpy.S)的glibc memcpy实现。据我所知,它不支持霓虹灯。有针对armv7的NEON优化版本,但arm64只是基于公共寄存器(GDB中也有这种情况)。我说的对吗,glibc不支持memcpy的NEON?为什么?(可能是因为NEON无法为arm64带来性能提升?您如何知道“NEON”是一种“优化”?arm64寄存器更大,您有不同的ISA和CPU结构。这可能取决于根据的特定目标。也就是说,SDRAM特性和总线接口将起到很大的作用

我正在研究arm64(sysdeps/aarch64/memcpy.S)的glibc memcpy实现。据我所知,它不支持霓虹灯。有针对armv7的NEON优化版本,但arm64只是基于公共寄存器(GDB中也有这种情况)。我说的对吗,glibc不支持memcpy的NEON?为什么?(可能是因为NEON无法为arm64带来性能提升?

您如何知道“NEON”是一种“优化”?arm64寄存器更大,您有不同的ISA和CPU结构。这可能取决于根据的特定目标。也就是说,SDRAM特性和总线接口将起到很大的作用。我并不是说NEON的实现总是比内存拷贝更快。我只是想知道为什么glibc中没有对ARM64的霓虹灯版本支持,比如对armv7的支持。我已经准备好阅读链接,你提到过,最后霓虹灯与pld是最好的,但它的32位手臂。我对ARM64的知识很感兴趣。AArch64有64位寄存器,可以为与NEON寄存器大小相同的事务加载和存储它们对。这可能足以使内存接口饱和,在这种情况下,没有必要涉及霓虹灯。NEON可能能够降低特定大小事务的指令数,但这些指令只会花费更长的时间,不会带来速度增益。您如何知道“NEON”是一种“优化”呢?arm64寄存器更大,您有不同的ISA和CPU结构。这可能取决于根据的特定目标。也就是说,SDRAM特性和总线接口将起到很大的作用。我并不是说NEON的实现总是比内存拷贝更快。我只是想知道为什么glibc中没有对ARM64的霓虹灯版本支持,比如对armv7的支持。我已经准备好阅读链接,你提到过,最后霓虹灯与pld是最好的,但它的32位手臂。我对ARM64的知识很感兴趣。AArch64有64位寄存器,可以为与NEON寄存器大小相同的事务加载和存储它们对。这可能足以使内存接口饱和,在这种情况下,没有必要涉及霓虹灯。NEON可能能够降低特定大小事务的指令数,但这些指令只会花费更长的时间,不会带来速度增益。