C++ Arm霓虹灯和poly8_t和poly16_t_C++_C_Arm_Neon_Intrinsics

C++ Arm霓虹灯和poly8_t和poly16_t

c++ c arm

C++ Arm霓虹灯和poly8_t和poly16_t,c++,c,arm,neon,intrinsics,C++,C,Arm,Neon,Intrinsics,我最近一直在研究使用intrinsics的霓虹灯优化，我遇到了poly8_t和poly16_t数据类型。然后我就开始思考它们到底是什么我已经搜索了整个网络，但到目前为止，还没有找到任何关于它们是什么的解释谁能给我解释一下吗编辑：感谢您的回答，但如果它只是一种不同的乘法方式等，为什么它的数据类型会完全不同呢？这些类型用于无进位乘法。它对于加密算法和CRC哈希和非常有用。以下是一些关于应用程序的白皮书（它们探讨了x86 PCLMULQDQ指令，但同样的思想也适用于在ARM处理器上进行较少的乘法

我最近一直在研究使用intrinsics的霓虹灯优化，我遇到了poly8_t和poly16_t数据类型。然后我就开始思考它们到底是什么

我已经搜索了整个网络，但到目前为止，还没有找到任何关于它们是什么的解释

谁能给我解释一下吗

编辑：感谢您的回答，但如果它只是一种不同的乘法方式等，为什么它的数据类型会完全不同呢？

这些类型用于无进位乘法。它对于加密算法和CRC哈希和非常有用。以下是一些关于应用程序的白皮书（它们探讨了x86 PCLMULQDQ指令，但同样的思想也适用于在ARM处理器上进行较少的乘法运算）：

        1 1 0 1                              1 1 0 1
     *  1 0 0 1                              1 0 0 1
   ------------        -->              --------------
     (1)1 1 0 1  <-- (1) is carry            1 1 0 1
      0 0 0 0                              0 0 0 0 
    0 0 0 0                              0 0 0 0
  1 1 0 1        +                     1 1 0 1         + GF(2) or XOR
  -------------                        ---------------
  1 1 1 0 1 0 1                        1 1 0 0 1 0 1

1100101b

typedef short poly16\t@self：这并没有说明它们是什么……我会检查它们是如何实际使用的——它们是如何转换为汇编指令的。还有Gouvêa和López。哪条指令在ARM上的乘法运算更少？ARM在这里必须指Cortex A7或A8处理器，其中包括NEON扩展。我认为它是ARMv7中的VMUL.P8
@auselen指令名为VMULL.P8
（8位x 8位->16位
）。在ARMv8中，该指令称为PMUL
/PMULL
/PMULL2
。带加密扩展的ARMv8除了支持ARMv7变体外，还支持64位x 64位->128位
无载频乘法。谢谢，我认为这是有意义的：Dpoly8x16\u t vmulq\u p8（poly8x16\u t，poly8x16\u t）
给出预期指令的形式：vmul.p8 q0，q0，q0。如果它是vmul.p8
，它的意思是GF（2^8），但您的解释是GF（2）？也就是说，第八位没有进位，但中间有进位。GF（2）乘法是XOR/EOR
，GF（2）乘法是AND运算；GF（2）及其扩展中的加法是XOR。多项式乘法使用XOR对行进行求和，而常规二进制乘法使用ADD。（在ADD中，所有位之间可能存在进位）。我还没有检查文档，但我相信vmul.p8只会占用carryless产品的8个最低有效位；而vmull.p8将从p8*p8->p16生成完整的产品。是的，我想的是vmull和GF（256）而不是GF（2^8）。
 1101 == x^3 + x^2 + 0 + 1;
 1001 == x^3 + 0   + 0 + 1;

 (x^3 + x^2 + 1)(x^3 + 1) == x^6+x^5+x^3 + x^3+x^2+1 
                          == 1x^6 + 1x^5 + 0x^4 + 2x^3 + 1^x2 + 0x + 1
                          == "1102101"