Memory 新Haswell AVX的校准限制是什么;收集;说明书

Memory 新Haswell AVX的校准限制是什么;收集;说明书,memory,x86,alignment,vectorization,avx,Memory,X86,Alignment,Vectorization,Avx,我在看电视。其中包括一些热切期待的“收集”货物。但是,我无法理解索引数据项上的对齐限制是什么。参考文献的第2.5节“内存对齐”似乎应该在表2.4或表2.5中列出各种VGATHER*指令。。。但事实并非如此 背景:虽然gather指令支持的数据大小为4和8字节,但我的应用程序可以从gather将相邻的16位数据值对加载到DWORD中获益。具有2字节刻度的奇数索引将产生2字节对齐的4字节加载,从手册中我不清楚这是否会出现故障或无法按预期工作(我怀疑我运气不佳,因为所有支持未对齐访问的指令中似乎都有一

我在看电视。其中包括一些热切期待的“收集”货物。但是,我无法理解索引数据项上的对齐限制是什么。参考文献的第2.5节“内存对齐”似乎应该在表2.4或表2.5中列出各种
VGATHER*
指令。。。但事实并非如此


背景:虽然gather指令支持的数据大小为4和8字节,但我的应用程序可以从gather将相邻的16位数据值对加载到DWORD中获益。具有2字节刻度的奇数索引将产生2字节对齐的4字节加载,从手册中我不清楚这是否会出现故障或无法按预期工作(我怀疑我运气不佳,因为所有支持未对齐访问的指令中似乎都有一个“U”。

这是我第一次听说AVX2。但我猜内存对齐限制与当前使用新的VEX编码方案在Sandy Bridge上实现AVX没有什么不同。也就是说,除非在名称中明确使用带有
A
的对齐
VMOV
指令,否则无需对齐。大多数指令允许使用任何字节粒度对齐进行访问

事实上,见第2.5节,其中第35页明确说明了这一点