X86 OpenBLAS如何支持任意大小的向量和矩阵?

X86 OpenBLAS如何支持任意大小的向量和矩阵?,x86,x86-64,blas,openblas,X86,X86 64,Blas,Openblas,我在努力理解。从我对x86处理器体系结构的理解来看,它们包含以下内容。这些寄存器允许加载浮点数,并允许跨寄存器广播操作。如何有效地绕过有限的尺寸 我查看了OpenBLAS的源代码以了解这一点,但是尽管查看了,但无法了解简单操作的一般流程,例如gemvOpenBLAS依赖内核高效地执行这些操作。在此上下文中,“内核”是专门为线性代数运算编写的汇编代码。例如,有关gemv操作,请参见这些内核

我在努力理解。从我对x86处理器体系结构的理解来看,它们包含以下内容。这些寄存器允许加载浮点数,并允许跨寄存器广播操作。如何有效地绕过有限的尺寸


我查看了OpenBLAS的源代码以了解这一点,但是尽管查看了,但无法了解简单操作的一般流程,例如
gemv

OpenBLAS依赖内核高效地执行这些操作。在此上下文中,“内核”是专门为线性代数运算编写的汇编代码。例如,有关
gemv
操作,请参见这些内核