Matrix 从“magma_dgeqrf2_gpu”（这是一个通用矩阵）的结果中提取上三角矩阵，而不转移到主机_Matrix_Gpgpu_Cublas_Magma

Matrix 从“magma_dgeqrf2_gpu”（这是一个通用矩阵）的结果中提取上三角矩阵，而不转移到主机

matrix

Matrix 从“magma_dgeqrf2_gpu”（这是一个通用矩阵）的结果中提取上三角矩阵，而不转移到主机,matrix,gpgpu,cublas,magma,Matrix,Gpgpu,Cublas,Magma,我正在构建一个内核，它使用Magma函数Magma_dgeqrf2_gpu来执行QR分解。这会将上三角矩阵R输出到GPU设备上的通用矩阵d_a中因为我需要GPU进行进一步的操作，所以不需要将d_A传输回主机，有没有一种简单的方法可以将d_a减少或提取到设备上的上三角矩阵R中？这有点愚蠢，但我发现解决方案只是简单地使用magmablas_dlacopy并设置属性，将上三角矩阵复制到设备上设置为0的另一个矩阵中

我正在构建一个内核，它使用Magma函数Magma_dgeqrf2_gpu来执行QR分解。这会将上三角矩阵R输出到GPU设备上的通用矩阵d_a中

因为我需要GPU进行进一步的操作，所以不需要将d_A传输回主机，有没有一种简单的方法可以将d_a减少或提取到设备上的上三角矩阵R中？

这有点愚蠢，但我发现解决方案只是简单地使用magmablas_dlacopy并设置属性，将上三角矩阵复制到设备上设置为0的另一个矩阵中