Matrix 从“magma_dgeqrf2_gpu”(这是一个通用矩阵)的结果中提取上三角矩阵,而不转移到主机

Matrix 从“magma_dgeqrf2_gpu”(这是一个通用矩阵)的结果中提取上三角矩阵,而不转移到主机,matrix,gpgpu,cublas,magma,Matrix,Gpgpu,Cublas,Magma,我正在构建一个内核,它使用Magma函数Magma_dgeqrf2_gpu来执行QR分解。这会将上三角矩阵R输出到GPU设备上的通用矩阵d_a中 因为我需要GPU进行进一步的操作,所以不需要将d_A传输回主机,有没有一种简单的方法可以将d_a减少或提取到设备上的上三角矩阵R中?这有点愚蠢,但我发现解决方案只是简单地使用magmablas_dlacopy并设置属性,将上三角矩阵复制到设备上设置为0的另一个矩阵中

我正在构建一个内核,它使用Magma函数Magma_dgeqrf2_gpu来执行QR分解。这会将上三角矩阵R输出到GPU设备上的通用矩阵d_a中


因为我需要GPU进行进一步的操作,所以不需要将d_A传输回主机,有没有一种简单的方法可以将d_a减少或提取到设备上的上三角矩阵R中?

这有点愚蠢,但我发现解决方案只是简单地使用magmablas_dlacopy并设置属性,将上三角矩阵复制到设备上设置为0的另一个矩阵中