使用CBLAS的外部产品_C_Linear Algebra_Scientific Computing_Numerical

使用CBLAS的外部产品

使用CBLAS的外部产品,c,linear-algebra,scientific-computing,numerical,C,Linear Algebra,Scientific Computing,Numerical,我在使用CBLAS执行外部产品时遇到问题。我的代码如下： //===SET UP===// double x1[] = {1,2,3,4}; double x2[] = {1,2,3}; int dx1 = 4; int dx2 = 3; double X[dx1 * dx2]; for (int i = 0; i < (dx1*dx2); i++) {X[i] = 0.0;} //===DO THE OUTER PRODUCT===// cblas_dgemm(CblasRowMajo

我在使用CBLAS执行外部产品时遇到问题。我的代码如下：

//===SET UP===//
double x1[] = {1,2,3,4};
double x2[] = {1,2,3};
int dx1 = 4;
int dx2 = 3;
double X[dx1 * dx2];
for (int i = 0; i < (dx1*dx2); i++) {X[i] = 0.0;}

//===DO THE OUTER PRODUCT===//
cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasTrans, dx1, dx2, 1, 1.0, x1, dx1, x2, 1, 0.0, X, dx1);

//===PRINT THE RESULTS===//
printf("\nMatrix X (%d x %d) = x1 (*) x2 is:\n", dx1, dx2);
for (i=0; i<4; i++) {
    for (j=0; j<3; j++) {
        printf ("%lf ", X[j+i*3]);
    }
    printf ("\n");
}

但正确的答案在这里：

我看到：

但是，这对我没有帮助，因为他们实际上没有说如何利用dgemm来真正做到这一点

有什么帮助吗？我做错了什么？

在BLAS中，接口不是很方便，但是，让我们试着找出它。首先，假设我们所有的矩阵都是RowMajor。现在我们有以下设置

     row  col
x1:  dx1   1   (A)
x2:   1   dx2  (B)
 X:  dx1  dx2  (C)

现在，我们只需要根据文档来填充调用，文档是按照

C = \alpha A*B + \beta C

因此，我们得到：

cblas_dgemm (CblasRowMajor, CblasNoTrans, CblasNoTrans,
             (int)dx1, /* rows in A         */
             (int)dx2, /* columns in B      */
             (int)1,   /* columns in A      */
             1.0, x1,  /* \alpha, A itself  */
             (int)1,   /* Colums in A       */
             x2,       /* B itself          */
             (int)dx2, /* Columns in B      */
             0.0, X,   /* \beta, C itself   */
             (int)dx2  /* Columns in C  */);

所以这应该能完成我希望的工作。

这里是对dgemm参数的描述：

您可以使用dgemm，但使用dger更符合风格，它是一种专用的外部产品实现。因此，更容易正确使用：

cblas_dger(CblasRowMajor, /* you’re using row-major storage */
           dx1,           /* the matrix X has dx1 rows ...  */
           dx2,           /*  ... and dx2 columns.          */
           1.0,           /* scale factor to apply to x1x2' */
           x1,
           1,             /* stride between elements of x1. */
           x2,
           1,             /* stride between elements of x2. */
           X,
           dx2);          /* leading dimension of matrix X. */

dgemm确实有一个很好的特性，传递

\beta=0

可以为您初始化结果矩阵，这样您就不需要在调用之前自己显式地将其归零@Artem Shinkarov的回答很好地描述了如何使用dgemm。

您确定最后一个参数（LDA）必须是dx2，而不是dx1吗？@Christoph90:是的，因为函数调用使用的是行主存储。如果改用column major，它将是

dx1

。

cblas_dger(CblasRowMajor, /* you’re using row-major storage */
           dx1,           /* the matrix X has dx1 rows ...  */
           dx2,           /*  ... and dx2 columns.          */
           1.0,           /* scale factor to apply to x1x2' */
           x1,
           1,             /* stride between elements of x1. */
           x2,
           1,             /* stride between elements of x2. */
           X,
           dx2);          /* leading dimension of matrix X. */