使用CBLAS的外部产品
我在使用CBLAS执行外部产品时遇到问题。我的代码如下:使用CBLAS的外部产品,c,linear-algebra,scientific-computing,numerical,C,Linear Algebra,Scientific Computing,Numerical,我在使用CBLAS执行外部产品时遇到问题。我的代码如下: //===SET UP===// double x1[] = {1,2,3,4}; double x2[] = {1,2,3}; int dx1 = 4; int dx2 = 3; double X[dx1 * dx2]; for (int i = 0; i < (dx1*dx2); i++) {X[i] = 0.0;} //===DO THE OUTER PRODUCT===// cblas_dgemm(CblasRowMajo
//===SET UP===//
double x1[] = {1,2,3,4};
double x2[] = {1,2,3};
int dx1 = 4;
int dx2 = 3;
double X[dx1 * dx2];
for (int i = 0; i < (dx1*dx2); i++) {X[i] = 0.0;}
//===DO THE OUTER PRODUCT===//
cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasTrans, dx1, dx2, 1, 1.0, x1, dx1, x2, 1, 0.0, X, dx1);
//===PRINT THE RESULTS===//
printf("\nMatrix X (%d x %d) = x1 (*) x2 is:\n", dx1, dx2);
for (i=0; i<4; i++) {
for (j=0; j<3; j++) {
printf ("%lf ", X[j+i*3]);
}
printf ("\n");
}
但正确的答案在这里:
我看到:
但是,这对我没有帮助,因为他们实际上没有说如何利用dgemm来真正做到这一点
有什么帮助吗?我做错了什么?在BLAS中,接口不是很方便,但是,让我们试着找出它。首先,假设我们所有的矩阵都是RowMajor。现在我们有以下设置
row col
x1: dx1 1 (A)
x2: 1 dx2 (B)
X: dx1 dx2 (C)
现在,我们只需要根据文档来填充调用,文档是按照
C = \alpha A*B + \beta C
因此,我们得到:
cblas_dgemm (CblasRowMajor, CblasNoTrans, CblasNoTrans,
(int)dx1, /* rows in A */
(int)dx2, /* columns in B */
(int)1, /* columns in A */
1.0, x1, /* \alpha, A itself */
(int)1, /* Colums in A */
x2, /* B itself */
(int)dx2, /* Columns in B */
0.0, X, /* \beta, C itself */
(int)dx2 /* Columns in C */);
所以这应该能完成我希望的工作。
这里是对dgemm参数的描述:您可以使用dgemm,但使用dger更符合风格,它是一种专用的外部产品实现。因此,更容易正确使用:
cblas_dger(CblasRowMajor, /* you’re using row-major storage */
dx1, /* the matrix X has dx1 rows ... */
dx2, /* ... and dx2 columns. */
1.0, /* scale factor to apply to x1x2' */
x1,
1, /* stride between elements of x1. */
x2,
1, /* stride between elements of x2. */
X,
dx2); /* leading dimension of matrix X. */
dgemm确实有一个很好的特性,传递
\beta=0
可以为您初始化结果矩阵,这样您就不需要在调用之前自己显式地将其归零@Artem Shinkarov的回答很好地描述了如何使用dgemm。您确定最后一个参数(LDA)必须是dx2,而不是dx1吗?@Christoph90:是的,因为函数调用使用的是行主存储。如果改用column major,它将是dx1
。
cblas_dger(CblasRowMajor, /* you’re using row-major storage */
dx1, /* the matrix X has dx1 rows ... */
dx2, /* ... and dx2 columns. */
1.0, /* scale factor to apply to x1x2' */
x1,
1, /* stride between elements of x1. */
x2,
1, /* stride between elements of x2. */
X,
dx2); /* leading dimension of matrix X. */