二维矩阵的DCT和IDCT的Java实现_Java_Performance_Optimization

二维矩阵的DCT和IDCT的Java实现

java performance optimization

二维矩阵的DCT和IDCT的Java实现,java,performance,optimization,Java,Performance,Optimization,我已经有了一个dct和idct的实现，但是尽管进行了适当的优化，随着矩阵大小的增加，它们变得非常缓慢。是否有人知道这两种情况下的更快实现，或者任何为二维案例提供更快实现的Java库。谢谢 public final double[][]初始系数（double[][]c） { 最终int N=c.长度；最终双精度值=1/数学sqrt（2.0）；对于（inti=1；i现在它是一个O（n4）算法，四个嵌套循环都进行n迭代。可分离性可以归结为O（n3）（或者O（n2log n），如果你有足够的勇气

我已经有了一个dct和idct的实现，但是尽管进行了适当的优化，随着矩阵大小的增加，它们变得非常缓慢。是否有人知道这两种情况下的更快实现，或者任何为二维案例提供更快实现的Java库。谢谢

public final double[][]初始系数（double[][]c）
{
最终int N=c.长度；
最终双精度值=1/数学sqrt（2.0）；
对于（inti=1；i现在它是一个O（n4）算法，四个嵌套循环都进行n
迭代。可分离性可以归结为O（n3）（或者O（n2log n），如果你有足够的勇气尝试快速余弦变换的话）。它实际上比使用2D公式更简单，因为它是这样的：

在所有行上运行1D DCT
对所有列（上一个结果的列）运行1D DCT

或（可选）使两个零件完全相同：

在所有行上运行1D DCT，保存转置的结果
再来一次

转置意味着它第二次真正做列，在两个转置中，撤销彼此
那么，余弦，你注意到了吗
预计算余弦似乎很困难，因为我在计算内部（循环）局部变量的余弦
这些余弦实际上只是以公式形式写下来的常量，数组只依赖于n
。例如，看看FFmpeg在中是如何实现的，你有DCT的最大大小吗？如果使用整数是可以的（这通常是图像处理的情况），您可以在那里找到一些大小为4、8、16和32的快速实现：比什么快？向我们展示您的代码（可能更适合）@maaartinus我为这两个实现添加了我当前的代码。随着矩阵大小的增加，它们往往会变慢。DCT是可分离的，你应该使用它。另外，Math.cos非常慢，你只需要从中提取几个值，这样你就可以在数组中准备它们了。@harold你说DCT是可分离的是什么意思？而且代码不是可分离的数学课的成绩很低。我认为这是循环的问题。我正在使用（512 x 512）矩阵。我的意思是你不必直接做2D DCT。你可以用n+n 1D DCT来构造它。这可能也是数学课，因为cos速度非常慢，你要做的主要事情是取余弦，其余的都会消失在噪音中。使用可分性可以去掉很多余弦，但你可以去掉更多余弦。很好breakdown，将按照您的建议进行尝试，我希望在这种情况下速度更快。我知道这是一个相当晚的答复，但仍然没有进展，无法按照您的解释使其工作。@herald我尝试了示例代码，但没有完全理解它，项目仍然挂起
 public final double[][] initCoefficients(double[][] c) 
 {
    final int N = c.length;
    final double value = 1/Math.sqrt(2.0);

    for (int i=1; i<N; i++) 
    {
        for (int j=1; j<N; j++) 
        {
            c[i][j]=1;
        }
    }

    for (int i=0; i<N; i++) 
    {
        c[i][0] = value;
        c[0][i] = value;
    }
    c[0][0] = 0.5;
    return c;
}

/* Computes the discrete cosine transform
 */
public final double[][] forwardDCT(double[][] input) 
{
    final int N = input.length;
    final double mathPI = Math.PI;
    final int halfN = N/2;
    final double doubN = 2.0*N;

    double[][] c = new double[N][N];
    c = initCoefficients(c);

    double[][] output = new double[N][N];

    for (int u=0; u<N; u++) 
    {
        double temp_u = u*mathPI;
        for (int v=0; v<N; v++) 
        {
            double temp_v = v*mathPI;
            double sum = 0.0;
            for (int x=0; x<N; x++) 
            {
                int temp_x = 2*x+1;
                for (int y=0; y<N; y++) 
                {
                    sum += input[x][y] * Math.cos((temp_x/doubN)*temp_u) * Math.cos(((2*y+1)/doubN)*temp_v);
                }
            }
            sum *= c[u][v]/ halfN;
            output[u][v] = sum;
        }
    }
    return output;
}

/* 
 * Computes the inverse discrete cosine transform
 */
public final double[][] inverseDCT(double[][] input) 
{
    final int N = input.length;
    final double mathPI = Math.PI;
    final int halfN = N/2;
    final double doubN = 2.0*N;

    double[][] c = new double[N][N];
    c = initCoefficients(c);

    double[][] output = new double[N][N];


    for (int x=0; x<N; x++) 
    {
        int temp_x = 2*x+1;
        for (int y=0; y<N; y++) 
        {
            int temp_y = 2*y+1;
            double sum = 0.0;
            for (int u=0; u<N; u++) 
            {
                double temp_u = u*mathPI;
                for (int v=0; v<N; v++) 
                {
                    sum += c[u][v] * input[u][v] * Math.cos((temp_x/doubN)*temp_u) * Math.cos((temp_y/doubN)*v*mathPI);
                }
            }
            sum /= halfN;
            output[x][y] = sum;
        }
   }
   return output;
}