GLSL中高效的双三次滤波码？_Glsl_Fragment Shader_Bicubic

GLSL中高效的双三次滤波码？

glsl

GLSL中高效的双三次滤波码？,glsl,fragment-shader,bicubic,Glsl,Fragment Shader,Bicubic,我想知道是否有人有完整、有效的代码来在glsl中进行双三次纹理过滤。这是：或但两者都进行16次纹理读取，其中只需要4次：然而，上面的方法使用了一个缺少的“cubic（）”函数，我不知道它应该做什么，并且还使用了一个无法解释的“texscale”参数《英伟达版本》也有：但我相信这是使用CUDA，这是特定于NVidia的卡。我需要glsl 我可能会把英伟达版本移植到GLSL，但我想先问问是否有人已经完成了一个完整的、工作的GLSL双三次着色。< / P>编辑（立方（）是一个例

我想知道是否有人有完整、有效的代码来在glsl中进行双三次纹理过滤。这是：

或

但两者都进行16次纹理读取，其中只需要4次：

然而，上面的方法使用了一个缺少的“cubic（）”函数，我不知道它应该做什么，并且还使用了一个无法解释的“texscale”参数

《英伟达版本》也有：

但我相信这是使用CUDA，这是特定于NVidia的卡。我需要glsl

我可能会把英伟达版本移植到GLSL，但我想先问问是否有人已经完成了一个完整的、工作的GLSL双三次着色。< / P>编辑（<）/P>

立方（）是一个
例如：

Texscale是采样窗口大小系数。可以从1.0值开始

中缺少的函数

cubic（）

可能如下所示：

vec4 cubic(float x)
{
    float x2 = x * x;
    float x3 = x2 * x;
    vec4 w;
    w.x =   -x3 + 3*x2 - 3*x + 1;
    w.y =  3*x3 - 6*x2       + 4;
    w.z = -3*x3 + 3*x2 + 3*x + 1;
    w.w =  x3;
    return w / 6.f;
}

它返回三次B样条曲线的四个权重

所有这些都在中进行了解释。

对于任何对GLSL代码感兴趣的人来说，要进行tri立方插值，使用立方插值的光线投射代码可以在下面的示例/glCubicRayCast文件夹中找到：

编辑：立方体插值代码现在可以在github上获得：版本和版本，以及示例。

Wow。我认识到上面的代码（我不能评论声誉<50），因为我在2011年初提出了它。我试图解决的问题与旧的IBM T42（对不起，我忘记了确切的型号）笔记本电脑及其ATI图形堆栈有关。我在NV卡上开发了代码，最初我使用了16个纹理抓取。这有点慢，但对我来说已经足够快了。当有人报告说它在他的笔记本电脑上不起作用时，很明显他们不支持对每个片段进行足够的纹理提取。我必须设计一个解决方案，我能想出的最好办法就是用大量的纹理抓取

我是这样想的：好吧，如果我用线性滤波器处理每个四边形（2x2），剩下的问题是行和列可以共享权重吗？当我着手编写代码时，这是我脑子里唯一的问题。当然，它们可以共享；每列和每行的权重相同；太好了

现在我有四个样品。剩下的问题是如何正确组合样本。这是需要克服的最大障碍。用铅笔和纸大约花了10分钟。我用颤抖的双手输入代码，效果很好。然后我把二进制文件上传给那个承诺在T42（？）上查看的家伙，他报告说它成功了。（完）

我可以保证，这些方程式是正确的，并且给出了与单独计算样本在数学上相同的结果。仅供参考：使用CPU，可以更快地分别进行水平和垂直扫描。使用GPU多通道并不是一个好主意，尤其是在典型用例中它可能无论如何都不可行的情况下

值得思考的是：可以对cubic（）函数使用纹理查找。哪一个更快取决于GPU，但一般来说，采样器在ALU端很轻，只是做算术就可以平衡。YMMV.

我决定花一分钟时间挖掘我以前的Perforce活动，找到了丢失的cubic（）函数；享受！：）

我已经使用@Maf的三次样条公式一年多了，如果三次B样条满足您的需要，我推荐它

但我最近意识到，对于我的特殊应用，在采样点精确匹配强度是很重要的。所以我转而使用Catmull Rom样条曲线，它使用了一个稍微不同的配方，如：

// Catmull-Rom spline actually passes through control points
vec4 cubic(float x) // cubic_catmullrom(float x)
{
    const float s = 0.5; // potentially adjustable parameter
    float x2 = x * x;
    float x3 = x2 * x;
    vec4 w;
    w.x =    -s*x3 +     2*s*x2 - s*x + 0;
    w.y = (2-s)*x3 +   (s-3)*x2       + 1;
    w.z = (s-2)*x3 + (3-2*s)*x2 + s*x + 0;
    w.w =     s*x3 -       s*x2       + 0;
    return w;
}

我在以下的课堂讲稿中找到了这些系数，以及其他一些三次样条曲线的系数：

我找到了这个实现，它可以作为texture（）的替代品（从（一个拼写错误修复）中）：

示例：最近、双线性、双三次：

此图像的图像数据为

{{{0.698039, 0.996078, 0.262745}, {0., 0.266667, 1.}, {0.00392157, 
   0.25098, 0.996078}, {1., 0.65098, 0.}}, {{0.996078, 0.823529, 
   0.}, {0.498039, 0., 0.00392157}, {0.831373, 0.00392157, 
   0.00392157}, {0.956863, 0.972549, 0.00784314}}, {{0.909804, 
   0.00784314, 0.}, {0.87451, 0.996078, 0.0862745}, {0.196078, 
   0.992157, 0.760784}, {0.00392157, 0.00392157, 0.498039}}, {{1., 
   0.878431, 0.}, {0.588235, 0.00392157, 0.00392157}, {0.00392157, 
   0.0666667, 0.996078}, {0.996078, 0.517647, 0.}}}

我试图重现这一点（许多其他插值技术）

但它们有固定的填充，而我有重复（包装）的边界。因此，这并不完全相同

这种双三次插值似乎不是一种合适的插值，也就是说，它在定义数据的点上不采用原始值。

我认为Catmull版本可能通过（a）进行4次纹理查找将输入纹理像棋盘一样排列，并将交替的插槽保存为正片和负片，以及（b）纹理的相关修改。这取决于贡献/权重w.x/w.w始终为负，贡献w.y/w.z始终为正。我还没有仔细检查这是不是真的，或者修改后的纹理是什么样子

。。。我已经验证了w贡献确实满足+ve-ve规则。

这与我在原始帖子中给出的链接完全相同（参见第三个链接）。那就好了。。。如果您能解释我需要为缺少的cubic（）函数编写什么，以及在texscale参数中传递什么。如果你能解释这一点，我很高兴把你的答案标记为最终答案。但是，我不确定你如何用C语言编写一个只给出一个输入参数的三次函数。我在谷歌搜索时发现的所有示例都需要许多输入参数。@VernJensen它很可能是通用的三次样条曲线（如图所示）+您需要调整比例。在高斯模糊着色器中，查找矩阵通常也是通用的常量值。请注意，利用线性硬件插值仅适用于非负样条线（除Codeproject示例中的Catmull Rom样条线外），因为您无法以将纹理偏移到零以下的方式调整纹理坐标。此处“fract”的目的是什么？但两者都有16个纹理读取，其中只有4个是必要的：“那篇文章在骗你，双三次插值不行。”

// Catmull-Rom spline actually passes through control points
vec4 cubic(float x) // cubic_catmullrom(float x)
{
    const float s = 0.5; // potentially adjustable parameter
    float x2 = x * x;
    float x3 = x2 * x;
    vec4 w;
    w.x =    -s*x3 +     2*s*x2 - s*x + 0;
    w.y = (2-s)*x3 +   (s-3)*x2       + 1;
    w.z = (s-2)*x3 + (3-2*s)*x2 + s*x + 0;
    w.w =     s*x3 -       s*x2       + 0;
    return w;
}

// from http://www.java-gaming.org/index.php?topic=35123.0
vec4 cubic(float v){
    vec4 n = vec4(1.0, 2.0, 3.0, 4.0) - v;
    vec4 s = n * n * n;
    float x = s.x;
    float y = s.y - 4.0 * s.x;
    float z = s.z - 4.0 * s.y + 6.0 * s.x;
    float w = 6.0 - x - y - z;
    return vec4(x, y, z, w) * (1.0/6.0);
}

vec4 textureBicubic(sampler2D sampler, vec2 texCoords){

   vec2 texSize = textureSize(sampler, 0);
   vec2 invTexSize = 1.0 / texSize;

   texCoords = texCoords * texSize - 0.5;


    vec2 fxy = fract(texCoords);
    texCoords -= fxy;

    vec4 xcubic = cubic(fxy.x);
    vec4 ycubic = cubic(fxy.y);

    vec4 c = texCoords.xxyy + vec2 (-0.5, +1.5).xyxy;

    vec4 s = vec4(xcubic.xz + xcubic.yw, ycubic.xz + ycubic.yw);
    vec4 offset = c + vec4 (xcubic.yw, ycubic.yw) / s;

    offset *= invTexSize.xxyy;

    vec4 sample0 = texture(sampler, offset.xz);
    vec4 sample1 = texture(sampler, offset.yz);
    vec4 sample2 = texture(sampler, offset.xw);
    vec4 sample3 = texture(sampler, offset.yw);

    float sx = s.x / (s.x + s.y);
    float sy = s.z / (s.z + s.w);

    return mix(
       mix(sample3, sample2, sx), mix(sample1, sample0, sx)
    , sy);
}

{{{0.698039, 0.996078, 0.262745}, {0., 0.266667, 1.}, {0.00392157, 
   0.25098, 0.996078}, {1., 0.65098, 0.}}, {{0.996078, 0.823529, 
   0.}, {0.498039, 0., 0.00392157}, {0.831373, 0.00392157, 
   0.00392157}, {0.956863, 0.972549, 0.00784314}}, {{0.909804, 
   0.00784314, 0.}, {0.87451, 0.996078, 0.0862745}, {0.196078, 
   0.992157, 0.760784}, {0.00392157, 0.00392157, 0.498039}}, {{1., 
   0.878431, 0.}, {0.588235, 0.00392157, 0.00392157}, {0.00392157, 
   0.0666667, 0.996078}, {0.996078, 0.517647, 0.}}}