Graphics Cray XK6能运行实时光线跟踪器吗?

Graphics Cray XK6能运行实时光线跟踪器吗?,graphics,hardware,cray,Graphics,Hardware,Cray,今天我听说克雷的新超级计算机——XK6,但我有点困惑瓶颈在哪里。是在康涅狄格州吗?配置了500000个16核处理器的XK6能否实现实时可压缩到玩具总动员3的图形逼真度?我所说的“实时”,是指每秒60帧,或每帧16.7毫秒左右。不是。从《玩具总动员3》或类似的现代动画(或VFX)电影中渲染一个电影帧所需的计算量惊人地少。这些场景可能会引用数百GB的纹理,即使您可以确切地知道帧需要该纹理的哪个子集,也可能是数十GB,仍然需要从磁盘读取和/或通过网络传输。GPU或大规模并行分布式计算并没有加快速度。此

今天我听说克雷的新超级计算机——XK6,但我有点困惑瓶颈在哪里。是在康涅狄格州吗?配置了500000个16核处理器的XK6能否实现实时可压缩到玩具总动员3的图形逼真度?我所说的“实时”,是指每秒60帧,或每帧16.7毫秒左右。

不是。从《玩具总动员3》或类似的现代动画(或VFX)电影中渲染一个电影帧所需的计算量惊人地少。这些场景可能会引用数百GB的纹理,即使您可以确切地知道帧需要该纹理的哪个子集,也可能是数十GB,仍然需要从磁盘读取和/或通过网络传输。GPU或大规模并行分布式计算并没有加快速度。此外,渲染只是最后一步。。。为帧准备几何输入(模拟流体、布料和头发、细分几何体、从磁盘读取和解释大型场景)可能非常重要

因此,只需从空中提取数字(但这些数字具有一定的真实感),比如说,准备场景需要30分钟(加载模型、细化模型、一些小型模拟人生等),渲染需要4.5小时(其中30分钟用于从磁盘读取纹理和其他资源,剩下4小时的“光线跟踪”和其他计算)。如果XK6使光线跟踪无限快,那么整个过程只会加快5倍(1小时仍然很难序列化准备和I/O)。这就是阿姆达尔的定律

现在,你可能会问自己,“游戏怎么会发展得这么快?”它们有两种方式:(1)它们大幅减少数据集(纹理大小、几何分辨率等),以使所有数据集都适合GPU,并以相当快的速度加载级别(奇怪的是,当你认为渲染发生在“实时”);(2)他们不遗余力地在计算、技巧和人力上优化场景和算法,然后再运送磁盘,这样当它在播放器前面时,它可以快速渲染


总之,如果你问XK6的总计算能力是否足以实时计算渲染一个电影帧所需的所有纯数学运算,那么是的,很可能是。但是如果你问XK6是否能够根据渲染器需要的输入类型实时渲染电影,那么不,它不能。XK会吗6对渲染这些电影画面的人有用吗?不,可能不值得为所有软件重新编程(数百人年)从头开始。

从另一个角度看,用户通常一次只渲染一个场景,然后进行小的更改并反复重新渲染。要实时渲染单个场景,可能仍然需要在GPU的RAM上加载几GB的纹理


像克雷那样使用“核心海洋”或大量现代CPU的超级计算机能实时执行任务吗?是的,对于足够简单的场景。更复杂的场景需要每像素100多条射线,速度为8MP(电影为4K x 2K,DSLR/独立类型电影为2MP),以及大量的对象、阴影、薄雾、折射、漫反射光源等)可能需要太多的计算,即使是24fps。

谢谢,我想这可能是一项I/O限制的任务。考虑到从RAM读取与从磁盘读取的速度相比有几个数量级的加速,如果每个帧所需的所有纹理都加载到I/O,会怎么样nto RAM?如果您需要在一个序列中渲染大量帧(相同的环境、相同的资源),您可以预加载纹理并在所有帧上分摊I/O。但是您需要大约1 TB的内存来保存纹理,这比目前卡上最大的GPU提供的容量大2个数量级。