是否有支持fp16扩展的OpenCL实现?

是否有支持fp16扩展的OpenCL实现?,opencl,Opencl,我正在寻找支持cl_khr_fp16扩展的OpenCL语言的实现。据我所知,目前还没有公开的实现支持这一点。我认为你是对的,目前还没有实现支持这一点。 但是由于cl_khr_fp16 ext是v1.1(AFAIK)的一部分,而且v1.1即将推出,所以您不必等待太久 AMD的路线图: NVIDIA已经预发了v1.1驱动程序: 我认为您是对的,目前没有任何实现支持此功能。 但是由于cl_khr_fp16 ext是v1.1(AFAIK)的一部分,而且v1.1即将推出,所以您不必等待太久 AMD的路线

我正在寻找支持cl_khr_fp16扩展的OpenCL语言的实现。据我所知,目前还没有公开的实现支持这一点。

我认为你是对的,目前还没有实现支持这一点。 但是由于cl_khr_fp16 ext是v1.1(AFAIK)的一部分,而且v1.1即将推出,所以您不必等待太久

AMD的路线图:

NVIDIA已经预发了v1.1驱动程序:


我认为您是对的,目前没有任何实现支持此功能。 但是由于cl_khr_fp16 ext是v1.1(AFAIK)的一部分,而且v1.1即将推出,所以您不必等待太久

AMD的路线图:

NVIDIA已经预发了v1.1驱动程序:


1.1中的半标量和半向量类型仍然是可选的扩展,用于“仅存储”以外的用途。Oic。我知道PTX支持
.fp16
,但同样支持“仅存储”。从NV文档:仅在与.f32和.f64类型的转换中允许.f16浮点类型。所有浮点指令仅在.f32和.f64类型上运行。)。因此,目前的NVIDIA gen似乎不支持fp16操作。这似乎也是当前ATI gen的情况(查看CAL,根本没有提到半精度浮点)。也许下一代会支持它?从开始,半标量和半向量类型仍然是1.1中的可选扩展,用于“仅存储”以外的用途。我知道PTX支持
.fp16
,但同样支持“仅存储”。从NV文档:仅在与.f32和.f64类型的转换中允许.f16浮点类型。所有浮点指令仅在.f32和.f64类型上运行。)。因此,目前的NVIDIA gen似乎不支持fp16操作。这似乎也是当前ATI gen的情况(查看CAL,根本没有提到半精度浮点)。也许下一代会支持它?