Parallel processing 使用OpenCL对视频卡或集群进行智能分页
我一直在为我的OpenCL项目建立一个“智能分页”库。 基本上,这包括检查:Parallel processing 使用OpenCL对视频卡或集群进行智能分页,parallel-processing,paging,opencl,gpu,gpgpu,Parallel Processing,Paging,Opencl,Gpu,Gpgpu,我一直在为我的OpenCL项目建立一个“智能分页”库。 基本上,这包括检查: 设备数量 每个内存层的大小 两个大小的缓冲区的最大功率,适用于组中的所有设备 主机和设备之间通信的两个大小的缓冲区的最大功率 两个大小的缓冲区的最大功率将适合最大的设备 异步使用剩余内存的各种其他方法 其他太笼统而无法列举的事情 这些结果决定了页面大小、时间等方面。。这正是我脑子里想出来的 是否有任何有用的范例、体系结构或其他约定已经实现了高效的分页,或者是否有其他属性值得我关注,或者这些属性是否不足/不相关?我认
- 设备数量
- 每个内存层的大小
- 两个大小的缓冲区的最大功率,适用于组中的所有设备
- 主机和设备之间通信的两个大小的缓冲区的最大功率
- 两个大小的缓冲区的最大功率将适合最大的设备
- 异步使用剩余内存的各种其他方法
- 其他太笼统而无法列举的事情
是否有任何有用的范例、体系结构或其他约定已经实现了高效的分页,或者是否有其他属性值得我关注,或者这些属性是否不足/不相关?我认为这个多平台库应该解决您的想法:
我认为这个多平台库应该解决您的想法: