在调用clFinish或clWaitForEvents之前，OpenCL内核执行不会开始

2022-03-27 00:00:00 opencl c++

我正在尝试在GPU上运行内核，并在主机(CPU)上进行额外的计算。我看到了这个效果：

只有内核需要2000毫秒左右：

clEnqueeNDRangeKernel...

clFinish(或者clWaitForEvents，我都试过了)

我用睡眠在CPU上模拟了额外的计算(10)：

clEnqueeNDRangeKernel...

睡眠(10)；

clFinish(或clitForEvents)

理论上，内核应该在GPU上运行，在10秒的休眠之后，内核应该完成。但时间测量显示，这一切都需要12000毫秒，而不是10000毫秒。

是clFinish还是clWaitForEvents调用内核来启动，还是我遗漏了什么？

我使用的是AMD Fusion CPU/GPU和Linux。

非常感谢。

尝试在clEnqueueNDRangeKernel之后立即调用clFlush：

clFlush
在中发出所有以前排队的OpenCL命令与命令队列关联的设备的命令队列。

http://www.khronos.org/registry/cl/sdk/1.0/docs/man/xhtml/clFlush.html

相关文章