CUDA的计时方法
时间:2014-02-26 06:02:14
收藏:0
阅读:519
CUDA Runtime API提供了用于计时的接口,可以用如下代码对在GPU上运行的CUDA程序进行计时,计时结果以毫秒为单位:
cudaEvent_t start, stop; cudaEventCreate(&start); cudaEventCreate(&stop); cudaEventRecord(start, 0); //需要计时的在GPU上运行的程序 cudaEventRecord(stop, 0); cudaEventSynchronize(stop); float kernelTime; cudaEventElapsedTime(&kernelTime, start, stop); cudaEventDestroy(start); cudaEventDestroy(stop); printf("Kernel time: %.2f ms\n", kernelTime);
需要注意的是函数cudaEventSynchronize() 不可或缺,因为CUDA的kernel函数是以异步方式执行的,调用后立刻返回,这会导致计时不准确。cudaEventSynchronize(stop)会使得直到GPU执行完cudaEventRecord(stop, 0)之前的所有语句时,事件stop才会被记录下来,即起到同步的作用。
原文:http://blog.csdn.net/warren912/article/details/19920111
评论(0)