
Thread,block,grid是CUDA编程上的概念,为了方便程序员软件设计,组织线程。
thread:一个CUDA的并行程序会被以许多个threads来执行。block:数个threads会被群组成一个block,同一个block中的threads可以同步,也可以通过shared memory通信。grid:多个blocks则会再构成grid。
在单一维度上,程序的执行可以由多达3*65535*512=100661760(一亿)个线程并行执行,这对在CPU上创建并行线程来说是不可想象的。新闻热点
疑难解答