线程块 编辑
线程块是CUDA中的一种抽象化编程,它表示一组可以串行并行执行的线程。线程块中的线程数量曾经受架构限制,每个线程块最多只有512个线程,但从2019年7月开始,线程块可以最多包含1024个线程。同一线程块中的线程运行在同一个流处理上。同一线块中的线程可以通过共享内存同步屏障相互通信。
1