NVIDIA二十年护城河迎来最大升级!CUDA13.1正式发布

更新:2026-02-17 20:44:11

12月7日消息,近日NVIDIA已正式发布CUDA 13.1,官方称这是“自2006年CUDA平台问世以来规模最大、覆盖最全面的一次升级”。

此次更新的核心亮点在于引入了革命性的CUDA Tile编程模型,这一举措标志着GPU编程范式正式迈入一个全新的、更高抽象层级的发展阶段。

传统的GPU编程基于SIMT (单指令多线程) 模式,开发者需要关注线程、内存和同步等底层细节。

CUDA Tile是一种基于tile(即瓦片或数据块)的模型,现在开发者能够将精力集中在把数据组织成块,并对这些数据块开展计算上;至于线程调度、内存布局以及硬件资源映射等复杂的底层工作,则会由编译器与运行时自动完成处理。

为了支持Tile编程,CUDA 13.1版本推出了虚拟指令集(Tile IR),同时还配套发布了cuTile工具,该工具能够让开发者通过Python语言编写基于Tile的GPU Kernel。

这大大降低了GPU编程的入门难度,让那些不熟悉传统CUDA C/C++或者底层SIMT模型的数据科学家与研究者,也能够编写出GPU加速代码。

Tile编程并非要取代SIMT,而是作为一条可以与之并存的可选路径存在;开发者能够依据具体的应用场景,灵活挑选最适合的编程模型。

CUDA 13.1的价值,不只体现在新功能的添加或性能的优化上,更关键的是它为新一代高层级、跨架构的GPU计算库与框架的搭建筑牢了根基。借助Tile IR及高层抽象的引入,NVIDIA在硬件和软件之间增设了一个更厚实的中间层。

过去,像AMD的ROCm、Intel的OneAPI这类竞争对手,主要是借助兼容层来转译CUDA代码的。不过,面对CUDA Tile这种抽象程度更高的新模式,仅仅依靠代码转译就远远不够了。

竞争对手若要处理Tile IR,就必须构建同等智能的编译器,这显然加大了技术层面的对齐难度,从客观上进一步增强了CUDA生态系统的粘性,也提升了对用户的锁定程度。

最新游戏 更多
游戏攻略
热门游戏更多