写CUDA到底难在哪?

2025-06-19 19:10:17

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?
广告位810*200
相关阅读
为什么 Windows 系统上的安装包有 exe 和 msi 两种格式,有什么区别?

为什么 Windows 系统上的安装包有 exe 和 msi 两种格式,有什么区别?

类比一下,如果把「安装程序到你的电脑」比作「将钱存入你的银行...

2025-06-19
女朋友是体育生是一种什么体验?

女朋友是体育生是一种什么体验?

军校毕业,一女同学托人转告,非我不嫁。 高中时,因为女生太优...

2025-06-19
如何看待:“伊朗国家电视台:今晚会发生一件大事,世界将铭记几个世纪”?

如何看待:“伊朗国家电视台:今晚会发生一件大事,世界将铭记几个世纪”?

今天早上,大家都在为伊朗的惊喜而困惑的时候,幽默朗子在X上发...

2025-06-20
如何评价华为鸿蒙电脑?

如何评价华为鸿蒙电脑?

6月19号更新: Debian 12 ARM虚拟机:上午的时...

2025-06-19
Vim 有什么奇技淫巧?

Vim 有什么奇技淫巧?

整理一下笔记, 尽量多给一些不常见但好玩实用的命令。 退出...

2025-06-19