《编译后端优化》后端优化作为AI编译器跟硬件之间的相连接的模块,更多的是算子或者Kernel进行优化,而优化之前需要把计算图转换称为调度树等IR格式,然后针对每一个算子/Kernel进行循环优化、指令优化和内存优化等技术。
希望这个系列能够给大家、朋友们带来一些些帮助,也希望自己能够继续坚持完成所有内容哈!
内容大纲
PPT
和字幕
需要到 Github 下载,网页课程版链接会失效哦~建议优先下载 PDF 版本,PPT 版本会因为字体缺失等原因导致版本很丑哦~
小节 | 链接 |
---|---|
01 AI编译器后端优化介绍 | PPT, 视频, 文章, 字幕 |
02 算子分为计算与调度 | PPT, 视频, 文章, 字幕 |
03 算子优化手工方式 | PPT, 视频, 文章, 字幕 |
04 算子循环优化 | PPT, 视频, 文章, 字幕 |
05 指令和内存优化 | PPT, 视频, 文章, 字幕 |
06 Auto-Tuning原理 | PPT, 视频, 文章, 字幕 |
文字课程内容正在一节节补充更新,每晚会抽空继续更新正在 AISys ,希望您多多鼓励和参与进来!!!
文字课程开源在 AISys,系列视频托管B站和油管,PPT开源在github,欢迎取用!!!
非常希望您也参与到这个开源项目中,B站给ZOMI留言哦!
欢迎大家使用的过程中发现bug或者勘误直接提交代码PR到开源社区哦!
希望这个系列能够给大家、朋友们带来一些些帮助,也希望自己能够继续坚持完成所有内容哈!