TileFlow: A Framework for Modeling Fusion Dataflow via Tree-based Analysis
学习TileFlow
这篇论文中是如何进行多个内存层级的tiling
.
学习TileFlow
这篇论文中是如何进行多个内存层级的tiling
.
本文旨在总结一些张量优化的DSL是如何设计的, 尝试从其中发现一些共同点.
接下来我将统一使用Matmul(Transpose(Conv(lhs)),rhs)
的例子在不同的框架中进行测试.
对于阿里巴巴开源的EasyDist: Automated Parallelization System and Infrastructure for Multiple Ecosystems代码解读, 主要关注IR设计与搜索域构造.
Tiramisu 是一个基于polyhedral的DL compiler, 通过探索他的实现细节来学习如何利用polyhedral compilation并整合到他的dsl中的.