TileFlow: A Framework for Modeling Fusion Dataflow via Tree-based Analysis

学习TileFlow这篇论文中是如何进行多个内存层级的tiling.

阅读全文

hugging face llama使用

记录一下使用hugging face llama推理时遇到的问题.

阅读全文

Tensor DSL总结

本文旨在总结一些张量优化的DSL是如何设计的, 尝试从其中发现一些共同点. 接下来我将统一使用Matmul(Transpose(Conv(lhs)),rhs)的例子在不同的框架中进行测试.

阅读全文

MLIRSharp

记录一下MLIRSharp的开发总结.

阅读全文

tvm dynamic shape 学习

探究tvm dynamic shape的实现.

阅读全文

mlc-llm 浅析

学习tvm是如何解决LLM推理问题.

阅读全文

Alibaba EasyDist 浅析

对于阿里巴巴开源的EasyDist: Automated Parallelization System and Infrastructure for Multiple Ecosystems代码解读, 主要关注IR设计与搜索域构造.

阅读全文

Tiramisu Compiler Internals

Tiramisu 是一个基于polyhedral的DL compiler, 通过探索他的实现细节来学习如何利用polyhedral compilation并整合到他的dsl中的.

阅读全文

基于DL的CostModel

调研一些使用机器学习/深度学习方法构造神经网络CostModel的论文.

阅读全文

roofline Model

学习一下roofline Model相关内容.

阅读全文