Constraints Solver Internals

2024-05-08

关于ortools中Constraints Solver的内部逻辑.

Model Driven Optimization

2024-04-30

关于Model-Driven Optimization For Tensor Computations论文的阅读笔记.

2024-04-23

自从2020年Apple发布的芯片M1/M2/M3, 至少提供了四种不同的方式可以执行高负载的计算任务:

在M1 Max上单核计算单精度浮点矩阵乘法时, 使用SIMD指令集可达到102 GFLOPS左右的性能, 而使用AMX指令集最多可达到1475 GFLOPS! 本文就来带领大家一同探索AMX指令集, 学习如何解锁这剩下的14倍算力.

2024-03-13

研究一下在macos中如何编译bundle文件并动态加载并运行.

2024-01-11

学习mlir中affine fusion pass, 主要关注依赖分析部分.

2023-12-29

学习TileFlow这篇论文中是如何进行多个内存层级的tiling.

2023-12-26

记录一下使用hugging face llama推理时遇到的问题.

2023-12-20

本文旨在总结一些张量优化的DSL是如何设计的, 尝试从其中发现一些共同点. 接下来我将统一使用Matmul(Transpose(Conv(lhs)),rhs)的例子在不同的框架中进行测试.

2023-11-25

记录一下MLIRSharp的开发总结.

2023-11-15

探究tvm dynamic shape的实现.