EfficientML.ai Lec 13 - Transformer and LLM (Part II) (MIT 6.5940 Fall 2023 Zoom-EfficientML.ai Lec 13 - Transformer and LLM (Part II) (MIT 6
热门回复:
- Shlitty:韩老师您好,想请教一个问题,对于efficient inference 算法层面的compression 和硬件架构上采用存算一体的设计解决的是相似的问题么?同时使用这两种方式比只采用compression会有很大幅度的efficiency优化么?(有相关的论文推荐吗!