EfficientML.ai Lec 13 - Transformer and LLM (Part II) (MIT 6.5940 Fall 2023 Zoom-EfficientML.ai Lec 13 - Transformer and LLM (Part II) (MIT 6

AID:
CID:
视频图片:
作者头像:
弹幕地址:
视频描述:

热门回复:

  • Shlitty:韩老师您好,想请教一个问题,对于efficient inference 算法层面的compression 和硬件架构上采用存算一体的设计解决的是相似的问题么?同时使用这两种方式比只采用compression会有很大幅度的efficiency优化么?(有相关的论文推荐吗!