高通-人工智能研究/LLM-外科医生
法学硕士外科医生
ICLR 2020 上接受的“LLM 外科医生”在所有非结构化和半结构化剪枝以及最困难但最有效的删除整个矩阵列/行的结构化剪枝中均在 LLM 剪枝中取得了 SOTA。
论文页面:https://huggingface.co/papers/2312.17244 代码:https://github.com/notifications/beta/shelf
通过在 GitHub 上创建帐户来为 Qualcomm-AI-research/llm-surgeon 开发做出贡献。
来源和详细信息:
https://github.com/Qualcomm-AI-research/llm-surgeon