《AI算法工程师手册》新增九篇 LLM 量化的论文

水木社区手机版

展开|楼主|同主题展开|返回

上一篇|下一篇|同主题下篇

主题:《AI算法工程师手册》新增九篇 LLM 量化的论文
youxia|2023-09-20 17:59:05|
新增 LLM 量化章节，新增 9 篇相关的论文:

《Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference》
《Mixed Precision Training》
《The case for 4-bit precision: k-bit Inference Scaling Laws》
《SmoothQuant: Accurate and Efficient Post-Training Quantization for Large Language Models》
《LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale》
《ZeroQuant: Efficient and Affordable Post-Training Quantization for Large-Scale Transformers》
《SparseGPT: Massive Language Models Can Be Accurately Pruned in One-Shot》
《GPTQ: Accurate Post-Training Quantization for Generative Pre-trained Transformers》
《LUT-GEMM: Quantized Matrix Multiplication based on LUTs for Efficient Inference in Large-Scale Generative Language Models》

详细内容参考：https://www.huaxiaozhuan.com/
--
FROM 112.64.61.*

上一篇|下一篇|同主题下篇

BYR-Team©2010. KBS Dev-Team©2011 登录完整版