Re: mac跑大模型怎么样呢？

水木社区手机版

展开|楼主|同主题展开|溯源|返回

上一篇|下一篇|同主题上篇|同主题下篇

主题:Re: mac跑大模型怎么样呢？
haili|2023-11-08 12:09:29|
Reddit上有人拿M1 Ultra 128G 跑70b的8bit量化，速度7-9 tokens /s

一般认为8bit量化已经非常非常接近16bit了，很多时候6bit量化就非常接近了。

【在 stevenwyy 的大作中提到: 】
: m2ultra 192G已退货
: llama2 70B GPU跑满推理起来都吃力，大概3tokens/s左右，再复杂点的应用就更别提了。不如自己finetuneGPT3.5了，GPT4 finetuning已经对部分用户开放了
--
FROM 101.254.182.*

上一篇|下一篇|同主题上篇|同主题下篇

BYR-Team©2010. KBS Dev-Team©2011 登录完整版