12通道64G的ddr5,这也是非主流配置
存储容量与带宽严重不成比例,专门适用于moe了(存得多,算的少)
而且也是在赌,需要计算的部分平均分配到12个内存了,才会有理论最优值的10个字。
实际上需要计算的部分往往是有局部性的,假如活跃的37b参数在一条内存里,那就是每秒不到一个字。
【 在 isxb2 的大作中提到: 】
: 用玄武实验室那个配置吧,参数少的还是太傻,671一秒10个字感觉一个人玩够了,
: 如果你就死了心要用笔记本,插96G内存,oculink接显卡.
:
--
FROM 221.182.15.*