怎么没关系了,就像deepseek,671b的模型对算力的要求就是比70b的高,算力不够你硬上671b,老半天才给你吐一个字,就像开车前面有情况自驾老半天才反应,黄花菜都凉了
【 在 whistlingMe 的大作中提到: 】
:
: 和算力没关系,最初级手机能跑的模型都能处理多种输入。
: 有关系的是数据,只有训练数据量够,模型自然会学会怎么平衡视觉、激光、声波。
: 大脑走路时同时利用视觉和听力,也就小脑里很小一部分算力而已。
: --
:
发自「今日水木 on iPhone 15 Plus」
--
FROM 120.229.76.*