- 主题:katago或许还有提升新通道了
之前用cuda,以后或可以仿照deepseek的方法,绕过cuda用底层中间件。
加速。
--
FROM 112.47.224.*
现在的模型/权重好像只用到4G显存 如果把显存尽量用起来,等级分是不是还能提高?
【 在 zszqzzzf 的大作中提到: 】
: 之前用cuda,以后或可以仿照deepseek的方法,绕过cuda用底层中间件。
: 加速。
--
修改:AlexandriaI FROM 120.244.194.*
FROM 120.244.194.*
【 在 zszqzzzf 的大作中提到: 】
: 之前用cuda,以后或可以仿照deepseek的方法,绕过cuda用底层中间件。
: 加速。
不知道为啥没人试试把cnn换成transformer
--
FROM 45.251.21.*
围棋是一个严谨且相对简单的数学问题,当前的解只取决于当前的状态,用不着transformer。
【 在 beautytree 的大作中提到: 】
: 不知道为啥没人试试把cnn换成transformer
--
FROM 180.109.112.*
状态空间太大了需要压缩啊。如果说压缩的话,transformer比cnn强吧,RL不动,把cnn换成transormer有可能性能还能提高
【 在 zxf 的大作中提到: 】
: 围棋是一个严谨且相对简单的数学问题,当前的解只取决于当前的状态,用不着transformer。
:
--
FROM 45.251.21.*