昨天至少重新随机初始化和换各种网络折腾训练了几十次...ft
80%的情况似乎都是落到差不多loss水平的局部最优解并且收敛,20%的情况会梯度爆炸根本不收敛。
【 在 heyuanlie 的大作中提到: 】
: 模型退化了?
: 重新初始化网络训练或者换另一种随机数生成函数对网络初始化再重新训练看看?
: 其实就是可能一开始时随机生成的网络参数所在曲面区域不理想,最后估计落入局部无穷小了。
: ...................
--
修改:Xjt FROM 101.80.249.*
FROM 101.80.249.*