这个也不能这么说。cuda核心数量和频率都是有显著的实打实的提升的。
只不过在ai领域更看内存带宽而已。
比如3090的cuda核心有10496个,频率更是1.4G/1.7G(boost)
然而A100的cuda核心只有6912个,频率则是0.8G/1.4G(boost)
纸面参数看A100被3090按在地上摩擦,但实际AI性能A100是3090的2倍以上,反过来把3090按在地板上摩擦。
原因就是A100用的HBM内存,带宽远超3090
这次4090的40%性能提升,我认为更多体现在cuda主频的提升上。多出来的cuda核心可能基本没怎么派上用场。
倒是4090新增了fp8,这对transformer是有很大加成的,再等等等到平台支持上去之后可以看看效果如何。
【 在 qgg 的大作中提到: 】
: 两年就搞出这么点。。。
--
修改:lvsoft FROM 114.222.221.*
FROM 114.222.221.*