这些库其实没那么神,自己写kernel大部分能达到原生的80%,不过覆盖面想做到CUDA的程度没个十年八年没戏
不过他们搞硬件的做porting是二进制码级别的
【 在 asic123 的大作中提到: 】
: 你支持CUDA API,但是那些NV内部不开源的库咋玩呢? cudnn, cufft之类的...有些都是machine code级别的优化的...
:
:
: ...................
--
修改:Jarma FROM 223.104.39.*
FROM 223.104.39.*