跟他们交流过,GPU-STA的测试结果太理想化,有几个问题:
1.作为对比结果的CPU-STA,用的OpenTimer,跟商业化STA工具差距太大
商业化STA工具多线程加速做到10X甚至15X并不太困难
2.测试例子太小,所有数据能一次读入到GPU里,工业上不可能
需要加速的都是大例子,1T内存都是可能的,GPU的话需要来回倒腾数据
3.时序计算模型太简单,用到的数据太少
现在的工艺必然SI分析,必然用到ccs delay/noise模型,还经常电压插值
一次时序计算用到很多数据,想全部导入GPU显存是极其困难或者不可能的
但是如果一次时序计算需要倒腾GPU显存好几次,效率会很低
总之想法是可以的,对比结果是缺乏点说服力的
【 在 angusta 的大作中提到: 】
:
https://mp.weixin.qq.com/s/ybxo0eJogbuSkuYXpMe2Kw: 北大本科生,刚刚凭借在芯片领域的贡献,斩获国际计算机学会(ACM)年度学生科研竞赛总决赛第一名(本科生组)!
: 这位少年名叫郭资政,是北京大学图灵班大四学生,目前已直博本校集成电路学院。
: ...................
--
修改:jjfz FROM 111.197.239.143
FROM 111.197.239.143