都用HBM了,那得多宽的带宽啊,差不多400+GB/s了,感觉有点大炮打蚊子了。如果只做加速器不做cpu那就更简单了,除去branch predict,可能连bypass和forward通路都不用,那就更简单了……
【 在 jessez 的大作中提到: 】
: 是的,指令设计可以尽量简单,是用作加速器而不是cpu,所以还有主cpu如何操作fpga加速器的问题。从加速器的角度,希望“寄存器”尽量多,VLIW尽量宽,用满fpga到板载内存的带宽,
: 理想中是用上Xilinx virtex ultrascale+ hbm的好几百GB带宽hbm
--
FROM 123.58.117.*