论文跟编译无关
任何算法是误导的说法。我们有一组算法需要编译,只需要考虑这些算法,而不是真正的任何算法
最优化的定义是编译结果的每一个 cycle 都用到理论上最多的 function unit 。比如说,一个算法在语义上是 4way 的,那么每一个 cycle 都必须是真正的 4way 并行。当然这也受限于 function unit 的数量,比如说一个 4way 的算法编译目标只有两个 ALU ,那么每个 cycle 必须用完两个 ALU 。
所以不仅编译器要有这个能力,算法的表达也需要有这个能力,不能因为 data hazard 而导致 stall 。哦,这是因为我们没有 speculative execution 。
【 在 xiaoju @ [Programming] 的大作中提到: 】
:
: 我感兴趣的是你们怎么定义“任何算法达到理论上限”
:
: 【 在 philbloo (philbloo) 的大作中提到: 】
: : 不想暴露真名实姓
#发自zSMTH@Moto Z3 Play
--
FROM 85.76.102.*