L2 miss的没见过,协程优化LLC miss的工作17年开始在VLDB上出现过,原理大概和你说的一样,发一个prefetch之后就yield, 可以参考这篇文章:
https://infoscience.epfl.ch/record/231318这个方法对于几个GB的树结构访问情景,LLC miss概率较大,可以有明显收益;但是我感觉有两个问题:
1. 这种能“较好预测LLC miss”的场景是否有很多?基于DRAM的数据库是一个好场景,但是还有没有更普遍的?
2. 本质上相当于在线程内部构建了一个状态机,并发处理多个请求,而这不用协程也是可以实现的(参考上面的论文)。用协程只是让编程更好看,还能得到不错的性能。
--
FROM 119.8.242.*