"cpu1提交 transactional memory成功后,主动把cache给flush到LLC,方便下一个cpu来访问?"
Ling: 是
“如果是这个思路,感觉普通atomic 指令完成write之后(spin_unlock()),然后cpu主动把自己的priviate cache给flush到LLC,这样是不是也有性能上提升?”
Ling:是
“但是假如push到LLC后,后面的cpu还是cpu1发起的访问,感觉这个优化就有点没必要了。是不是在典型的软件场景上,一般是其它cpu 。”
Ling:这个CPU通过记住上次的更新是否来自相同的CPU1来操作,如果上次更新来自相同的CPU(cpu1)那么不用沉淀,如果不是那么推下去
“transactional memory这一块实现不了解,这个专利需要好好阅读下。 假如一个transaction里面涉及到多个cacheline,按照你这个专利,是不是都要给clean & invalidate到LLC ?”
Ling:是
【 在 yupluo 的大作中提到: 】
: 多谢,学习了。
: 看概述专利的特点:
: cpu1提交 transactional memory成功后,主动把cache给flush到LLC,方便下一个cpu来访问? 如果是这个思路,感觉普通atomic 指令完成write之后(spin_unlock()),然后cpu主动把自己的priviate cache给flush到LLC,这样是不是也有性能上提升?
: ...................
--
FROM 47.251.3.*