- 主题:矩阵转置的算法中,除了分块和cache oblivious,还有什么好的算
有什么专门争对 intel cpu 优化的资料吗? 谢谢!
--
FROM 210.26.112.*
谢谢!
我要计算两个张量的收缩,比如 A_ijklmn B_pjqlrs, 指标 j,l 收缩,得先把指标位置换一下再计算。
【 在 allegro 的大作中提到: 】
: 难道不是设置一个flag,表示转置?O(1)
--
修改:fangniuwawa FROM 210.26.112.*
FROM 210.26.112.*
谢谢回复!
我要计算两个张量的收缩,比如 A_ijklmn B_pjqlrs, 指标 j,l 收缩,得先把指标位置换一下再计算。
【 在 one4all4one 的大作中提到: 】
: 转置要个毛算法,把row major 变成column major读取就完事了
:
: #发自zSMTH@一代鸡皇水果iPhone 250 MAX
--
FROM 210.26.112.*
谢谢!
【 在 TripleKing 的大作中提到: 】
: 应该是mkl最合适了 开源的话openblas了解一下
--
FROM 210.26.112.*