- 主题:矩阵转置的算法中,除了分块和cache oblivious,还有什么好的算
有什么专门争对 intel cpu 优化的资料吗? 谢谢!
--
FROM 210.26.112.*
难道不是设置一个flag,表示转置?O(1)
--
FROM 209.249.20.*
转置要个毛算法,把row major 变成column major读取就完事了
【 在 fangniuwawa 的大作中提到: 】
:
: 有什么专门争对 intel cpu 优化的资料吗? 谢谢!
#发自zSMTH@一代鸡皇水果iPhone 250 MAX
--
FROM 82.19.154.*
应该是mkl最合适了 开源的话openblas了解一下
【 在 fangniuwawa 的大作中提到: 】
: 有什么专门争对 intel cpu 优化的资料吗? 谢谢!
--
FROM 223.104.210.*
谢谢!
我要计算两个张量的收缩,比如 A_ijklmn B_pjqlrs, 指标 j,l 收缩,得先把指标位置换一下再计算。
【 在 allegro 的大作中提到: 】
: 难道不是设置一个flag,表示转置?O(1)
--
修改:fangniuwawa FROM 210.26.112.*
FROM 210.26.112.*
谢谢回复!
我要计算两个张量的收缩,比如 A_ijklmn B_pjqlrs, 指标 j,l 收缩,得先把指标位置换一下再计算。
【 在 one4all4one 的大作中提到: 】
: 转置要个毛算法,把row major 变成column major读取就完事了
:
: #发自zSMTH@一代鸡皇水果iPhone 250 MAX
--
FROM 210.26.112.*
谢谢!
【 在 TripleKing 的大作中提到: 】
: 应该是mkl最合适了 开源的话openblas了解一下
--
FROM 210.26.112.*
听着像tensor的降维,AI的?可以看看intel开源onednn的reorder
【 在 fangniuwawa 的大作中提到: 】
: 谢谢!
--
FROM 223.104.213.*
Cache friendly重要的事情说三遍
【 在 one4all4one 的大作中提到: 】
: 转置要个毛算法,把row major 变成column major读取就完事了
:
: #发自zSMTH@一代鸡皇水果iPhone 250 MAX
--
FROM 67.163.48.*
【 在 fangniuwawa 的大作中提到: 】
: 有什么专门争对 intel cpu 优化的资料吗? 谢谢!
intel做的mkldnn,现在好像叫onednn了,里面应该有个参考实现的
如果不关心源代码,直接用现在blas里的实现应该就行了
--
FROM 111.206.145.*