矩阵转置的算法中，除了分块和cache oblivious，还有什么好的算

水木社区手机版

主题:矩阵转置的算法中，除了分块和cache oblivious，还有什么好的算
楼主|fangniuwawa|2020-06-23 17:57:21|只看此ID
有什么专门争对 intel cpu 优化的资料吗？谢谢！
--
FROM 210.26.112.*
1楼|allegro|2020-06-24 01:03:06|只看此ID
难道不是设置一个flag，表示转置？O(1)
--
FROM 209.249.20.*
2楼|one4all4one|2020-06-24 02:08:03|只看此ID
转置要个毛算法，把row major 变成column major读取就完事了

【在 fangniuwawa 的大作中提到: 】
:
: 有什么专门争对 intel cpu 优化的资料吗？谢谢！

#发自zSMTH@一代鸡皇水果iPhone 250 MAX
--
FROM 82.19.154.*
3楼|TripleKing|2020-06-24 08:36:01|只看此ID
应该是mkl最合适了开源的话openblas了解一下

【在 fangniuwawa 的大作中提到: 】
: 有什么专门争对 intel cpu 优化的资料吗？谢谢！
--
FROM 223.104.210.*
4楼|fangniuwawa|2020-06-24 10:36:06|只看此ID
谢谢！

我要计算两个张量的收缩，比如 A_ijklmn B_pjqlrs, 指标 j，l 收缩，得先把指标位置换一下再计算。

【在 allegro 的大作中提到: 】
: 难道不是设置一个flag，表示转置？O(1)
--
修改:fangniuwawa FROM 210.26.112.*
FROM 210.26.112.*
5楼|fangniuwawa|2020-06-24 10:36:33|只看此ID
谢谢回复！

我要计算两个张量的收缩，比如 A_ijklmn B_pjqlrs, 指标 j，l 收缩，得先把指标位置换一下再计算。

【在 one4all4one 的大作中提到: 】
: 转置要个毛算法，把row major 变成column major读取就完事了
:
: #发自zSMTH@一代鸡皇水果iPhone 250 MAX
--
FROM 210.26.112.*
6楼|fangniuwawa|2020-06-24 10:37:15|只看此ID
谢谢！
【在 TripleKing 的大作中提到: 】
: 应该是mkl最合适了开源的话openblas了解一下
--
FROM 210.26.112.*
7楼|TripleKing|2020-06-24 11:27:56|只看此ID
听着像tensor的降维，AI的？可以看看intel开源onednn的reorder

【在 fangniuwawa 的大作中提到: 】
: 谢谢！
--
FROM 223.104.213.*
8楼|mvtec|2020-06-24 19:39:08|只看此ID
Cache friendly重要的事情说三遍

【在 one4all4one 的大作中提到: 】
: 转置要个毛算法，把row major 变成column major读取就完事了
:
: #发自zSMTH@一代鸡皇水果iPhone 250 MAX
--
FROM 67.163.48.*
9楼|leslin|2020-07-08 16:46:24|只看此ID
【在 fangniuwawa 的大作中提到: 】
: 有什么专门争对 intel cpu 优化的资料吗？谢谢！

intel做的mkldnn，现在好像叫onednn了，里面应该有个参考实现的

如果不关心源代码，直接用现在blas里的实现应该就行了
--
FROM 111.206.145.*