- 主题:编译器自己好像生成了SIMD指令,需要重写优化么
OpenMP is way better than avx...
【 在 libgcc 的大作中提到: 】
: 之前的代码都是
: for ...
: for....
: ...................
--
FROM 142.59.143.*
有的地方有不错的效果...
很多时候完全没有效果...
你的程序看起来很容易并行
如果内存分布比较合理 基本上几个内存通道就可以几倍加速...
【 在 USPLA 的大作中提到: 】
: openmp的simd现在发展怎么样了?有人比较研究过吗?
: 发自「今日水木 on iPhone X」
--
FROM 142.59.143.*
OpenMP 用得好 需要俩条件 1) 内存多通道; 2) 程序要考虑 ccNUMA...
我们大概可以做到十几二十倍的加速, 内存有12个通道...
【 在 libgcc 的大作中提到: 】
: 我咋觉得openmp没啥用。。。
: 可能我这就4个核看不出来
: 其实我是想问openmp4.0也有simd的优化,这个跟gccO2实现的simd优化 区别大不大
: ...................
--
FROM 142.59.143.*
配置比较好的台式机...
你看一下 好些联想 Dell 台式机 可以有12内存通道 这个很关键.
你的机器 我猜单通道或者双通道. 大概率双通道.
12通道 要插12根内存条... :-)
你可以查一下 联想 P720...
【 在 libgcc 的大作中提到: 】
: 。。。你啥机器,我这4核8G内存,是不是没必要了
: :
--
FROM 142.59.143.*
P720 可以双CPU.
单CPU 可以6通道...
【 在 hgoldfish 的大作中提到: 】
: 12 内存通道。。是不是搞错了???好像服务器一般也才八个通道。
: 并不是一条内存条就是一个通道啊??一般说工作站有四个内存通道,同一个内存通道可以有多个插槽,但不能同时读写。
: 内存控制器是嵌入在 CPU 里面的,不记得牙膏厂有生产过 12 通道的 CPU 啊。。农企肯定是没有,最多八通道。
: ...................
--
FROM 142.59.143.*