- 主题:3 GFLOPS 的NPU,成本大概多高?功耗大概多大?
3G不需要NPU,cpu加几个乘法单元,或者用个dsp的核就行了
【 在 quantitative 的大作中提到: 】
: 做过NPU的大佬,麻烦指点一下。
- 来自「最水木 for iPhone Xr」
--
FROM 112.64.119.*
这个说法并不完全对. 3Gflops是很低的性能要求,dsp或者带浮点乘加的cpu完全可以做相应的RNN网络的计算。
【 在 quantitative 的大作中提到: 】
: 研究了下,可能还是要专门的NPU好一点吧。
:
: 传统芯片厂商(如CPU、GPU和DSP)对于深度学习市场非常重视,因此利用他们巨大体量和市场推广、销售能力,大力推广用这些传统芯片来进行深度学习处理,其本质上也是对现有的技术进行微调,用传统SIMD架构来适配神经网络。然而,由于传统CPU、GPU和DSP本质上并非以硬件神经元和突触为基本处理单元,相对于NPU在深度学习方面天生会有一定劣势,在芯片集成度和制造工艺水平相当的情况下,其表现必然逊色于NPU。
: ....................
- 来自「最水木 for iPhone Xr」
--
FROM 124.78.132.*
你把ram,cpu,还有其它部分的功耗算一算,npu减少的那点功耗不会差很多的。速度嘛看你的要求了。总之你自己的系统得你自己去权衡,但是绝不是简单的npu就一定比dsp好
【 在 quantitative 的大作中提到: 】
: 估计还是没有NPU的速度快,功耗低吧。
:
: 万一不是RNN,估计也不好使了吧?
: ....................
- 来自「最水木 for iPhone Xr」
--
FROM 124.78.132.*