- 主题:内卷和卷积神经网络
哈哈,挺形象的,继续延伸下硬件实现:
1.基本操作为乘、加。
2.第1代最原始:先算乘法,再算加法,一个个,一步步来;
3.第2代:专门MAC指令,三操作数指令,乘、加一起算,快了不少;
4.第3代:搞个accelerator unit,既然都是都是buffer输入,都是同类操作,给个起始地址、次数、Buffer步进模式,给个存储结果地址,n个时钟周期后,计算完成,嗖嗖的。
能卷得动,就使劲卷吧。
【 在 Barbarossa 的大作中提到: 】
: 内卷和深度学习卷积神经网络有密切的关系。内卷可以看做是一种卷积运算,其中卷积核相当于某些高价值职位,比如编制,不同行业对应不同通道。滑动窗口指考公等筛选过程,当然三十五求职门槛也算一种窗口,你错过这些窗口就没有机会了。内卷的内可以理解为一种降维操作。
--
FROM 106.44.230.*
先解决step by step,over and over again场景。
【 在 ProudEcho 的大作中提到: 】
: 大数据。。。有未来么。我更倾向于这个东西是精神原子弹,破坏独立思考精神的东西。
--
FROM 106.44.230.*
您谬赞了。
当年老板丢给俺2片主频40M定点DSP,让把MP3 的Codec跑上去,DSP ASM+C搞定;
又过了几年客户要在24MHz的RISC的内核上跑MP3 decoder,ASM + C + 增加RISC内核专用MAC指令集搞定;
又过了几年客户为了增加设备续航要求MP3 decoder继续优化降低主频,C + 专用协处理器搞定,交付客户
C代码+ Verilog 代码。
这也是半导体界通行的做法,类似方法最牛的应该是高通的通信Codec中,一次听高通的人讲他们Codec
优化,听得都呆了。
【 在 Barbarossa 的大作中提到: 】
: 惊呆了,羡慕你的睿智
--
FROM 106.44.230.*