负责AI软件栈的整体开发,具体岗位包括:上层hal开发,runtime开发,神经网络图优化/图融合/网络性能优化,driver开发等。团队氛围好,当前岗位稳定。校招社招均有相应岗位,欢迎投递,加入我们!
岗位职责
参与公司自研芯片的深度学习算子的功能实现、测试和性能优化。
与硬件/算法团队团队协作,完善并行计算算子在NPU、CPU、DPS等异构硬件上的具体实现。
完成NPU子系统的驱动软件方案设计与开发,提供高效灵活的底层支撑方案。
支持公司内部业务广泛落地。
任职要求
计算机基础扎实,熟悉C/C++,具备系统软件开发架构能力,对汇编有一定了解。
熟悉计算机体系结构以及并行计算基本技术。
计算机相关专业硕士及以上学历
加分项
具有nvidia, amd, intel, qualcomm, arm或者imagination等至少一种GPU体系结构上的性能调优经验。
熟悉CUDA, ROCM, OpenCL等至少一种开发原语。
对高性能计算,异构计算,体系结构和性能优化工作有强烈的兴趣。
熟悉深度学习算法,对主流深度学习框架有一定的应用或开发经验。
可内推,欢迎投递,加入我们,并肩战斗! wx:1八零56四零7611
--
FROM 1.202.162.*