岗位描述:
在广告/搜索/推荐在线预估和离线训练场景,针对大规模稀疏特征和深度学习模型开展:
1. CPU/GPU/ASIC异构计算性能分析和优化,发挥数十万CPU cores和数千张加速卡的计算潜力;
2. 深度学习算法优化(量化/剪枝/稀疏/压缩)、编译优化和系统优化;
3. 探索面向广告/搜索/推荐深度学习推理/训练的理想软件和硬件系统。
岗位要求:
1. 计算机、软件工程、电子信息、自动化、数学等相关专业背景。
2. 有极佳的工程实现能力,精通C++,精通数据结构和常用算法,熟练掌握各种编译、调试、性能分析工具。
3. 有下面一个或多个方面的背景优先:
(1) 有深度学习相关领域背景,精通TensorFlow/XLA/MLIR/TVM等业界主流深度学习引擎/编译器优先;
(2) 有CPU/GPU/ASIC异构计算软件或硬件背景,熟悉计算机体系结构,精通异构并行计算编程(CUDA/OpenCL)和性能优化优先;
(3) 有程序编译技术背景,精通GCC/LLVM等主流编译器优先。
4. 我们还希望你:学习能力强,对新事物保有好奇心,并能快速适应新环境 ;良好的沟通能力和团队协同能力 ;对所在领域有热情,善于独立思考并反思总结。
简历发送到:yunlong.xyl @alibaba-inc.com
--
FROM 106.11.34.*