您好,猎头彬彬,合作国内外70+企业,base北上广深武汉新加坡等
游戏,跨境贸易/电商/物流,云服务/基础软件,手机/芯片,私募量化,车企,社区分享,短视频,广告, ChatGPT
职位描述:
1. 负责包含大语言模型、搜推广、CV模型等在内的AI应用的性能分析和优化;
2. 需要跟资源调度、高性能网络/存储、异构硬件虚拟化等团队紧密合作,从调度、通信、I/O、编译等角度优化AI应用性能,提升业务竞争力;
3. 支持覆盖CPU/GPU/NPU等多代系、多平台的异构硬件AI编译优化能力,最大化释放异构资源池的硬件算力。
职位要求:
1. 具备MLIR/LLVM/TVM/XLA等编译优化经验, 熟系AI编译软件栈;
2. 具备大模型训练/推理的性能调优经验,精通tensorflow/pytorch/megatron/deepspeed/fastertransformer等业界主流深度学习引擎内核者优先;
3. 熟悉量化、剪枝、蒸馏等常见的模型压缩优化;
4. 熟悉分布式并行/流水线/通信优化等方式消除大规模分布式训练/推理瓶颈。
所发职位不全,手上职位非常多,欢迎咨询!
微信号:Brylin1991
邮箱: herocanjob@163.com
--
FROM 122.189.243.*