有意向可站内,JD做简单参考,XM
算法优化工程师
岗位职责
1.参与端侧引擎的研发工作,确保其能在各类设备上流畅运行。针对不同硬件平台,尤其是高通平台(如骁龙系列芯片,包括其 CPU、GPU、Hexagon DSP 等计算单元),进行深入的算子适配与性能优化,内存占用优化,降低功耗,减少推理延迟,全方位提升端侧推理的性能表现。
2.紧密对接高通 AI Engine Direct 等芯片厂商 SDK,深度理解其架构与功能,实现模型与高通硬件加速单元的无缝、高效协同,充分挖掘硬件潜力,提升整体计算性能。
3.支持多操作系统(如 Android、Linux RTOS 等)下推理引擎的部署与调试工作。根据不同操作系统的特性,进行针对性的优化与调整,确保引擎在各系统环境下都能稳定、高效运行。
性能调优与工具链开发
4.与算法团队密切配合,深度参与模型到端侧引擎的转换与验证工作。从工程实现的角度,为算法优化提供专业建议,确保模型在端侧的高效运行与精度保障。
任职要求
1.对主流推理引擎(如 TensorRT、TFLite、MNN等)有深入的理解,熟悉其底层加速原理与运行机制,能够灵活运用并进行二次开发。
2.精通 C++ /C编程语言,具备扎实的编程功底与良好的代码风格,能够高效地进行复杂系统的开发与调试。深入了解硬件架构,特别是 ARM 指令集以及高通芯片(如骁龙系列)的架构特点,熟悉其 CPU、GPU、DSP 等计算单元的工作原理。熟练掌握性能分析工具(Perf、Q Profiler 等),能够通过工具准确分析性能问题并进行优化。
3.具有高通芯片厂商工具链的适配经验,熟悉高通 QNN SDK/API 的开发与运用,能够快速上手并进行深度优化。具备低精度计算(INT8/FP16)实践经验,能在保证模型精度的前提下,有效降低计算量与内存占用。
4.有大模型在端侧部署与优化的经验更佳,熟悉大模型的结构与推理过程,能够针对大模型的特点进行针对性的优化,如 KV cache 优化、预测解码技术应用等。
--
FROM 114.247.175.*