【理想汽车】【资深DEVOPS/SRE】-北京 望京
25-50K/m,视面试情况而定
CV to shanhe@lixiang.com
职位描述
1. 负责理想汽车AI训练平台的运维工作
2. 推动AI训练平台的大规模多集群k8s云原生架构演进
3. 标准化的基于cpu/gpu的调度,监控,日志采集处理等解决方案
4. 建设自动化及工程化的故障定位和问题解决方式,以尽量做到规模化,自动化
职位要求
1. 有强烈的技术热情,工作责任感,精通一门编程语言,Golang优先
2. 熟悉kubernetes,对其设计理念以及工作原理有较深入的理解
3. 掌握docker容器基础相关操作系统基础设施(文件系统,网络,cgroups等)
4. 使用过一种或多种service mesh,例如istio,traefik mesh优先
5. 了解过kubeflow等ai相关工具优先
--
FROM 111.202.221.*