字节跳动 AI-Lab 机器学习系统SRE运维研发工程师
职位描述:
负责超大规模分布式机器学习系统的稳定运转,包括 CPU/GPU 资源规划和运维,监控报警,自动化DevOps系统,
职位要求:
1. 一年以上运维开发项目经验
2. 熟练掌握 Linux 环境下的 Go/Python/Shell 等1至2种以上语言
3. 有大型分布式系统的资源管理和任务调度系统运维经验,熟悉Kubernetes、Docker 等开源技术
加分项
1. 从事过大规模分布式系统的运维,如:Kubernetes/Mesos/Hadoop
2. 有 GPU 服务器的运维经验
工作地点:北京
有意向,请发简历到 zhangzongqiang at bytedance.com
实习生,持续大量招聘中
字节跳动AI Lab网址:
https://ailab.bytedance.com/--
FROM 120.52.147.*