团队氛围好,不卷,做AI方向。
感兴趣请发送邮件到453367358@qq.com
邮件主题“应聘职位+姓名”,谢谢!
测试开发
1、负责AI平台测试工作,涵盖功能测试、集成测试、性能测试等,确保产品质量和性能稳定;
2、设计并搭建持续集成环境,并进行功能维护,提升测试流程的自动化和效率;
3、对AI产品进行效果评价和问题总结,结合项目运行情况提出优化建议,推动项目顺利进行;
4、不断完善AI产品线的测试方案,提升平台测试工具和方法的有效性,并能高效执行改进方案;
5、制定测试防范措施和应急预案,识别并跟踪测试项目风险,及时发现和解决问题,确保测试工作按计划推进;
6、与开发团队紧密协作,推动测试需求的落实和产品质量的提升。
职位要求
1、计算机相关专业硕士及以上学历;
2、熟悉大模型、机器学习及算法技术,了解AI领域最新动态者优先;
3、精通Python、Java等编程语言,具备自动化测试脚本的编写和维护能力;
4、能够快速从复杂的测试环境中识别问题重点,具备较强的分析和解决问题能力;
5、具有责任心、耐心和细致的工作态度,优秀的团队合作精神,热衷于测试验证工作;
6、具备良好的沟通能力,能够与跨职能团队紧密合作。
后端
1、设计与开发分布式模型训练和模型推理等核心模块,确保系统高可用性和高性能。
2、负责模型训练与推理过程的优化,提高效率,降低资源消耗。
3、开发和维护API,满足AI应用接入需求,确保接口易用性与兼容性。
4、负责Kubernetes上的API Server、运行时构建及微服务架构的开发与优化。
5、与AI应用开发团队紧密合作,持续优化平台性能与工具链体验。
职位要求
1、硕士及以上学历,计算机科学、人工智能等相关专业,扎实的计算机基础知识。
2、5年以上人工智能、机器学习领域的平台开发经验,熟悉主流AI框架和工具。
3、精通Golang,有AI框架训练和推理过程优化经验优先。
4、熟悉分布式系统、容器化技术,具备Kubernetes微服务开发经验。
5、优秀的沟通表达与团队合作能力,能够与跨职能团队高效协作。
6、出色的问题解决能力,具有持续学习和自我提升的意愿与能力。
框架优化
1.研发分布式训练加速方案,优化并行策略方案例如:DP/TP/PP/MP/CP,提升千亿参数模型训练吞吐量;
2.设计混合精度训练与显存优化方案,开发自适应梯度压缩、通信优化模块,实现单卡训练模型规模提升和降低分布式训练通信开销;
3.开发量化压缩工具链(支持GPTQ/AWQ等算法),实现模型8/4-bit无损量化部署;
4.设计多GPU推理调度策略,优化显存碎片管理与计算资源利用率;
5.跟进vLLM/TensorRT-LLM/SGLang等前沿框架,探索MoE架构/稀疏化训练等新型范式,将最新学术成果快速落地到工程实践。
职位要求
1.计算机相关专业硕士及以上学历,3+年LLM系统优化经验;
2.精通PyTorch/TensorFlow框架底层机制,具备CUDA/C++内核开发能力;
3.掌握Megatron-LM/DeepSpeed/HuggingFace生态核心原理;
4.有千亿参数模型训练优化或百万QPS推理服务落地经验者优先;
5.熟悉NVIDIA GPU架构与性能分析工具;
6.熟悉大模型推理服务架构设计与微服务化部署。
AI模型研发工程师
1. 行业大模型研发:负责行业基础大模型及专业模型的训练与优化,涵盖数据处理、模型架构设计、性能调优及模型部署等全过程。
2. 行业解决方案研发:将大模型在自然语言处理、图像分析、视频理解等多个技术领域的应用与行业场景结合,制定切实可行的技术解决方案,推动其在实际业务中的落地与应用。
3. 技术创新研发:持续跟踪前沿技术动态,推动行业应用的技术创新与落地,参与公司核心技术研发,持续优化现有技术方案,解决实际业务挑战。
职位要求
任职要求:
1、计算机科学、人工智能或相关技术专业毕业,研究生及以上学历者优先。
2. 要求具有大模型相关研发经验,对人工智能、深度学习技术有了解,有行业模型落地的实践经验者优先。
3. 具备软件开发经验,能够独立完成项目模块开发者优先,有Kubernetes微服务相关工作经验者优先。
4. 熟悉TensorFlow、PyTorch等主流深度学习框架,熟练掌握Python、Go或Java等至少一种编程语言。
5. 具备较强的团队合作能力和沟通能力。
运维
1.负责公司运维相关产品的设计、开发和维护工作,包括CMDB、CICD、日志、监控系统等;
2.通过平台工具建设提升产效率、业务稳定性;
3.负责基于Kubernetes、Docker云原生架构的DevOps平台开发工作;
4.能够主动发现问题解决问题,并给出系统性的解决方案;
5.AI OPS相关新技术的研究和应用,并推动适合的技术应用
于生产。
职位要求
1.计算机相关专业硕士及以上学历,3+年运维开发经验;
2.熟练掌握Python/Go/Shell开发,有丰富的运维平台开发经验;
3.扎实的技术基础,熟悉常用算法、数据结构、数据库、Linux、分布式系统等;
4.责任心强,工作认真细致,具有良好的团队沟通与协作能力;
5.熟悉Kubernetes、Docker云原生架构。
--
修改:longzuo FROM 106.120.182.*
FROM 106.120.182.*