大模型算法工程师
2-3万元/月*硕士为硬性要求,谢谢配合
岗位职责
1.主导或参与车载垂直领域大模型的研发与架构设计:聚焦车控、导航、娱乐及问答等场景,开展预训练语言模型的结构设计、持续预训练及对齐优化(SFT/RLHF),增强模型在车载环境中的交互体验、任务完成能力与个性化服务表现
2.突破大模型训练关键技术瓶颈:深入实践分布式并行训练方法(涵盖数据、张量与流水线并行),优化主流训练框架(如DeepSpeed、Megatron-LM),应对千亿参数级别模型在性能、显存占用与训练稳定性方面的挑战
3.设计高效推理与落地部署方案:研究面向车规级硬件的轻量化推理技术,包括模型量化、蒸馏、剪枝以及动态批处理、KVCache优化等手段,实现模型效能与端侧资源消耗的最优匹配
4.推动前沿技术探索与应用转化:紧密跟踪学术界与产业界最新进展(如MoE架构、多模态融合、智能Agent等方向),结合车载业务需求进行快速实验验证与工程化落地,持续提升模型综合能力
5.参与AI基础体系建设:协助搭建覆盖数据处理、预训练、微调至评估部署的大模型全周期研发基础设施,提升团队整体迭代效率与系统化研发水平
任职要求
1.计算机、人工智能、数学等相关专业本科及以上学历,具备3年以上自然语言处理或深度学习相关领域的研发经验
2.深入掌握Transformer结构原理,熟悉主流大模型(如LLaMA系列、GPT系列)的技术演进路径与核心机制
3.熟练使用PyTorch或TensorFlow框架,具有扎实的Python/C++编程能力,熟练操作Linux开发环境
4.拥有在大规模GPU集群上训练模型的实际经验,至少精通一种主流分布式训练框架(如Megatron-DeepSpeed、ColossalAI、FairScale等)
5.掌握大模型预训练全流程关键技术环节,包括大规模文本数据清洗与处理、词表构建、预训练任务设计等