您当前的位置: 首页 > 职位列表 > 职位详情

大模型应用开发工程师(需出差)

1.5-3万元/月
投递简历
北京-海淀区
3-5年
2025-12-29 14:34:27 更新 被浏览:237 次
中科聚信信息技术(北京)有限公司
最近在线时间:2025-12-29 14:34:27
电话:188********
地址:北京市海淀区学院南路62号中关村资本大厦4层401室
职位描述

岗位职责
1.大模型应用二次开发与参数优化:基于LangChain/LlamaIndex/Dify/Haystack/RAGFlow/Flowise等开源框架进行定制化开发及深度调参,实现自定义文档解析模块、向量索引策略、Agent工具集成、Prompt工程体系构建、重排模型配置、权限控制机制等特定功能需求。

2.大模型推理引擎部署与性能优化:结合客户实际硬件环境,基于pytorch、vllm、sglang等开源框架开展推理参数调优,提升系统整体推理效率与资源利用率。

3.私有化端到端部署与交付:依托K8S完成大模型应用的定制化交付,完成从环境准备到生产上线的全流程私有化部署,确保系统稳定运行于客户业务场景中。

4.系统持续迭代与运维保障:负责系统上线后的版本迭代、问题排查与技术支持,输出运维文档、故障处理流程、培训资料等配套技术资产。

任职要求
1.计算机类相关专业本科及以上学历,具备2年以上AI工程实施或私有化项目交付经验。

2.熟练掌握以下至少两类开源框架,并拥有实际部署与二次开发经历:LangChain/LlamaIndex/Dify/Haystack/RAGFlow/FastGPT/Flowise

3.熟悉主流大模型推理方案中的一种或多种,如hf原生/vllm/sglang,理解其底层推理并行机制与优化原理。

4.精通Python&PyTorch,具备扎实的工程实现能力;能够使用C++/CUDA或Golang开发高性能计算算子或配套Sidecar服务。

5.掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能调优及数据迁移方法。

6.具备强烈的技术热情,良好的表达与协作能力,乐于探索新技术,能快速融入新团队与新环境;拥有出色的逻辑分析能力、沟通协调能力、抗压能力与情绪管理能力。

求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
大模型应用开发工程师(工作地:长春)
1.5-3万元/月
上海-浦东新区
2025-12-29 14:45:23
投递简历
反欺诈建模分析师(工作地:长春)
2.5-3.5万元/月
安徽-合肥
2025-12-29 14:44:26
投递简历
大模型应用研发工程师(需出差)
1-1.5万元/月
吉林-长春
2025-12-29 14:41:13
投递简历
ETL开发工程师(工作地:宁波)
9000-14000元/月
江苏-苏州
2025-12-29 14:39:33
投递简历
大模型应用研发工程师(需出差)
1.5-3万元/月
上海-闵行区
2025-12-29 14:38:18
投递简历
大模型应用开发工程师(工作地:长春)
1.5-3万元/月
重庆-渝北区
2025-12-29 14:38:10
投递简历
大模型应用开发工程师(需出差)
1.5-3万元/月
广东-深圳
2025-12-29 14:36:00
投递简历
反欺诈策略咨询顾问(需长期外派)
3-5万元/月
北京-海淀区
2025-12-29 14:34:49
投递简历
Java开发工程师
1.2-1.6万元/月
吉林-长春
2025-12-29 14:34:10
投递简历
反欺诈建模分析师(工作地长春)
1.5-3万元/月
重庆-渝北区
2025-12-29 14:32:05
投递简历
您可能感兴趣的职位 搜索更多相似职位 >
推荐企业 职位专题
中科聚信信息技术(北京)有限公司
公司主页 >
微信求职找工作
手机扫一扫
手机扫一扫
随时随地找工作

海量高薪岗位在线免费直招 招聘者/求职者电话直聊

微信小程序
手机也能找工作