AI大模型工程师

岗位职责:

1. 负责研究、开发和优化大语言模型相关技术,包括模型架构、大模型应用架构等,带领团队提出创新性解决方案。

2. 负责大模型预训练、高效微调、评测、部署和安全测试等大模型应用工作。

3.根据项目需求,进行模型的集成、部署和训练,快速支持产品需求。

4.评估模型在实际应用中的效果,并对其进行持续改进。

5.深入理解业务场景,与团队协作,有较强的业务意识和沟通能力。

6.跟踪人工智能领域的最新进展,持续优化模型性能,探索新的应用场景。

任职要求:

1. 自然语言处理或机器学习等方向计算机相关专业硕士及以上学历,具备至少3-5年相关经验,在大型企业或管理过团队优先考虑。

2.具有扎实的机器学习、深度学习理论基础,熟悉主流深度学习框架TensorFlow、PyTorch等。

3.熟悉常见的模型小型化技术,如量化/剪枝/蒸馏等,熟悉onnx/tensorRT。

4.具有良好的分析问题和动手实践能力,能快速部署开源模型,并且能优化模型的效果,熟练掌握Python等编程语言。

有良好的数据敏感性和逻辑推理能力,较好的学习和沟通能力,对业界新技术敏感、喜欢钻研,具备熟练的英文读写能力。

6. 参与并主导过NLP相关项目,有相关的系统优化经验,对大模型的原理、构建与应用有实战经验者优先。


联系我们


邮箱:server@shangdingsoft.com

QQ:3250344921

传真:021-54307002

地址:上海普陀区新村路666号6号楼201-203室内

关注公众号
客服服务

Copyright @ 2025 上海商鼎软件科技有限公司

沪ICP备:10019000号 沪公网安备31010402000811号