|
岗位职责: 1. 负责研究、开发和优化大语言模型相关技术,包括模型架构、大模型应用架构等,带领团队提出创新性解决方案。 2. 负责大模型预训练、高效微调、评测、部署和安全测试等大模型应用工作。 3.根据项目需求,进行模型的集成、部署和训练,快速支持产品需求。 4.评估模型在实际应用中的效果,并对其进行持续改进。 5.深入理解业务场景,与团队协作,有较强的业务意识和沟通能力。 6.跟踪人工智能领域的最新进展,持续优化模型性能,探索新的应用场景。 任职要求: 1. 自然语言处理或机器学习等方向计算机相关专业硕士及以上学历,具备至少3-5年相关经验,在大型企业或管理过团队优先考虑。 2.具有扎实的机器学习、深度学习理论基础,熟悉主流深度学习框架TensorFlow、PyTorch等。 3.熟悉常见的模型小型化技术,如量化/剪枝/蒸馏等,熟悉onnx/tensorRT。 4.具有良好的分析问题和动手实践能力,能快速部署开源模型,并且能优化模型的效果,熟练掌握Python等编程语言。 有良好的数据敏感性和逻辑推理能力,较好的学习和沟通能力,对业界新技术敏感、喜欢钻研,具备熟练的英文读写能力。 6. 参与并主导过NLP相关项目,有相关的系统优化经验,对大模型的原理、构建与应用有实战经验者优先。 |