职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
岗位职责:
1. 负责大语言模型的数据处理、预训练、指令精调等
2. 负责优化大语言模型的推理速度和并发能力
3. 负责语言模型长度外推研发
4. 负责语言模型服务开发和镜像制作
5. 负责语言模型的国产芯片适配
任职要求:
1. 计算机、人工智能等相关专业硕士及以上学历,3年以上工作经验
2. 熟练使用TensorFlow/PyTorch/transformers等深度学习训练或推理框架
3. 对大模型有技术热情,熟悉transformer基本原理,熟悉rope等位置编码方法,熟悉ntk等模型外推方法
4. 精通Python/C 至少一种语言,有良好的数据结构和计算机知识
5. 熟悉linux操作系统,对分布式训练有一定的了解
6.有良好的逻辑思维能力、表达与分析能力、团队合作精神和主动沟通意识