岗位职责:
1. 负责业界主流LLM大模型的适配,参与单机多卡、量化压缩、动态调度等性能提升技术的研究与落地。
2. 负责大模型性能分析和调优,识别和解决瓶颈问题,提高模型推理吞吐和时延优化。
3. 负责昇腾推理软件栈、加速库等软件的设计与开发。
4. 负责AI应用场景中上述软件栈的适配、调优,整体解决方案的制定
5. 负责相关算子算法、算子调度算法以及并行计算算法的开发与优化
任职要求:
1. 计算机基础知识扎实,热爱编程,熟悉C++/C/Python等主流编程语言
2. 熟悉Linux开发环境,有一定项目实践经验,具备较强的问题分析、解决能力
3. 自我驱动力强,具备较强的团队合作与沟通能力,完成项目交付和技术创新。
4. 具有以下经验者优先:
a)熟悉深度学习框架(Pytorch/ONNX/PaddlePaddle/Mindspore等)
b)异构编程(CUDA、OpenCL等),深度学习算法加速
c)CV及图像算法开发
d)熟悉模型离线部署的基本流程,具备离线部署的实战经验
e)有大型软件库开发经验
查看更多