加入我们

社会招聘

AI算法岗(算子/量化/架构)(北京)(J13962)

  • 招聘类别:社会招聘
  • 工作性质:全职
  • 薪资范围:面议
  • 招聘人数:若干
  • 工作地点:北京市-大兴区
  • 发布时间:2025-03-10

工作职责

1. 针对公司内部的边缘设备,对分类、检测、分割、多模态、LLM等模型进行量化、剪枝和稀疏化处理,并负责将优化后的模型高效部署到边缘设备上,确保模型在资源受限的硬件环境中实现快速推理和低功耗运行;
2. 对部署后的模型进行性能评估和优化,包括但不限于计算精度、吞吐率和延迟等方面的调优,确保在边缘设备上达到最优的性能表现;
3. 撰写部署步骤、测试计划、性能分析报告等技术文档,为边缘设备的模型部署提供标准化流程和参考。

任职资格

1. 熟练掌握Python、C++等编程语言,具备良好的代码实现能力;
2. 熟悉主流推理框架(ONNX Runtime)以及模型优化工具(Pytorch/TensorFlow Lite);
3. 具备模型量化、剪枝和压缩的实际操作经验,能够针对边缘设备进行模型优化;
4. 熟悉边缘设备的部署流程(AX650N,RKNN等),包括但不限于模型转换、推理加速和硬件适配。

AI算法岗(算子/量化/架构)(北京)(J13962)

  • 招聘类别:社会招聘
  • 工作性质:全职
  • 工作地点:北京市-大兴区
  • 招聘人数:若干
  • 薪资范围:面议
  • 发布时间:2025-03-10

工作职责

1. 针对公司内部的边缘设备,对分类、检测、分割、多模态、LLM等模型进行量化、剪枝和稀疏化处理,并负责将优化后的模型高效部署到边缘设备上,确保模型在资源受限的硬件环境中实现快速推理和低功耗运行;
2. 对部署后的模型进行性能评估和优化,包括但不限于计算精度、吞吐率和延迟等方面的调优,确保在边缘设备上达到最优的性能表现;
3. 撰写部署步骤、测试计划、性能分析报告等技术文档,为边缘设备的模型部署提供标准化流程和参考。

任职资格

1. 熟练掌握Python、C++等编程语言,具备良好的代码实现能力;
2. 熟悉主流推理框架(ONNX Runtime)以及模型优化工具(Pytorch/TensorFlow Lite);
3. 具备模型量化、剪枝和压缩的实际操作经验,能够针对边缘设备进行模型优化;
4. 熟悉边缘设备的部署流程(AX650N,RKNN等),包括但不限于模型转换、推理加速和硬件适配。