基于 CPU 的深度学习推理优化部署方案和实践

难度系数:

困难等级star01困难等级star01困难等级star01困难等级star01困难等级star01

嘉宾 : 张磊 | 爱奇艺 研究员

讲师介绍

演讲嘉宾:张磊

爱奇艺 研究员

现就职于爱奇艺技术产品中心计算云团队,目前主要负责云平台上深度学习应用的优化落地方案。加入爱奇艺之前就职于英特尔亚太研发有限公司,负责底层图形图像软件设计和实现,对 CPU,GPU 上应用的性能分析和优化有丰富的经验。

议题介绍

演讲:基于 CPU 的深度学习推理优化部署方案和实践

难度系数:

困难等级star01困难等级star01困难等级star01困难等级star01困难等级star01

随着人工智能技术在多媒体领域的广泛应用, 深度学习算法的部署对计算平台资源的需求也在飞速增长。由于 GPU 资源总数和成本的限制,我们设计和部署了基于 CPU 的深度学习推理优化方案。方案通过封装 Intel VINO SDK 提供的基于 CPU 的深度学习加速底层软件,结合 docker 及 mesos 集群技术,完成深度学习算法在云端部署的自动化和服务化,将深度学习推理的性能在 CPU 上提升了 2~10 倍以上,满足多媒体业务的深度学习部署需求, 解决了 GPU 资源的依赖和稀缺问题。

主要内容:

  1. 使用 VINO SDK 实现 CPU 上的深度学习推理性能优化;
  2. 不同深度学习算法在 CPU 上加速的性能评估和对比;
  3. 基于 Docker 及 Mesos 的集群深度学习推理应用自动化部署方案。

听众受益:

  1. 学习 CPU 上深度学习的性能优化技术和实践;
  2. 了解大规模集群的深度学习应用部署管理方案;
  3. 理解深度学习推理的性能评估和监测方法。
本网站图片存储由七牛云独家支持