当前播放: 微博深度学习平台基于Kubernetes的分布式解决方案
00:00 / 00:00
标清
  • 标清
1.0x
  • 2.0x
  • 1.5x
  • 1.25x
  • 1.0x
  • 0.5x
网页全屏
全屏
00:00
付费课程,可试看
合辑:Kubernetes的应用
从平台构建到领域深耕: Kubernetes在华为云的实践与发展
基于Istio on Kubernetes云原生应用的最佳实践
微博深度学习平台基于Kubernetes的分布式解决方案
基于 Kubernetes 的 DevOps

微博深度学习平台基于Kubernetes的分布式解决方案

于翔 新浪微博 机器学习研发架构师

于翔,新浪微博 机器学习研发架构师

内容介绍

随着深度学习在微博业务场景中的广泛使用,深度学习平台遇到一些挑战:离线训练方面,各业务方需求丰富多样,任务管理纷繁复杂,大数据与大模型带来训练时长的压力;在线推理方面,基于模型服务的特殊性,如何在满足微博大流量高性能的在线业务需求同时,保证服务的高可用与稳定性。

本次分享从以上两个维度切入,基于 K8s 构建分布式离线与在线方案,解决上述遇到的挑战。

内容大纲

  1. 介绍背景,微博业务与深度学习平台;
  2. 介绍离线训练遇到的挑战,方案选型 (Yarn & K8s),方案介绍 (基于 tfjob) 以及相关效果;
  3. 介绍在线推理遇到的挑战,方案选型(自定义服务发现)解决方案 (K8s deployment 等基础资源对象)。
展开
¥4.99 购买
开通VIP
13
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
其他推荐
39:21
从平台构建到领域深耕: Kubernetes在华为云的实践与发展
王泽锋 华为云 Kubernetes开源负责人
试看
45:15
基于Istio on Kubernetes云原生应用的最佳实践
王夕宁 阿里云 高级技术专家
试看
34:28
基于 Kubernetes 的 DevOps
倪朋飞 Microsoft Azure Senior Software Engineer
试看