深入剖析Kubernetes
张磊
Kubernetes社区资深成员与项目维护者
立即订阅
22715 人已学习
课程目录
已完结 56 讲
0/4登录后,你可以任选4讲全文学习。
课前必读 (5讲)
开篇词 | 打通“容器技术”的任督二脉
免费
01 | 预习篇 · 小鲸鱼大事记(一):初出茅庐
02 | 预习篇 · 小鲸鱼大事记(二):崭露头角
03 | 预习篇 · 小鲸鱼大事记(三):群雄并起
04 | 预习篇 · 小鲸鱼大事记(四):尘埃落定
容器技术概念入门篇 (5讲)
05 | 白话容器基础(一):从进程说开去
06 | 白话容器基础(二):隔离与限制
07 | 白话容器基础(三):深入理解容器镜像
08 | 白话容器基础(四):重新认识Docker容器
09 | 从容器到容器云:谈谈Kubernetes的本质
Kubernetes集群搭建与实践 (3讲)
10 | Kubernetes一键部署利器:kubeadm
11 | 从0到1:搭建一个完整的Kubernetes集群
12 | 牛刀小试:我的第一个容器化应用
容器编排与Kubernetes作业管理 (15讲)
13 | 为什么我们需要Pod?
14 | 深入解析Pod对象(一):基本概念
15 | 深入解析Pod对象(二):使用进阶
16 | 编排其实很简单:谈谈“控制器”模型
17 | 经典PaaS的记忆:作业副本与水平扩展
18 | 深入理解StatefulSet(一):拓扑状态
19 | 深入理解StatefulSet(二):存储状态
20 | 深入理解StatefulSet(三):有状态应用实践
21 | 容器化守护进程的意义:DaemonSet
22 | 撬动离线业务:Job与CronJob
23 | 声明式API与Kubernetes编程范式
24 | 深入解析声明式API(一):API对象的奥秘
25 | 深入解析声明式API(二):编写自定义控制器
26 | 基于角色的权限控制:RBAC
27 | 聪明的微创新:Operator工作原理解读
Kubernetes容器持久化存储 (4讲)
28 | PV、PVC、StorageClass,这些到底在说啥?
29 | PV、PVC体系是不是多此一举?从本地持久化卷谈起
30 | 编写自己的存储插件:FlexVolume与CSI
31 | 容器存储实践:CSI插件编写指南
Kubernetes容器网络 (8讲)
32 | 浅谈容器网络
33 | 深入解析容器跨主机网络
34 | Kubernetes网络模型与CNI网络插件
35 | 解读Kubernetes三层网络方案
36 | 为什么说Kubernetes只有soft multi-tenancy?
37 | 找到容器不容易:Service、DNS与服务发现
38 | 从外界连通Service与Service调试“三板斧”
39 | 谈谈Service与Ingress
Kubernetes作业调度与资源管理 (5讲)
40 | Kubernetes的资源模型与资源管理
41 | 十字路口上的Kubernetes默认调度器
42 | Kubernetes默认调度器调度策略解析
43 | Kubernetes默认调度器的优先级与抢占机制
44 | Kubernetes GPU管理与Device Plugin机制
Kubernetes容器运行时 (3讲)
45 | 幕后英雄:SIG-Node与CRI
46 | 解读 CRI 与 容器运行时
47 | 绝不仅仅是安全:Kata Containers 与 gVisor
Kubernetes容器监控与日志 (3讲)
48 | Prometheus、Metrics Server与Kubernetes监控体系
49 | Custom Metrics: 让Auto Scaling不再“食之无味”
50 | 让日志无处可逃:容器日志收集与管理
再谈开源与社区 (1讲)
51 | 谈谈Kubernetes开源社区和未来走向
答疑文章 (1讲)
52 | 答疑:在问题中解决问题,在思考中产生思考
特别放送 (1讲)
特别放送 | 2019 年,容器技术生态会发生些什么?
结束语 (1讲)
结束语 | Kubernetes:赢开发者赢天下
特别放送 | 云原生应用管理系列 (1讲)
基于 Kubernetes 的云原生应用管理,到底应该怎么做?
深入剖析Kubernetes
登录|注册

49 | Custom Metrics: 让Auto Scaling不再“食之无味”

张磊 2018-12-14
你好,我是张磊。今天我和你分享的主题是:Custom Metrics,让 Auto Scaling 不再“食之无味”。
在上一篇文章中,我为你详细讲述了 Kubernetes 里的核心监控体系的架构。不难看到,Prometheus 项目在其中占据了最为核心的位置。
实际上,借助上述监控体系,Kubernetes 就可以为你提供一种非常有用的能力,那就是 Custom Metrics,自定义监控指标。
在过去的很多 PaaS 项目中,其实都有一种叫作 Auto Scaling,即自动水平扩展的功能。只不过,这个功能往往只能依据某种指定的资源类型执行水平扩展,比如 CPU 或者 Memory 的使用值。
而在真实的场景中,用户需要进行 Auto Scaling 的依据往往是自定义的监控指标。比如,某个应用的等待队列的长度,或者某种应用相关资源的使用情况。这些复杂多变的需求,在传统 PaaS 项目和其他容器编排项目里,几乎是不可能轻松支持的。
而凭借强大的 API 扩展机制,Custom Metrics 已经成为了 Kubernetes 的一项标准能力。并且,Kubernetes 的自动扩展器组件 Horizontal Pod Autoscaler (HPA), 也可以直接使用 Custom Metrics 来执行用户指定的扩展策略,这里的整个过程都是非常灵活和可定制的。
取消
完成
0/1000字
划线
笔记
复制
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
该试读文章来自付费专栏《深入剖析Kubernetes》,如需阅读全部文章,
请订阅文章所属专栏。
立即订阅
登录 后留言

精选留言(10)

  • DJH
    请教一个问题:对于多POD的应用(如多副本的deployment),假设配置了根据CPU使用率进行自动水平伸缩(HPA),那么HPA执行水平伸缩的依据是各个POD中CPU使用率平均值还是最高值?另外HPA探测到多少次CPU高于设置值才会开始伸缩?CPU使用率探测的频率又是多久一次呢?
    2018-12-14
    3
  • William
    请问能否实现跨node的水平扩展?
    2018-12-24
    2
  • 虎虎❤️
    HPA 通过 HorizontalPodAutoscaler 配置要访问的 Custom Metrics, 来决定如何scale。
    Custom Metric APIServer 的实现其实是一个Prometheus 的Adaptor,会去Prometheus中读取某个Pod/Servicce的具体指标值。比如,http request的请求率。
    Prometheus 通过 ServiceMonitor object 配置需要监控的pod和endpoints,来确定监控哪些pod的metrics。
    应用需要实现/metrics, 来响应Prometheus的数据采集请求。

    留给自己的思考,Pod 的 metrics endpoint 如何对应到http_requests 这个指标的?
    2018-12-16
    2
  • 剑走偏锋
    就为了做自定义业务指标的监控,我们也做了水晶桥(Crystal Bridge)项目开源在github上了。思路是自采通过annotations公开的promethus指标,然后推往prometheus GW,最后再由上层prometheus来采集。

    今天这种让HPA通过自定义指标来完成扩容/缩容操作的技术设计的确很棒,学习了,感谢。
    2019-01-04
    1
  • 单朋荣
    Warning FailedGetObjectMetric 1m (x13 over 7m) horizontal-pod-autoscaler unable to get metric http_requests: Service on default sample-metrics-app/unable to fetch metrics from custom metrics API: the server could not find the metric http_requests for services
      Warning FailedComputeMetricsReplicas 1m (x13 over 7m) horizontal-pod-autoscaler failed to get object metric value: unable to get metric http_requests: Service on default sample-metrics-app/unable to fetch metrics from custom metrics API: the server could not find the metric http_requests for services
    遇到一个问题,求解决思路。。
    2019-10-22
  • yzw
    老师,对于没有证书的kubernetes集群,修改prometheus的什么参数可以保证访问采用的是不安全方式呢?我的kubernetes集群是v1.11.2,prometheus是kube-prometheus:v0.1.0,谢谢解答
    2019-08-06
  • suke
    老师 我在自己的集群上实验了一下http_requests的监控,servicemonitor和相关的hpa,以及相关的权限绑定都部署了,pod里也实现了 /meteics 接口 ,但是hpa的在线配置里提示service on xx xxxx/object metrics are not yet supported,请问您大概知道我因为什么才导致的这个问题么,网上也没查到相关的解释
    2019-06-20
  • stan
    请张老师帮忙解惑,对于多实例应用,采集 service暴露的指标才是正确的做法,这句怎么理解?采集每个pod对应的指标不好吗,service后面对应的api无法确认来自哪个pod吧?数据可能忽大忽小,如果采集到一个刚刚hpa的pod指标,数据可能更小,这样应该没有采集每个pod,然后平均值来的更精确吧?类似对于cpu 的hpa,就是采集的每个pod的指标然后做平均值
    2018-12-20
  • DJH
    还有个问题请教一下,PVC属性里的读写属性ReadWriteMany指的是多个pod之间可以同时读写?同一个pod的多个容器之间算同时读写吗?
    2018-12-14
  • A-
    请教一个问题,如何才能保证pod原地重启。不论是升级还是断电。
    2018-12-14
收起评论
10
返回
顶部