Kubernetes中Deployment的升级与回滚


Posted in Servers onApril 01, 2022

更新

打开 https://hub.docker.com/_/nginx 可以查询 nginx 的镜像版本,我们可以先选择一个旧一点的版本。

首先,我们创建一个 Nginx 的 Deployment,副本数量为 3。

kubectl create deployment nginx --image=nginx:1.19.0 --replicas=3

首次部署的时候,跟之前的操作一致,不需要什么特殊的命令。

注: 我们也可以加上 --record 标志将所执行的命令写入资源注解 kubernetes.io/change-cause 中。 这对于以后的检查是有用的。例如,要查看针对每个 Deployment 修订版本所执行过的命令。

其实更新 pod 是非常简单的,我们不需要控制每个 pod 的更新,也不需要担心会不会对业务产生影响,k8s 会自动控制这些过程。

我们只需要触发镜像版本更新事件,k8s 会自动为我们更新 pod 的。

kubectl set image deployment.apps/nginx nginx=nginx:1.20.0

格式为:

kubectl set image deployment.apps/{deployment名称} {镜像名称}:={镜像名称}:{版本}

我们可以查看 pod 的详细信息:

kubectl describe pods

找到 Events 描述:

... ...
Events:
  Type    Reason     Age   From               Message
  ----    ------     ----  ----               -------
  Normal  Scheduled  66s   default-scheduler  Successfully assigned default/nginx-7b87485749-rlmcx to instance-2
  Normal  Pulled     66s   kubelet            Container image "nginx:1.20.0" already present on machine
  Normal  Created    66s   kubelet            Created container nginx
  Normal  Started    65s   kubelet            Started container nginx

为了记录版本更新信息,我们需要在 kubectl create deploymentkubectl set image 命令后面加上 -- --record

我们还可以通过 edit 方式更新 pod。

执行:

kubectl edit deployment nginx

然后会弹出编辑 yaml 的界面,将 .spec.template.spec.containers[0].image 从 nginx:1.19.0 更改至 nginx:1.20.0,然后保存即可。

上线

仅当 Deployment Pod 模板(即 .spec.template)发生改变时,例如模板的标签或容器镜像被更新, 才会触发 Deployment 上线。 其他更新(如对 Deployment 执行扩缩容的操作)不会触发上线动作。Deployment 的上线动作可以为我们更新 pod 的版本。

它的上线跟我们所说的更新,有些区别。因为我们所说的更新,版本是往后的,例如 1.19.0 -> 1.20.0 ,用新版本替换旧版本才叫更新。但是 Deployment 的上线,则是任意版本。它会根据我们设置的镜像版本自动替换,可以用 1.19.0 替换 1.20.0。不过这里我们不需要纠结这些。

当我们更新 pod 版本时,k8s 会自动负载均衡,而不是把所有 pod 删除,再重新创建新版本 pod,它会以稳健的方式逐渐替换 pod。

我们可以通过命令,查看 pod 的上线状态:

kubectl rollout status deployment nginx

输出类似于:

Waiting for rollout to finish: 2 out of 3 new replicas have been updated...

或者

deployment "nginx-deployment" successfully rolled out

我们也可以通过获取 deployment 信息时,查看已更新的 pod 数量:

kubectl get deployment
NAME    READY   UP-TO-DATE   AVAILABLE   AGE
nginx   3/3     3            3           18m

UP-TO-DATE 字段可以看到成功更新的 pod 数量。

还可以查看 ReplicaSet 和 pod:

kubectl get replicaset
kubectl get pods

输出类型于:

NAME               DESIRED   CURRENT   READY   AGE
nginx-7b87485749   0         0         0       20m
nginx-85b45874d9   3         3         3       21m
NAME                     READY   STATUS    RESTARTS   AGE
nginx-85b45874d9-nrbg8   1/1     Running   0          12m
nginx-85b45874d9-qc7f2   1/1     Running   0          12m
nginx-85b45874d9-t48vw   1/1     Running   0          12m

可以看到有两个 ReplicaSet,nginx-7b87485749 已经被全部更新到 nginx-85b45874d9 了,所以前者的数量为 0,我们也可以看到 pod 中,所有 pod 都是以 nginx-85b45874d9 作为前缀的。这几个关键信息,我们可以截图,后面再次对照。

如果我们的项目上线了,我们更新软件版本,如果一次性更新所有容器或者 pod,那么我们的软件会有一段时间处于不可用状态,直到所有 pod 都完成更新。Deployment 可确保在更新时仅关闭一定数量的 Pod,默认情况下,它确保至少所需 Pods 75% 处于运行状态,也就是说正在被更新的 pod 比例不超过 25%。当然,只有两三个 pod 的 Deployment 不会按照这个比例限定。

如果我们的 pod 数量足够大,或者在更新 Deployment 时迅速输出上线状态,可以看到新旧的 pod 数量加起来不一定就是 3 个,因为它不会杀死老 Pods,直到有足够的数量新的 Pods 已经出现。 在足够数量的旧 Pods 被杀死前并没有创建新 Pods。它确保至少 2 个 Pod 可用,同时 最多总共 4 个 Pod 可用。

Deployment 确保仅所创建 Pod 数量只可能比期望 Pods 数高一点点。 默认情况下,它可确保启动的 Pod 个数比期望个数最多多出 25%(最大峰值 25%)所以在自动更新 Deployment 时,观察到的 pod 可能为 4个。另外,在 Deployment 更新时,除了可以更改镜像的版本,也可以更改 ReplicaSet 的数量。

执行 kubectl describe deployment nginx 查看 Deployment 详细信息,我们查看 Event 字段。

Kubernetes中Deployment的升级与回滚

但是这些原理等知识我们都不需要记,也不需要深入,我们记得有这回事就行,有需要的时候也可以直接查看文档的。

回滚

默认情况下, Deployment 的上线记录都会保留在系统中,以便可以随时回滚。

我们查看 Deployment 的上线历史记录:

kubectl rollout history deployment nginx
REVISION  CHANGE-CAUSE
2         <none>
3         <none>

注:我们的版本不一定一样,因为我为了这这篇文章,进行了一些测试,可能版本数量比你的多。

可以看到有 2,3 两个版本,我们查看 版本3 的信息:

kubectl rollout history deployment nginx --revision=3
deployment.apps/nginx with revision #3
Pod Template:
  Labels:	app=nginx
	pod-template-hash=85b45874d9
  Containers:
   nginx:
    Image:	nginx:1.20.0
    Port:	<none>
    Host Port:	<none>
    Environment:	<none>
    Mounts:	<none>
  Volumes:	<none>

目前介绍了几个查看 Deployment 上线的历史记录,下面我真正来回滚 Deployment。

回滚是一个版本:

kubectl rollout undo deployment nginx

再执行 kubectl rollout history deployment nginx 会看到不一样的信息。

此时版本数量多了,我们还可以指定回滚到特点的版本。

kubectl rollout undo deployment nginx --to-revision=2

这里提一下 --record,在前面,我们创建和更新 Deployment 时,都没有使用到这个参数。我们可以试试这个参数的作用。

kubectl set image deployment.apps/nginx nginx=nginx:1.19.0
kubectl rollout history deployment nginx

输出:

REVISION  CHANGE-CAUSE
5         <none>
6         kubectl set image deployment.apps/nginx nginx=nginx:1.19.0 --record=true

说明加上了 --record ,会把我们操作时的命令记录下来。

但是我们这里目前来说,只有两个记录,我们明明提交了多次,但是这里查询的只有两条记录,这时因为我们操作的时候,只用到了 1.19.0、1.20.0 两个版本,所以也就只有这两个版本的提交记录。多用几个版本,输出结果:

REVISION  CHANGE-CAUSE
7         kubectl set image deployment.apps/nginx nginx=nginx:1.19.0 --record=true
8         kubectl set image deployment.apps/nginx nginx=nginx:1.20.0 --record=true
9         kubectl set image deployment.apps/nginx nginx=nginx:latest --record=true

缩放 Deployment

直接设置

很简单,使用 kubectl scale 命令直接设置:

kubectl scale deployment.v1.apps/nginx --replicas=10

修改 yaml 的方式也行,一是修改 yaml文件,使用 kubectl apply -f 的方式更新,或者使用 kube edit 的方式。

Pod 水平自动缩放

K8S有个 Pod 水平自动扩缩(Horizontal Pod Autoscaler) 可以基于 CPU 利用率自动扩缩 ReplicationController、Deployment、ReplicaSet 和 StatefulSet 中的 Pod 数量。

除了 CPU 利用率,也可以基于其他应程序提供的自定义度量指标 来执行自动扩缩。 Pod 自动扩缩不适用于无法扩缩的对象,比如 DaemonSet。

参考资料:https://kubernetes.io/zh/docs/tasks/run-application/horizontal-pod-autoscale/

命令:

kubectl autoscale deployment nginx --min=10 --max=15 --cpu-percent=80

表示目标 CPU 使用率为 80%(期望指标),副本数量配置应该为 10 到 15 之间,CPU 是动态缩放 pod 的指标,会根据具体的 CPU 使用率计算副本数量,其计算公式如下。

期望副本数 = ceil[当前副本数 * (当前指标 / 期望指标)]

算法细节请查看:https://kubernetes.io/zh/docs/tasks/run-application/horizontal-pod-autoscale/#algorithm-details

比例缩放

另外还有个比例缩放,允许 Deployment 支持同时运行应用程序的多个版本。

当我们设置.spec.strategy.type==RollingUpdate时,采取 滚动更新的方式更新 Pods,就可以指定 maxUnavailable 和 maxSurge 来控制滚动更新 过程。这个我们之前提到过,就是 Deployment 默认会保证一直有 75% 的 pod处于可用状态,在完成更新前可能有多个版本的 pod 共存。

这里不细说,请参考:https://kubernetes.io/zh/docs/concepts/workloads/controllers/deployment/#max-unavailable

默认的话,deployment 的 yaml 是这样的:

strategy:
    rollingUpdate:
      maxSurge: 25%
      maxUnavailable: 25%
    type: RollingUpdate

我们可以改成:

strategy:
    rollingUpdate:
      maxSurge: 3
      maxUnavailable: 2
    type: RollingUpdate

注:执行 kubectl edit deployment nginx 直接改。

我们可以观察到这个过程:

root@instance-1:~# kubectl set image deployment nginx nginx=nginx:1.20.0
deployment.apps/nginx image updated
root@instance-1:~# kubectl get replicaset
NAME               DESIRED   CURRENT   READY   AGE
nginx-7b87485749   5         5         0       93m
nginx-85b45874d9   0         0         0       93m
nginx-bb957bbb5    8         8         8       35m

前面我们设置了最大存在两个不可用 pod(maxUnavailable=2),所以一开始会更新两个 pod,所以 nginx-bb957bbb5 8个处于可用状态。而 maxSurge 表示允许超出的期望 pod 数量,所以nginx-7b87485749 的数量不是 2 个,而是 5个,因为允许超出 3 个。其实意思就是不需要等旧的 pod 删除 一个,新的 pod 创建一个。可以多创建几个 pod,再按照慢一些的速度删除旧的 pod,最终完成版本更新。

最终:

NAME               DESIRED   CURRENT   READY   AGE
nginx-7b87485749   10        10        10      99m
nginx-85b45874d9   0         0         0       99m
nginx-bb957bbb5    0         0         0       41m

暂停 Deployment 上线

命令:

kubectl rollout pause deployment nginx

用途就是我们更新 Deployment 的 pod 版本时,可以暂停。

前面我们已经设置了这个 maxSurge 和 maxUnavailable,可以让 pod 的创建慢一些。

执行下面的命令可以快速卡住上线过程。

kubectl set image deployment nginx nginx=nginx:latest
kubectl rollout pause deployment nginx

之后,多次执行 kubectl get replicaset ,会发现副本数量不会变化。

NAME               DESIRED   CURRENT   READY   AGE
nginx-7b87485749   8         8         8       109m
nginx-85b45874d9   0         0         0       109m
nginx-bb957bbb5    5         5         5       52m

如果我们再次执行:

kubectl set image deployment nginx nginx=nginx:1.19.0

会发现虽然提示更新了,但是实际上没有变化。在暂停中,执行新的更新操作是无效的。

执行 kubectl rollout history deployment nginx 也查不到我们提交的 1.19.0 的请求。

暂停的时候,我们可以更新一些限制的 CPU 和 资源:

kubectl set resources deployment nginx -c=nginx --limits=cpu=200m,memory=512Mi

恢复 Deployment:

kubectl rollout resume deployment nginx

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Servers 相关文章推荐
Nginx+SpringBoot实现负载均衡的示例
Mar 31 Servers
Nginx使用X-Accel-Redirect实现静态文件下载的统计、鉴权、防盗链、限速等
Apr 04 Servers
Apache Hudi集成Spark SQL操作hide表
Mar 31 Servers
nginx.conf配置文件结构小结
Apr 08 Servers
Docker官方工具docker-registry案例演示
Apr 13 Servers
Windows Server 2008 修改远程登录端口以及配置防火墙
Apr 28 Servers
Windows Server 2019 域控制器安装图文教程
Apr 28 Servers
Vscode中SSH插件如何远程连接Linux
May 02 Servers
鲲鹏 CentOS 7 安装Python3.7
May 11 Servers
聊聊配置 Nginx 访问与错误日志的问题
May 25 Servers
Tomcat安装使用及部署Web项目的3种方法汇总
Aug 14 Servers
Fluentd搭建日志收集服务
Sep 23 Servers
了解Kubernetes中的Service和Endpoint
Kubernetes控制节点的部署
Apr 01 #Servers
Kubernetes部署实例并配置Deployment、网络映射、副本集
Apr 01 #Servers
iSCSI服务器CHAP双向认证配置
Apr 01 #Servers
详解使用内网穿透工具Ngrok代理本地服务
Mar 31 #Servers
Vertica集成Apache Hudi重磅使用指南
Nginx虚拟主机的配置步骤过程全解
Mar 31 #Servers
You might like
基于php验证码函数的使用示例
2013/05/03 PHP
PHP关于IE下的iframe跨域导致session丢失问题解决方法
2013/10/10 PHP
php上传文件问题汇总
2015/01/30 PHP
PHP测试框架PHPUnit组织测试操作示例
2018/05/28 PHP
jquery 多级下拉菜单核心代码
2010/05/21 Javascript
js判断是否为数组的函数: isArray()
2011/10/30 Javascript
JS图片预加载 JS实现图片预加载应用
2012/12/03 Javascript
jquery实现漂浮在网页右侧的qq在线客服插件示例
2013/05/13 Javascript
jquery实现带复选框的表格行选中删除时高亮显示
2013/08/01 Javascript
对frameset、frame、iframe的js操作示例代码
2013/08/16 Javascript
jQuery中:only-child选择器用法实例
2015/01/03 Javascript
jQuery中使用each处理json数据
2015/04/23 Javascript
JS实现随机乱撞彩色圆球特效的方法
2015/05/05 Javascript
非常棒的jQuery图片轮播效果
2016/04/17 Javascript
bootstrap中使用google prettify让代码高亮的方法
2016/10/21 Javascript
Javascript下拉刷新的简单实现
2017/02/14 Javascript
jQuery.form.js的使用详解
2017/06/14 jQuery
vue 组件基础知识总结
2021/01/26 Vue.js
Python实现FTP上传文件或文件夹实例(递归)
2017/01/16 Python
python 实现调用子文件下的模块方法
2018/12/07 Python
Django restframework 源码分析之认证详解
2019/02/22 Python
python登录WeChat 实现自动回复实例详解
2019/05/28 Python
Django处理Ajax发送的Get请求代码详解
2019/07/29 Python
PyQt+socket实现远程操作服务器的方法示例
2019/08/22 Python
在python中做正态性检验示例
2019/12/09 Python
python爬虫库scrapy简单使用实例详解
2020/02/10 Python
Qoo10马来西亚:全球时尚和引领潮流的购物市场
2016/08/25 全球购物
物流经理自我评价
2013/09/23 职场文书
女儿十岁生日答谢词
2014/01/27 职场文书
财务检查整改报告
2014/11/06 职场文书
2014年绿化工作总结
2014/12/09 职场文书
go语言中json数据的读取和写出操作
2021/04/28 Golang
详解vue中v-for的key唯一性
2021/05/15 Vue.js
SQL Server作业失败:无法确定所有者是否有服务器访问权限的解决方法
2021/06/30 SQL Server
mysq启动失败问题及场景分析
2021/07/15 MySQL
使用Python获取字典键对应值的方法
2022/04/26 Python