思考并回答以下问题:
- “声明式”与“命令式”完全相反,不关心具体的过程,更注重结果。我们不需要“教”计算机该怎么做,只要告诉它一个目标状态,它自己就会想办法去完成任务,相比起来自动化、智能化程度更高。YAML是什么式?
声明式与命令式是怎么回事
Kubernetes使用的YAML语言有一个非常关键的特性,叫“声明式”(Declarative),对应的有另外一个词:“命令式”(Imperative)。
所以在详细了解YAML之前,我们得先来看看“声明式”与“命令式”这两种工作方式。
我们在入门篇里学习的Docker命令和Dockerfile就属于“命令式”,大多数编程语言也属于命令式,它的特点是交互性强,注重顺序和过程,你必须“告诉”计算机每步该做什么,所有的步骤都列清楚,这样程序才能够一步步走下去,最后完成任务,显得计算机有点“笨”。
“声明式”,在Kubernetes出现之前比较少见,它与“命令式”完全相反,不关心具体的过程,更注重结果。我们不需要“教”计算机该怎么做,只要告诉它一个目标状态,它自己就会想办法去完成任务,相比起来自动化、智能化程度更高。
假设你要打车去高铁站,但司机不熟悉路况,你就只好不厌其烦地告诉他该走哪条路、在哪个路口转向、在哪里进出主路、停哪个站口。虽然最后到达了目的地,但这一路上也费了很多口舌,发出了无数的“命令”。很显然,这段路程就属于“命令式”。
现在我们来换一种方式,同样是去高铁站,但司机经验丰富,他知道哪里有拥堵、哪条路的红绿灯多、哪段路有临时管控、哪里可以抄小道,此时你再多嘴无疑会干扰他的正常驾驶,所以,你只要给他一个“声明”:我要去高铁站,接下来就可以舒舒服服地躺在后座上休息,顺利到达目的地了。
在这个“打车”的例子里,Kubernetes就是这样的一位熟练的司机,Master/Node架构让它对整个集群的状态了如指掌,内部的众多组件和插件也能够自动监控管理应用。
这个时候我们再用“命令式”跟它打交道就不太合适了,因为它知道的信息比我们更多更全面,不需要我们这个外行去指导它这个内行,所以我们最好是做一个“甩手掌柜”,用“声明式”把任务的目标告诉它,比如使用哪个镜像、什么时候运行,让它自己去处理执行过程中的细节。
那么,该用什么方式去给Kubernetes发出一个“声明”呢?
容器技术里的Shell脚本和Dockerfile可以很好地描述“命令式”,但对于“声明式”就不太合适了,这个时候,我们需要使用专门的YAML语言。
什么是YAML
YAML是JSON的超集,支持整数、浮点数、布尔、字符串、数组和对象等数据类型。也就是说,任何合法的JSON文档也都是YAML文档,如果你了解JSON,那么学习YAML会容易很多。
但和JSON比起来,YAML的语法更简单,形式也更清晰紧凑,比如:
- 使用空白与缩进表示层次(有点类似Python),可以不使用花括号和方括号。
- 可以使用
#
书写注释,比起JSON是很大的改进。 - 对象(字典)的格式与JSON基本相同,但Key不需要使用双引号。
- 数组(列表)是使用
-
开头的清单形式(有点类似MarkDown)。 - 表示对象的
:
和表示数组的-
后面都必须要有空格。 - 可以使用
---
在一个文件里分隔多个YAML对象。
下面我们来看几个YAML的简单示例。
首先是数组,它使用-
列出了三种操作系统:1
2
3
4
5# YAML数组(列表)
OS:
- linux
- macOS
- Windows
这段YAML对应的JSON如下:1
2
3{
"OS": ["linux", "macOS", "Windows"]
}
对比可以看到YAML形式上很简单,没有闭合花括号、方括号的麻烦,每个元素后面也不需要逗号。
再来看一个YAML对象,声明了1个Master节点,3个Worker节点:1
2
3
4# YAML对象(字典)
Kubernetes:
master: 1
worker: 3
它等价的JSON如下:1
2
3
4
5
6{
"Kubernetes": {
"master": 1,
"worker": 3
}
}
YAML里的Key都不需要使用双引号,看起来更舒服。
把YAML的数组、对象组合起来,我们就可以描述出任意的Kubernetes资源对象:1
2
3
4
5
6
7
8
9# 复杂的例子,组合数组和对象
Kubernetes:
master:
- apiserver: running
- etcd: running
node:
- kubelet: running
- kube-proxy: down
- container-runtime: [docker, containerd, cri-o]
什么是API对象
学到这里还不够,因为YAML语言只相当于“语法”,要与Kubernetes对话,我们还必须有足够的“词汇”来表示“语义”。
那么应该声明Kubernetes里的哪些东西,才能够让Kubernetes明白我们的意思呢?
作为一个集群操作系统,Kubernetes归纳总结了Google多年的经验,在理论层面抽象出了很多个概念,用来描述系统的管理运维工作,这些概念就叫做“API对象”。说到这个名字,你也许会联想到上次课里讲到的Kubernetes组件apiserver。没错,它正是来源于此。
因为apiserver是Kubernetes系统的唯一入口,外部用户和内部组件都必须和它通信,而它采用了HTTP协议的URL资源理念,API风格也用RESTful的GET/POST/DELETE等等,所以,这些概念很自然地就被称为是“API对象”了。
那都有哪些API对象呢?
你可以使用kubectl api-resources
来查看当前Kubernetes版本支持的所有对象:1
kubectl api-resources
在输出的“NAME”一栏,就是对象的名字,比如ConfigMap、Pod、Service等等,第二栏“SHORTNAMES”则是这种资源的简写,在我们使用kubectl命令的时候很有用,可以少敲几次键盘,比如Pod可以简写成po,Service可以简写成svc。
在使用kubectl命令的时候,你还可以加上一个参数--v=9
,它会显示出详细的命令执行过程,清楚地看到发出的HTTP请求,比如:1
kubectl get pod --v=9
从截图里可以看到,kubectl客户端等价于调用了curl,向8443端口发送了HTTP GET请求,URL是/api/v1/namespaces/default/pods
。
目前的Kubernetes 1.23版本有50多种API对象,全面地描述了集群的节点、应用、配置、服务、账号等等信息,apiserver会把它们都存储在数据库etcd里,然后kubelet、scheduler、controller-manager等组件通过apiserver来操作它们,就在API对象这个抽象层次实现了对整个集群的管理。
如何描述API对象
现在我们就来看看如何以YAML语言,使用“声明式”在Kubernetes里描述并创建API对象。
之前我们运行Nginx的命令你还记得吗?使用的是kubectl run
,和Docker一样是“命令式”的:1
kubectl run ngx --image=nginx:alpine
我们来把它改写成“声明式”的YAML,说清楚我们想要的Nginx应用是个什么样子,也就是“目标状态”,让Kubernetes自己去决定如何拉取镜像运行:1
2
3
4
5
6
7
8
9
10
11
12
13
14apiVersion: v1
kind: Pod
metadata:
name: ngx-pod
labels:
env: demo
owner: chrono
spec:
containers:
- image: nginx:alpine
name: ngx
ports:
- containerPort: 80
有了刚才YAML语言知识“打底”,相信你基本上能够把它看明白,知道它是一个Pod,要使用nginx:alpine镜像创建一个容器,开放端口80,而其他的部分,就是Kubernetes对API对象强制的格式要求了。
因为API对象采用标准的HTTP协议,为了方便理解,我们可以借鉴一下HTTP的报文格式,把API对象的描述分成“header”和“body”两部分。
“header”包含的是API对象的基本信息,有三个字段:apiVersion、kind、metadata。
- apiVersion表示操作这种资源的API版本号,由于Kubernetes的迭代速度很快,不同的版本创建的对象会有差异,为了区分这些版本就需要使用apiVersion这个字段,比如v1、v1alpha1、v1beta1等等。
- kind表示资源对象的类型,这个应该很好理解,比如Pod、Node、Job、Service等等。
- metadata这个字段顾名思义,表示的是资源的一些“元信息”,也就是用来标记对象,方便Kubernetes管理的一些信息。比如在这个YAML示例里就有两个“元信息”,一个是name,给Pod起了个名字叫ngx-pod,另一个是labels,给Pod“贴”上了一些便于查找的标签,分别是env和owner。
1
2
3
4
5
6
7apiVersion: v1
kind: Pod
metadata:
name: ngx-pod
labels:
env: demo
owner: chrono
apiVersion、kind、metadata都被kubectl用于生成HTTP请求发给apiserver,你可以用--v=9
参数在请求的URL里看到它们,比如:1
https://192.168.49.2:8443/api/v1/namespaces/default/pods/ngx-pod
和HTTP协议一样,“header”里的apiVersion、kind、metadata这三个字段是任何对象都必须有的,而“body”部分则会与对象特定相关,每种对象会有不同的规格定义,在YAML里就表现为spec字段(即specification),表示我们对对象的“期望状态”(desired status)。
还是来看这个Pod,它的spec里就是一个containers数组,里面的每个元素又是一个对象,指定了名字、镜像、端口等信息:1
2
3
4
5
6spec:
containers:
- image: nginx:alpine
name: ngx
ports:
- containerPort: 80
现在把这些字段综合起来,我们就能够看出,这份YAML文档完整地描述了一个类型是Pod的API对象,要求使用v1版本的API接口去管理,其他更具体的名称、标签、状态等细节都记录在了metadata和spec等字段里。
使用kubectl apply
、kubectl delete
,再加上参数-f
,你就可以使用这个YAML文件,创建或者删除对象了:1
2kubectl apply -f ngx-pod.yml
kubectl delete -f ngx-pod.yml
Kubernetes收到这份“声明式”的数据,再根据HTTP请求里的POST/DELETE等方法,就会自动操作这个资源对象,至于对象在哪个节点上、怎么创建、怎么删除完全不用我们操心。
如何编写YAML
这么多API对象,我们怎么知道该用什么apiVersion、什么kind?metadata、spec里又该写哪些字段呢?还有,YAML看起来简单,写起来却比较麻烦,缩进对齐很容易搞错,有没有什么简单的方法呢?
这些问题最权威的答案无疑是Kubernetes的官方参考文档,API对象的所有字段都可以在里面找到。不过官方文档内容太多太细,查阅起来有些费劲,所以下面我就介绍几个简单实用的小技巧。
第一个技巧其实前面已经说过了,就是kubectl api-resources
命令,它会显示出资源对象相应的API版本和类型,比如Pod的版本是“v1”,Ingress的版本是“networking.k8s.io/v1”,照着它写绝对不会错。
第二个技巧,是命令kubectl explain
,它相当于是Kubernetes自带的API文档,会给出对象字段的详细说明,这样我们就不必去网上查找了。比如想要看Pod里的字段该怎么写,就可以这样:1
2
3
4kubectl explain pod
kubectl explain pod.metadata
kubectl explain pod.spec
kubectl explain pod.spec.containers
使用前两个技巧编写YAML就基本上没有难度了。
不过我们还可以让kubectl为我们“代劳”,生成一份“文档样板”,免去我们打字和对齐格式的工作。这第三个技巧就是kubectl的两个特殊参数--dry-run=client
和-o yaml
,前者是空运行,后者是生成YAML格式,结合起来使用就会让kubectl不会有实际的创建动作,而只生成YAML文件。
例如,想要生成一个Pod的YAML样板示例,可以在kubectl run
后面加上这两个参数:1
kubectl run ngx --image=nginx:alpine --dry-run=client -o yaml
就会生成一个绝对正确的YAML文件:1
2
3
4
5
6
7
8
9
10
11
12
13
14
15apiVersion: v1
kind: Pod
metadata:
creationTimestamp: null
labels:
run: ngx
name: ngx
spec:
containers:
- image: nginx:alpine
name: ngx
resources: {}
dnsPolicy: ClusterFirst
restartPolicy: Always
status: {}
接下来你要做的,就是查阅对象的说明文档,添加或者删除字段来定制这个YAML了。
这个小技巧还可以再进化一下,把这段参数定义成Shell变量(名字任意,比如$do/$go,这里用的是$out),用起来会更省事,比如:1
2export out="--dry-run=client -o yaml"
kubectl run ngx --image=nginx:alpine $out
今后除了一些特殊情况,我们都不会再使用kubectl run
这样的命令去直接创建Pod,而是会编写YAML,用“声明式”来描述对象,再用kubectl apply
去发布YAML来创建对象。
小结
好了,今天就到这里,我们一起学习了“声明式”和“命令式”的区别、YAML语言的语法、如何用YAML来描述API对象,还有一些编写YAML文件的技巧。
Kubernetes采用YAML作为工作语言是它有别与其他系统的一大特色,声明式的语言能够更准确更清晰地描述系统状态,避免引入繁琐的操作步骤扰乱系统,与Kubernetes高度自动化的内部结构相得益彰,而且纯文本形式的YAML也很容易版本化,适合CI/CD。
1,YAML是JSON的超集,支持数组和对象,能够描述复杂的状态,可读性也很好。
2,Kubernetes把集群里的一切资源都定义为API对象,通过RESTful接口来管理。描述API对象需要使用YAML语言,必须的字段是apiVersion、kind、metadata。
3,命令kubectl api-resources
可以查看对象的apiVersion和kind,命令kubectl explain
可以查看对象字段的说明文档。
4,命令kubectl apply
、kubectl delete
发送HTTP请求,管理API对象。
4,使用参数--dry-run=client -o yaml
可以生成对象的YAML模板,简化编写工作。
课下作业
1,你是如何理解“命令式”和“声明式”的?为什么说空调是“声明式”的?
2,使用--v=9
参数,试着解释一下YAML是如何被kubectl转换成HTTP请求的。