Kubernetes 调度器是如何工作的

运维 系统运维
了解 Kubernetes 调度器是如何发现新的吊舱并将其分配到节点。

[[383892]]

了解 Kubernetes 调度器是如何发现新的吊舱并将其分配到节点。

Kubernetes 已经成为容器和容器化工作负载的标准编排引擎。它提供一个跨公有云和私有云环境的通用和开源的抽象层。

对于那些已经熟悉 Kuberbetes 及其组件的人,他们的讨论通常围绕着如何尽量发挥 Kuberbetes 的功能。但当你刚刚开始学习 Kubernetes 时,尝试在生产环境中使用前,明智的做法是从一些关于 Kubernetes 相关组件(包括 Kubernetes 调度器) 开始学习,如下抽象视图中所示:

 

Kubernetes 也分为控制平面和工作节点:

  1. 控制平面: 也称为主控,负责对集群做出全局决策,以及检测和响应集群事件。控制平面组件包括:
  • etcd
  • kube-apiserver
  • kube-controller-manager
  • 调度器
  1. 工作节点: 也称节点,这些节点是工作负载所在的位置。它始终和主控联系,以获取工作负载运行所需的信息,并与集群外部进行通讯和连接。工作节点组件包括:
  • kubelet
  • kube-proxy
  • CRI

我希望这个背景信息可以帮助你理解 Kubernetes 组件是如何关联在一起的。

Kubernetes 调度器是如何工作的

Kubernetes 吊舱pod 由一个或多个容器组成组成,共享存储和网络资源。Kubernetes 调度器的任务是确保每个吊舱分配到一个节点上运行。

(LCTT 译注:容器技术领域大量使用了航海比喻,pod 一词,意为“豆荚”,在航海领域指“吊舱” —— 均指盛装多个物品的容器。常不翻译,考虑前后文,可译做“吊舱”。)

在更高层面下,Kubernetes 调度器的工作方式是这样的:

  1. 每个需要被调度的吊舱都需要加入到队列
  2. 新的吊舱被创建后,它们也会加入到队列
  3. 调度器持续地从队列中取出吊舱并对其进行调度

调度器源码scheduler.go)很大,约 9000 行,且相当复杂,但解决了重要问题:

等待/监视吊舱创建的代码

监视吊舱创建的代码始于 scheduler.go 的 8970 行,它持续等待新的吊舱:

  1. // Run begins watching and scheduling. It waits for cache to be synced, then starts a goroutine and returns immediately.
  2.  
  3. func (sched *Scheduler) Run() {
  4. if !sched.config.WaitForCacheSync() {
  5. return
  6. }
  7.  
  8. go wait.Until(sched.scheduleOne, 0, sched.config.StopEverything)

负责对吊舱进行排队的代码

负责对吊舱进行排队的功能是:

  1. // queue for pods that need scheduling
  2. podQueue *cache.FIFO

负责对吊舱进行排队的代码始于 scheduler.go 的 7360 行。当事件处理程序触发,表明新的吊舱显示可用时,这段代码将新的吊舱加入队列中:

  1. func (f *ConfigFactory) getNextPod() *v1.Pod {
  2. for {
  3. pod := cache.Pop(f.podQueue).(*v1.Pod)
  4. if f.ResponsibleForPod(pod) {
  5. glog.V(4).Infof("About to try and schedule pod %v", pod.Name)
  6. return pod
  7. }
  8. }
  9. }

处理错误代码

在吊舱调度中不可避免会遇到调度错误。以下代码是处理调度程序错误的方法。它监听 podInformer 然后抛出一个错误,提示此吊舱尚未调度并被终止:

  1. // scheduled pod cache
  2. podInformer.Informer().AddEventHandler(
  3. cache.FilteringResourceEventHandler{
  4. FilterFunc: func(obj interface{}) bool {
  5. switch t := obj.(type) {
  6. case *v1.Pod:
  7. return assignedNonTerminatedPod(t)
  8. default:
  9. runtime.HandleError(fmt.Errorf("unable to handle object in %T: %T", c, obj))
  10. return false
  11. }
  12. },

换句话说,Kubernetes 调度器负责如下:

  • 将新创建的吊舱调度至具有足够空间的节点上,以满足吊舱的资源需求。
  • 监听 kube-apiserver 和控制器是否创建新的吊舱,然后调度它至集群内一个可用的节点。
  • 监听未调度的吊舱,并使用 /binding 子资源 API 将吊舱绑定至节点。

例如,假设正在部署一个需要 1 GB 内存和双核 CPU 的应用。因此创建应用吊舱的节点上需有足够资源可用,然后调度器会持续运行监听是否有吊舱需要调度。

了解更多

要使 Kubernetes 集群工作,你需要使以上所有组件一起同步运行。调度器有一段复杂的的代码,但 Kubernetes 是一个很棒的软件,目前它仍是我们在讨论或采用云原生应用程序时的首选。

学习 Kubernetes 需要精力和时间,但是将其作为你的专业技能之一能为你的职业生涯带来优势和回报。有很多很好的学习资源可供使用,而且 官方文档 也很棒。如果你有兴趣了解更多,建议从以下内容开始:

 

责任编辑:庞桂玉 来源: Linux中国
相关推荐

2023-03-06 00:27:02

Kubernetesscheduler系统

2023-04-17 08:13:13

KubernetesPod

2021-11-25 14:44:51

Kubernetes复制控制器

2023-03-03 11:12:34

Kubernetes控制器后端

2024-03-01 19:11:18

KubernetesOOM内存

2020-10-12 08:32:34

浏览器进程线程

2010-07-26 15:01:32

Telnet服务器

2021-11-05 15:55:35

作业帮Kubernetes调度器

2021-05-10 17:20:55

AIOps开发人员人工智能

2011-08-08 13:45:58

jQuery

2019-12-02 13:46:35

浏览器前端开发

2021-08-03 14:29:30

ARPANET互联网协议TCP

2010-08-02 16:56:03

ICMP协议

2023-04-18 14:53:48

2023-04-18 15:09:50

2017-03-25 21:33:33

Linux调度器

2023-10-25 12:51:28

Go调度器

2019-03-05 10:48:24

Web浏览器前端

2016-06-15 10:35:59

云计算

2020-09-11 08:41:50

域名系统DNS网络
点赞
收藏

51CTO技术栈公众号