如果您在软件开发领域工作,您肯定听说过 Kubernetes。但它到底是什么,为什么它已成为管理容器化应用程序的事实标准?本指南将带您从基础知识到核心概念,并提供实际示例和图表以帮助您理解。
Kubernetes 之前:简要历史
要理解为什么 Kubernetes 如此具有革命性,让我们先回顾一下。
- 传统部署:最初,应用程序在物理服务器上运行。这种方法成本高昂,难以扩展,且容易出现资源冲突。
- 虚拟化部署:然后出现了虚拟机(VM)。VM 允许在同一硬件上运行多个隔离的应用程序,从而提高了资源利用率和安全性。然而,每个 VM 都运行一个完整的操作系统,消耗大量资源。
- 容器化部署:容器(如 Docker)是下一个演进。它们共享相同的主机操作系统,但运行隔离的进程。它们轻量、启动快且可移植。
容器解决了可移植性问题,但又带来了另一个问题:如何在生产环境中管理成百上千个容器?如何确保它们始终在运行,能够相互通信,并根据负载进行扩展?
Kubernetes 正是为此而生。
什么是 Kubernetes?
Kubernetes(通常缩写为 K8s)是一个用于容器编排的开源平台。简单来说,它自动化了容器化应用程序的部署、扩展和管理。由 Google 创建,现在由云原生计算基金会(CNCF)维护,Kubernetes 已成为任何大规模使用微服务的人的首选工具。
Kubernetes 集群的架构
Kubernetes 环境被称为集群。集群由一组称为节点的计算机组成,这些节点运行我们的应用程序。该架构分为两个主要部分:控制平面和工作节点。
控制平面
控制平面是集群的“大脑”。它做出全局决策(如调度),并检测和响应集群事件。其主要组件包括:
- API 服务器 (
kube-apiserver
):它是集群的网关。它暴露了 Kubernetes API,用户(通过kubectl
)、集群组件和外部工具都使用它进行通信。 - etcd:一个一致且高可用的键值数据库。它存储所有集群数据,代表了系统的期望状态和当前状态。
- 调度器 (
kube-scheduler
):将新创建的 Pod 分配给可用的工作节点,同时考虑资源需求、策略和其他约束。 - 控制器管理器 (
kube-controller-manager
):运行控制器,这些控制器是监视集群状态并努力使其达到期望状态的控制循环。例如,Node Controller
管理节点,而Replication Controller
确保运行正确数量的 Pod。
工作节点
工作节点是实际运行应用程序的机器(物理或虚拟)。每个节点都由控制平面管理,并包含以下组件:
- Kubelet:在每个节点上运行的代理。它确保 Pod 中描述的容器正在运行且健康。
- Kube-proxy:一个网络代理,用于管理节点上的网络规则。它允许从集群内部或外部的网络会话与 Pod 进行网络通信。
- 容器运行时:负责运行容器的软件。Docker 是最著名的,但 Kubernetes 也支持其他运行时,如
containerd
和CRI-O
。
基本的 Kubernetes 对象
在 Kubernetes 中,一切都由对象表示。这些对象是“意图记录”:一旦创建了一个对象,Kubernetes 就会不断努力确保它存在并与期望状态匹配。
以下是最重要的几个:
Pod
Pod 是 Kubernetes 中最小的执行单元。它代表一个或多个在同一节点上一起运行的容器,共享网络和存储等资源。
通常,每个 Pod 只运行一个容器,但在高级场景中(如用于日志记录或监控的“sidecar 容器”),可以有多个。
您几乎从不直接创建 Pod。您会使用更高级别的抽象,如 Deployment。
Deployment
Deployment 是您最常使用的对象。它描述了一组相同 Pod 的期望状态。Deployment 控制器负责:
- 创建和管理一个 ReplicaSet(另一个对象,确保始终运行特定数量的 Pod 副本)。
- 扩展 Pod 的数量(增加或减少)。
- 以受控方式管理应用程序更新(例如,滚动更新),而不会停机。
这是一个运行 3 个 NGINX 服务器副本的 Deployment 的 YAML 文件示例:
# nginx-deployment.yaml apiVersion: apps/v1 kind: Deployment metadata: name: nginx-deployment spec: replicas: 3 selector: matchLabels: app: nginx template: metadata: labels: app: nginx spec: containers: - name: nginx image: nginx:1.14.2 ports: - containerPort: 80
Service
Kubernetes 中的 Pod 是短暂的:它们可以随时被创建和销毁。每个 Pod 都有自己的 IP 地址,但这个 IP 地址并不稳定。那么,我们如何可靠地暴露我们的应用程序呢?
通过 Service。Service 是一个抽象,它定义了一组逻辑上的 Pod 和访问它们的策略。它为一组 Pod 提供了一个稳定的接入点(一个虚拟 IP 地址和一个 DNS 名称)。
Service 使用基于标签
的 selector
来查找应将流量转发到的 Pod。
以下是如何为我们的 NGINX Deployment 创建一个 Service:
# nginx-service.yaml apiVersion: v1 kind: Service metadata: name: nginx-service spec: selector: app: nginx ports: - protocol: TCP port: 80 targetPort: 80 type: ClusterIP # 默认 - 仅在集群内部暴露服务
有不同类型的 Service:
ClusterIP
:在集群内部 IP 上暴露服务(默认)。NodePort
:在每个工作节点的静态端口上暴露服务。LoadBalancer
:在云提供商(如 AWS、GCP)中创建一个外部负载均衡器,并为服务分配一个公共 IP。
Ingress
LoadBalancer
类型的 Service 很棒,但为每个服务都创建一个可能成本高昂。要向外部世界暴露多个 HTTP/HTTPS 服务,您可以使用 Ingress。
Ingress 充当外部流量的“智能路由器”。它允许您根据主机(例如 api.mysite.com
)或路径(例如 mysite.com/api
)定义路由规则。
以下是一个 Ingress 的示例:
# example-ingress.yaml apiVersion: networking.k8s.io/v1 kind: Ingress metadata: name: example-ingress spec: rules: - host: mysite.com http: paths: - path: /api pathType: Prefix backend: service: name: api-service port: number: 8080 - path: /ui pathType: Prefix backend: service: name: ui-service port: number: 3000
其他有用的对象
- Namespace:允许您在物理集群内创建“虚拟集群”。用于隔离环境(例如
development
、staging
、production
)或团队。 - ConfigMap 和 Secret:用于管理与容器镜像分离的配置数据和机密(如密码或 API 密钥)。
- StatefulSet:类似于 Deployment,但专门用于需要稳定网络标识和持久存储的有状态应用程序(如数据库)。
- PersistentVolume (PV) 和 PersistentVolumeClaim (PVC):用于管理集群中的持久存储。
结论
Kubernetes 是一个非常强大的工具,但其学习曲线可能很陡峭。本指南只是浅尝辄止,但我们希望它能让您对基本概念有一个扎实的理解。
接下来做什么?
- 在本地进行实验:安装 Minikube 或 Kind 在您的计算机上创建一个 Kubernetes 集群。
- 使用
kubectl
:熟悉kubectl
命令,这是您与集群交互的主要工具。尝试创建本文中的 NGINX Deployment 和 Service。 - 探索官方教程:Kubernetes 文档 是一个充满示例的绝佳资源。
容器编排是云原生世界中的一项基本技能,掌握 Kubernetes 将为您打开一个充满可能性的世界。玩得开心!