Kubernetes 控制器之 Job

李开开字数: 3750 阅读耗时: 9 分钟 2024/11/01 博客独享热度: 6 评论:

基本介绍

Job 控制器是 Kubernetes 中用于运行一次性任务的 API 对象，它负责启动指定数量的 Pod，通过跟踪记录达到 Completed 状态的 Pod 个数，并判断是否达到设定的阈值来确保这些 Pod 成功完既定任务。

Job 通常用于部署一次性任务或批处理任务。

工作原理

定义对象：用户定义一个 Job 对象，指定 Pod 模板和其他配置选项
调度 Pod：Kubernetes 根据 Job 的定义创建 Pod，Pod 被调度到节点后开始执行任务
监控 Pod：Job 控制器会监控这些 Pod 的状态，确保它们成功完成任务
完成任务：当所有 Pod 都成功完成任务后，Job 状态会被标记为 Completed
清理资源：完成的 Job 及对应的 Pod 会在一定时间后被系统自动清理

相关特性

并行执行：Job 可以指定并行运行的 Pod 数量，允许任务并行执行以提高效率
成功计数：Job 控制器会跟踪成功完成任务的 Pod 数量，直到达到用户指定的完成数量
失败重试：Job 可以配置重试策略，当 Pod 失败时可以重新启动新的 Pod 来尝试完成任务
自动清理：Job 完成后，相关的资源（如 Pod）会被自动清理，减少资源浪费
依赖管理：Job 可以设置依赖，确保任务按照特定的顺序执行
生命周期：Job 提供了一种机制来管理任务的生命周期，包括任务的启动、监控、完成和清理
弹性伸缩：可以根据任务的需求动态调整并行执行的 Pod 数量
监控和日志：可以对 Job 的执行情况进行监控，并收集相关的日志信息，方便问题排查和性能分析

资源清单（示例）


# job.yaml
apiVersion: batch/v1
kind: Job
metadata:
  name: demo-job
spec:
  backoffLimit: 3
  completions: 1
  parallelism: 1
  ttlSecondsAfterFinished: 20
  template:
    metadata:
      labels:
        app: demo-job
    spec:
      restartPolicy: Never
      containers:
      - name: demo-container
        image: busybox
        command:
        - sh
        - -c
        - for i in 1 2 3 4 5 6;do echo $i;done
 
🔔 默认情况下，Job 任务运行失败或异常结束时，Pod 状态会变为Error，同时创建新的 Pod 继续运行任务
🔔 backoffLimit：指定任务运行失败时，尝试重新运行任务的次数，默认为 6 次，0 表示不尝试重新运行
🔔 completions：指定任务需要完成的次数
🔔 parallelism：指定并行运行的任务个数
🔔 ttlSecondsAfterFinished：任务完成后，自动清理 Pod 的时间（单位s）

上述 job.yaml 文件定义了一个名为 demo-job 的 Job 对象，每个 Pod 包含一个名为 demo-container 的容器，该容器使用 busybox 镜像，启动后执行一次性任务（打印数字 1 ～ 6）。

说明：可以通过以下命令查看 Job 资源清单支持定义的内容

kubectl explain job --recursive

常用操作

1、创建 Job

kubectl create -f job.yaml
或
kubectl apply -f job.yaml

2、查看 Job

# 查看实例列表
kubetcl get job

# 查看详细信息
kubectl describe job demo-job

3、删除 Job

# 方式一：命令行
kubectl delete job demo-job

# 方式二：资源清单
kubectl delete -f job.yaml