流水线

  • 配置即代码,通过 描述流水线定义,基于 Stage (阶段) 语法简化编排复杂度
  • 可视化编辑,通过图形界面交互快速配置流水线
  • 支持任务串行或并行执行策略
  • ,同时提供强大的定时补偿功能
  • 动态配置,通过动态配置满足实现同一流水线满足不同场景需求,配置类型包含:文件,配置内容均支持加密存储,确保数据安全性。
  • 多维度重试机制和中止处理。支持从失败节点开始重试;支持全流程重试;运行中可以取消中止。
  • 超时配置 (任务级别)
  • 归档策略可配置 (流水线级别)
  • 任务分为短任务和长任务,任务之间可传递上下文(可传递内容包含:值和文件)
  • 扩展市场,平台预置丰富的 Action 满足大部分场景的同时,能够帮助用户沉淀自己的 Action
  • 内置丰富的制品仓库,满足主流框架的编译构建需要,主要包含: Docker 镜像、Maven JARs、NPM Packages 等
  • 对外开放 OpenAPI 接口,方便第三方系统快速接入使用
  • Event 事件订阅,提供流水线级别和任务级别事件消息订阅

如何编写 pipeline.yml 文件

Action

Action 是流水线的最小执行单元,表示一个 任务动作

一条流水线包含若干个 Action。

Stage

Stage 表示一个 阶段

一条流水线由若干个 Stage 构成,多个 Stage 之间串行顺序执行; 一个 Stage 由若干个 Action 构成,多个 Action 之间并行执行。

格式规范

pipeline.yml 是一个 格式的文件,描述了任务编排的全流程。

pipeline.yml 的字段详细说明如下:

version

version 表示 pipeline.yml 的版本号。目前最新版本为 1.1。

只需要配置为:version: 1.1 即可。

envs

envs 表示全局环境变量,会注入到所有 Action 中。

envs 的典型场景为:

  • 用于多个 自定义脚本 (custom-script) Action 共享环境变量

envs 格式为 map[string]string,比如:

cron

定时配置。配置该字段后,在流水线界面可以操作 定时按钮 来启用和禁用 定时功能。

目前支持两种格式:

分钟级 (Linux Crontab)

* * * * *

示例:

  • 0 3 * * * 每天凌晨 3 点执行
  • */2 * * * * 每 2 分钟执行一次

秒级 (Spring Schedule)

* * * * * *

示例:

  • 15 * * * * * 在每分钟的第 15 秒执行
  • 0 0 3 * * * 每天凌晨 3 点执行

enable

未执行补偿策略开关,系统会根据下面的策略调度执行

  • false (默认) 代表补偿是关闭的
  • true 代表补偿开启

::: tip

补偿的2种类型

  • 中断补偿 平台原因导致短暂中断,在中断时间内的定时任务无法触发,流水线记录没创建, 中断补偿无法关闭
  • 未执行补偿 流水线记录已经创建,但未开始执行,这时候就需要补偿策略去调度这些记录了 :::

latest_first

当有多个未执行的记录的时候,从最新的记录往老记录依次执行,或者从老的记录往新的记录依次执行

  • false (默认) 代表从老记录往新记录依次执行
  • true 代表从新记录往老记录依次执行

stop_if_latter_executed

依赖 latest_first = true, 2个策略结合就是只调度最新的记录

  • false (默认) 跟随 latest_first 进行策略
  • true 在 latest_first 策略之上就只跑一次最新的记录
策略调度说明

如图,策略目前只关心几个点

  1. 是否是定时的记录(非定时任务不会被策略调度)
  2. 状态是,分析完成,成功,进行中

pipeline.yml 参考 - 图2

调度策略过程, 途中画的 1,2,3,4 其实就是执行记录中的版本

支持策略配置如下
  • 执行补偿,只跑最新的记录
  1. cron_compensator:
  2. enable: true
  3. latest_first: true
  4. stop_if_latter_executed: true
  • 执行补偿,从老记录往新的记录依次执行
  1. cron_compensator:
  2. enable: true
  3. latest_first: false
  4. # ----- 上面和下面配置相同
  5. cron_compensator:
  6. enable: true
  • 执行补偿,从新记录往老记录依次执行
  1. cron_compensator:
  2. enable: true
  3. latest_first: true

stages

stages 是 pipeline.yml 的核心字段,定义了具体的一组 stage 集合,它们组成了整个流水线的执行过程。

依赖关系为:

  • stages 由 stage 列表组成
  • stage 由 Action 列表组成

::: details YAML 示例

  1. # stage 和 stage 之间是串行的,即前面一个 stage 执行完毕才会开始执行下一个 stage.
  2. # 该例子中一共有 2 个 stage.
  3. stages:
  4. # 在一个 stage 中,多个 Actions 是并行的,不会有依赖关系;
  5. # 该例子中,该 stage 包含 2 个并行 Action.
  6. - stage:
  7. # Action1-1 是 Action 的类型,不能任意填写,需要能在扩展市场中找到该类型.
  8. - Action1-1:
  9. params:
  10. ...
  11. # Action1-2 是 Action 的类型,不能任意填写,需要能在扩展市场中找到该类型.
  12. - Action1-2:
  13. params:
  14. ...
  15. # 这里定义了第二个 stage,它在第一个 stage 执行结束后才会开始执行.
  16. # 该 stage 只有一个 Action.
  17. - stage:
  18. # Action2-1 是 Action 的类型,不能任意填写,需要能在扩展市场中找到该类型.
  19. - Action2-1:
  20. params:
  21. ...

:::

Action 配置项

Action 配置项是用来描述一个具体的 Action。

alias

alias 是 Action 的别名,Action 之间可以通过 alias 来进行引用,为非必填项,

未设置的时候,系统默认把 alias 设置为 Aciton 类型,

也正是因为默认值的原因,当一个类型的 Action 多次出现的时候,若不设置 alias,会导致无法正确引用 Action。

params

Action 的参数,主要用来定义 Action 的行为。

每个 Action 的参数都不一样,具体 Action 的参数信息请参考 扩展市场 里具体内容。

version

Action 的版本。

一般来说,用户不需要填写。默认会使用扩展市场里该 Action 的最新可用版本。

当用户需要使用特定版本的 Action 的时候,才需要填写该字段。

image

::: tip

:::

custom-script Action 运行时的镜像。

默认使用的镜像可以在 里看到。

commands

::: tip

该字段仅在 Action 类型为 custom-script 时有效。

:::

用户声明的命令列表。

::: details YAML 示例

  1. commands:
  2. - echo "hello Action!"
  3. - cat /etc/hosts
  4. - sleep 10

:::

timeout

Action 执行的超时时间。超过该时间,平台会强制停止 Action 的执行。

timeout 单位为秒, 系统默认的 timeout 为 3600(1小时)

::: details YAML 示例

  1. version: "1.1"
  2. stages:
  3. - stage:
  4. - custom-script:
  5. alias: 自定义shell脚本
  6. version: "1.0"
  7. commands:
  8. - sleep 60s
  9. timeout: 50

:::

resources

Action 运行资源。

可配置项包括:

  • cpu
  • mem (单位为 MB)

::: details YAML 示例

  1. - git-checkout:
  2. params:
  3. ...
  4. resources:
  5. cpu: 0.5
  6. mem: 2048

:::

loop

Action 的循环执行策略。

可配置项包括:

  • break: 退出条件
  • strategy: 循环策略
    • max_times: 最大重试次数,-1 表示不限制
    • decline_ratio: 循环衰退速率
    • decline_limit_sec: 循环间隔最大值(秒)
    • interval_sec: 循环起始间隔(秒)

用公式表示循环策略:

  1. loop_interval = min(interval_sec * (decline_ratio)^N, decline_limit_sec)
  2. 其中 N 为循环次数,从 0 开始计数。

例子

循环 10000 次,每次循环间隔 10 秒

  1. break: 'false' == 'true'
  2. strategy:
  3. max_times: 10000
  4. interval_sec: 10

当前任务如果执行失败重试

某个任务或当前任务的出参 xxx 不为 401 时候重试

  1. loop:
  2. break: '${{ outputs.任务的alias.xxx }}' == '401'
  3. strategy:
  4. max_times: 10000

多条件组合判断

  1. loop:
  2. break: '1' == '2' && '1' == '3' || '1' == '3' || '${{ outputs.任务的alias.xxx }}' == '401'
  3. strategy:
  4. max_times: 10000

caches

caches 缓存

if

Action 条件执行

  1. - stage:
  2. - custom-script:
  3. alias: script1
  4. version: "1.0"
  5. commands:
  6. - echo 1
  7. - echo "image=123" >> $METAFILE # 输出出参给下个任务使用
  8. if: ${{ 1==1 }}
  9. - stage:
  10. - custom-script:
  11. alias: script2
  12. version: "1.0"
  13. commands:
  14. - echo 1
  15. if: ${{ ${{ outputs.script1.image }}==123 && ${{ outputs.script1.image }}==123 }}

使用${{ xxx }},中间 xxx 输入数学表达式(注意xxx前后有空格),可以使用前置任务出参作为执行条件

目前 pipeline 执行的时候假如没有加入条件执行,那么当一个任务失败,下面的任务就会自动失败,而当下面的任务加上了条件执行,条件成立的话还是会继续执行

内置表达式
  • task_status: 可选值 Success / Failed (注意大小写)
配置失败重试
  1. loop:
  2. break: task_status == 'Success' #
  3. strategy:
  4. max_times: 5 # 最多循环5次
  5. decline_limit_sec: 60 # 衰退最大值,60s
  6. interval_sec: 5 # 起始间隔,5秒
  7. decline_ratio: 2 # 衰退比例为 2,即 5 -> 10(5*2) -> 20(10*2) -> 40(20*2) -> 60(40*2>60)

该配置同样适用于在 extension 的 spec.yml 中顶层配置。

上下文引用

在一条流水线中,Action 独立运行的场景很少,大多数 Action 需要拿上一个 Action 的输出作为输入。

例如:

用于编译和制作镜像的 buildpack Action 需要代码作为输入,而代码一般由 git-checkout Action 拉取。

因此在 buildpack Action 中可以使用类似 ${git-chekcout} 的语法来引用指定 git-checkout Action 命名空间里的代码仓库。

::: details YAML 示例

  1. ...
  2. stages:
  3. - stage:
  4. - git-checkout: # 代码仓库1
  5. alias: repo1
  6. params:
  7. uri: xxx
  8. - git-checkout: # 代码仓库2
  9. alias: repo2
  10. params:
  11. uri: yyy
  12. - stage:
  13. - buildpack:
  14. params:
  15. - ${repo1} # 引用代码仓库1的代码
  16. - ${repo2} # 引用代码仓库2的代码

:::

CI/CD 的一个例子

::: details YAML 示例

  1. version: 1.1
  2. # 定时配置
  3. cron: 0 */10 * * * ?
  4. # 环境变量, map[string]string 格式
  5. envs:
  6. PLATFORM: pipeline
  7. ENV: production
  8. # 关键字,表示流水线流程定义
  9. # stage 表示 阶段,多个 stage 串行成为 stages
  10. stages:
  11. # 关键字,表示流水线的一个阶段
  12. # 一个 stage 内包含多个 并行 的 Action
  13. - stage: # 该 stage 只有一个 Action
  14. - git-checkout: # Action 类型
  15. params: # Action 参数,key/value pairs,key 为 string,value 为简单类型或任意可 JSON 序列化的结构体
  16. depth: 1
  17. - stage: # 该 stage 拥有三个并行执行的 Action
  18. - buildpack: # Action 类型
  19. # 同一个类型的 Action 可以被声明多次,但是每个 Action 需要能被唯一标识,
  20. # 因此需要用 别名 来标识
  21. alias: backend
  22. params:
  23. context: ${git-checkout}/services/showcase # 使用 ${xxx} 语法来引用其他 Action 的目录地址
  24. modules: # value 支持复杂结构
  25. - name: blog-web
  26. - name: blog-service
  27. path: blog-service/blog-service-impl
  28. - name: user-service
  29. path: user-service/user-service-impl
  30. resources: # 预计该 Action 运行时需要分配的资源
  31. cpu: 0.5 # 0.5 核
  32. mem: 2048 # 2G 内存
  33. - buildpack:
  34. # 上面已经声明了一个 buildpack 类型的 Action,为了唯一标识,需要 alias 区分
  35. alias: frontend
  36. params:
  37. context: ${git-checkout}/endpoints/showcase-front
  38. modules:
  39. - name: showcase-front
  40. - custom-script: # custom-script 为自定义脚本类型
  41. image: centos:7 # 声明运行时镜像
  42. commands: # 声明 Commands
  43. - sleep 5
  44. - echo hello world
  45. - cat ${git-checkout}/dice.yml # 这里通过 ${git} 语法来 cat git Action 目录下的 dice.yml 文件
  46. - stage: # 该 stage 只有一个 Action
  47. - release:
  48. # 指定 Action 版本,Action 可以拥有多个历史版本
  49. # 若不指定,则使用平台当前的稳定版
  50. version: 1.0
  51. params:
  52. dice_yml: ${git-checkout}/dice.yml # dice.yml 文件路径
  53. replacement_images: # 通过 ${backend}/${frontend} 引用打包结果
  54. - ${backend}/pack-result
  55. - ${frontend}/pack-result
  56. - stage: # 该 stage 只有一个 Action
  57. - dice:
  58. params:
  59. release_id_path: ${release}

:::

定时流水线是指按照预先配置的执行计划,定时触发并执行的流水线。

定时流水线 = 流水线 + 定时配置。因此,只需在原来流水线定义上增加定时配置,即可将流水线升级为定时流水线。

定时配置 (Cron) 支持以下格式:

  • 分钟级 (Linux Crontab)
  • 秒级 (Spring Schedule)

由于 cron 语法无法描述从某个时间点开始的周期任务,因此在 REST API POST /api/pipelines 的请求参数中增加了 cronStartFrom 参数,用于指定周期任务的开始时间点。

定时流水线的补偿

具体策略配置见规范 。

::: tip 常见原因

需要补偿的原因很多,比如:

  • 定时间隔不合理,导致新的流水线定时触发时,仍有正在运行中的流水线实例(未执行补偿)
  • 平台升级导致的短暂中断,定时触发时间恰好在中断时间内,导致流水线实例未能按时执行(中断补偿)

:::

代码更新触发流水线

当配置对应规则的分支代码被更新时,会自动创建当前分支的流水线并执行

配置参数作为顶级pipeline参数

::: details YAML 示例

  1. version: "1.1"
  2. on:
  3. push:
  4. branches:
  5. - develop
  6. - feature/*
  7. stages:
  8. ...

:::

流水线拥有独立的配置管理体系。

流水线配置从类型上分为 文件 两类。

两种类型均支持 明文存储加密存储,保证数据安全。

动态配置使得 pipeline.yml 模板化成为现实,同一份流程定义文件,通过不同配置可以实现截然不同的行为。

同时,加密配置 使得用户在 pipeline.yml 中无需存储明文,更加安全。

DevOps 平台中流水线配置入口位于:

某个参数的值需要动态设置

示例:buildpack-Action 里打包需要感知环境,不同的环境使用不同的 profile 进行构建。

::: details YAML 示例

  1. ...
  2. stages:
  3. - stage:
  4. - buildpack:
  5. params:
  6. bp_args:
  7. MAVEN_EXTRA_ARGS: ((maven.profile)) # maven 编译时可以动态设置 profile
  8. ...

可以在 默认设置 里设置默认值,并且针对不同分支设置不同的值。

例如配置:

  1. default:
  2. maven.profile = dev
  3. maven.profile = prod

:::

某个参数的值不应该明文写在文件中

例如:git-checkout Action 拉取一个需要鉴权的 git repo 时,需要用到 username 和 password。

::: details YAML 示例

pipeline.yml 参考 - 图4

:::

流水线内置环境变量

流水线中在运行中含有以下环境变量

流水线环境变量 pipeline 相关的环境变量

  1. PIPELINE_CRON_EXPR
  2. PIPELINE_TYPE
  3. PIPELINE_TIME_BEGIN_TIMESTAMP
  4. PIPELINE_TRIGGER_MODE
  5. PIPELINE_STORAGE_URL
  6. PIPELINE_TASK_LOG_ID
  7. PIPELINE_TASK_NAME
  8. PIPELINE_ID
  9. PIPELINE_LIMITED_DISK
  10. PIPELINE_CRON_TRIGGER_TIME
  11. PIPELINE_DEBUG_MODE
  12. PIPELINE_LIMITED_MEM
  13. PIPELINE_TASK_ID
  14. PIPELINE_LIMITED_CPU

dice 相关的环境变量

  1. DICE_VERSION
  2. DICE_INTERNAL_CLIENT
  3. DICE_MEM_REQUEST
  4. DICE_PROJECT_APPLICATION
  5. DICE_OPENAPI_ADDR
  6. DICE_ORG_NAME
  7. DICE_ENV=DEV
  8. DICE_APPLICATION_ID
  9. DICE_CPU_ORIGIN
  10. DICE_INSIDE
  11. DICE_OPENAPI_PUBLIC_URL
  12. DICE_CPU_REQUEST
  13. DICE_NAMESPACE
  14. DICE_IS_EDGE
  15. DICE_PROJECT_ID
  16. DICE_STORAGE_MOUNTPOINT
  17. DICE_OPERATOR_ID
  18. DICE_PROTOCOL
  19. DICE_PROJECT_NAME
  20. DICE_MEM_ORIGIN
  21. DICE_ROOT_DOMAIN
  22. DICE_APPLICATION_NAME
  23. DICE_WORKSPACE
  24. DICE_CPU_LIMIT
  25. DICE_ORG_ID
  26. DICE_HTTPS_PORT
  27. DICE_CLUSTER_TYPE
  28. DICE_SIZE
  29. DICE_CLUSTER_NAME
  30. DICE_HTTP_PORT
  31. DICE_USER_ID
  32. DICE_MEM_LIMIT

gittar 相关的环境变量

  1. GITTAR_AUTHOR
  2. GITTAR_BRANCH
  3. GITTAR_COMMIT
  4. GITTAR_MESSAGE
  5. GITTAR_REPO

流水线表达式语法

随机表达式占位符,用户填入对应的随机表达式,流水线运行的时候会随机的生成数据来替换 ${{ random.integer }} 占位符

随机参数支持的类型如下:

integer: 整型,如: 100 string: 所有字符串,如: Abc float: 浮点型,如: 13.14 boolean: 布尔型,如: true/false upper: 大写字母,如: ABC lower: 小写字母,如: abc mobile: 11位手机号,如: 18888888888 digital_letters: 数字和大小写字母,如: Abc123 letters: 大小写字母,如: Abc character: 单个字符,如: a timestamp: 当前时间戳格式:1586917254,单位是s timestamp_hour: 1小时前时间戳格式:1583317290,单位是s timestamp_ns: 当前时间戳ns格式:1586917325230422166,单位是ns timestamp_ns_hour: 1小时前时间戳格式:1586913750801408626,单位是ns date:当前日期、格式:2020-01-01 date_day:1天前日期、格式:2020-01-01 datetime:当前时间、格式:2020-01-01 15:04:05 datetime_hour:1小时前时间、格式:2020-01-01 14:04:05

  1. version: "1.1"
  2. stages:
  3. - stage:
  4. - custom-script:
  5. alias: custom-script
  6. description: 运行自定义命令
  7. version: "1.0"
  8. commands:
  9. - echo ${{ random.integer }}

${{ outputs.alias.val }}

前置任务输出值,后面的任务使用占位符获取该值

  1. - stage:
  2. - custom-script:
  3. alias: action1
  4. version: "1.0"
  5. commands:
  6. - echo "key=value" >> $METAFILE # 输出 key 值为 value 给下个任务使用
  7. - stage:
  8. - custom-script:
  9. alias: action2
  10. version: "1.0"
  11. commands:
  12. - echo ${{ outputs.action1.key }} # 使用上面任务的输出值(key对应的value)

说明:

$METAFILE 是一个文件, 写入到这个文件是固定写法

${{ params.val }}

流水线运行入参,在 yaml 文件中在 params 字段下填写多个输入框的定义,用户在运行流水线的时候就会弹出定义的输入框,输入框填入的值就会替换掉 ${{ params.key }} 占位符

  1. version: "1.1"
  2. params:
  3. - name: key1 # 定义输入框的 key
  4. required: true # 是否必填
  5. default: 111 # 没有输入值给的默认值
  6. type: int # 定义输入框的类型
  7. - name: key2
  8. required: true
  9. default: 111
  10. type: string
  11. stages:
  12. - stage:
  13. - custom-script:
  14. alias: action1
  15. description: 运行自定义命令
  16. version: "1.0"
  17. commands:
  18. - echo ${{ params.key1 }} # 替换 key1 输入框填的值
  19. - echo ${{ params.key2 }} # 替换 key2 输入框填的值

${{ dirs.alias }}

每个 action 都会有个工作目录, 可以使用 ${{ dirs.xxx }} 占位符进入和获取 action 的工作目录文件和地址

  1. version: "1.1"
  2. stages:
  3. - stage:
  4. - git-checkout:
  5. alias: git-checkout
  6. description: 代码仓库克隆
  7. version: "1.0"
  8. - stage:
  9. - custom-script:
  10. alias: custom-script
  11. description: 运行自定义命令
  12. version: "1.0"
  13. commands:
  14. - echo ${{ dirs.git-checkout }} # 打印任务工作目录的地址
  15. - cd ${{ dirs.git-checkout }} # 进入任务的工作目录
  16. - ls # 打印目录下的文件

action 之间文件传递,每个任务只有在自己的工作目录下创建的文件才能被其他任务使用,否则产生的文件将会被丢弃,$WORKDIR 或者 ${{ dirs.xxx }} 都可以获取当前任务的工作目录

  1. version: "1.1"
  2. stages:
  3. - stage:
  4. - git-checkout:
  5. alias: git
  6. description: 代码仓库克隆
  7. version: "1.0"
  8. - stage:
  9. - custom-script:
  10. alias: script1
  11. description: 运行自定义命令
  12. version: "1.0"
  13. commands:
  14. - cd ${{ dirs.git }}
  15. - touch test.txt # 在 action git 的工作目录下创建 test.txt 文件
  16. - touch test1.txt # 在 action git 的工作目录下创建 test1.txt 文件
  17. - cp test1.txt $WORKDIR # 将 action git 工作目录下的 test1.txt 文件拷贝到当前 action(script1) 的工作目录
  18. - stage:
  19. - custom-script:
  20. alias: script2
  21. description: 运行自定义命令
  22. version: "1.0"
  23. commands:
  24. - cd ${{ dirs.git }} # 进入 action git 的工作目录
  25. - ls # action script1 创建的 test.txt,test1.txt 文件不会存在
  26. - cd ${{ dirs.script1 }} # 进入 action script1 的工作目录
  27. - ls # test1.txt 文件可以看到,test.txt 文件丢失, 因为只有 test1.txt 文件拷贝到了 script1 的工作目录

::: tip 如果使用共享目录的方案,并行任务由于执行完成顺序的不确定性,当 Stage 完成时,共享目录里最终看到的是当前 Stage 里最后一个完成的任务的改动。 :::

${{ configs.val }}

获取平台流水线配置

点击 增加变量,变量名称定义为 TEST_CONFIG_KEY 值为 xxx

  1. version: "1.1"
  2. stages:
  3. - stage:
  4. - custom-script:
  5. alias: custom-script
  6. description: 运行自定义命令
  7. version: "1.0"
  8. - echo ${{ configs.TEST_CONFIG_KEY }}