容器化与Docker工作流 - Claude Code工作流

一、容器化概述与核心价值

容器化是现代软件开发和部署的核心技术之一，它将应用及其所有依赖打包到一个轻量级、可移植的容器镜像中，确保应用在任何环境中都能一致地运行。Docker 是目前最流行的容器化平台，而 Claude Code 可以大幅简化 Docker 工作流的构建与管理过程。

容器化的核心优势：

环境一致性： "在我的机器上可以运行" 成为过去式，开发、测试、生产环境完全一致
快速部署： 容器启动时间以毫秒计，远快于传统虚拟机技术
资源隔离： 每个容器拥有独立的文件系统、网络栈和进程空间
弹性伸缩： 结合 Kubernetes 可实现秒级自动伸缩
版本化管理： 镜像支持标签（tag）、版本回溯和增量更新

使用 Claude Code 管理容器化工作流，可以通过自然语言指令快速生成 Dockerfile、Docker Compose 配置、Kubernetes 资源清单等基础设施即代码（IaC）文件，大幅提升 DevOps 效率。

工作流全景图

一个完整的 Docker 容器化工作流包含以下环节：

Dockerfile 定义： 多阶段构建、基础镜像选择、层优化
本地开发： devcontainer 配置、热重载、调试容器
编排管理： Docker Compose 多服务编排、健康检查
CI/CD 流水线： 自动构建、安全扫描、镜像推送
生产部署： Kubernetes 部署、滚动更新、自动伸缩
监控运维： 容器日志收集、性能监控、告警

二、Dockerfile 创建与管理

Dockerfile 是容器化工作的起点，定义了镜像的构建过程。Claude Code 可以帮助生成符合最佳实践的 Dockerfile，涵盖多阶段构建、基础镜像选择、层优化、容量优化和安全扫描等关键环节。

2.1 多阶段构建

多阶段构建（Multi-stage Build）是 Docker 的杀手级特性，它允许在一个 Dockerfile 中使用多个 FROM 语句，每个 FROM 都是一个独立的构建阶段。最终镜像只包含最后一个阶段的产物，从而显著减小镜像体积。

多阶段构建示例 -- Dockerfile

# ========== 阶段一：编译构建 ==========
FROM golang:1.22-alpine AS builder

# 设置工作目录和构建参数
WORKDIR /app
ARG APP_VERSION=1.0.0
ARG BUILD_TIME

# 依赖缓存层（利用 Docker 层缓存加速）
COPY go.mod go.sum ./
RUN go mod download

# 复制源代码并编译
COPY . .
RUN CGO_ENABLED=0 GOOS=linux go build -ldflags="\
    -X main.Version=${APP_VERSION} \
    -X main.BuildTime=${BUILD_TIME} \
    -w -s" \
    -o /app/server ./cmd/server

# ========== 阶段二：安全扫描（可选）==========
FROM aquasec/trivy:latest AS trivy
COPY --from=builder /app/server /server
RUN trivy filesystem --severity HIGH,CRITICAL --exit-code 1 /server

# ========== 阶段三：运行镜像 ==========
FROM alpine:3.20 AS runtime

# 安装运行时依赖（最小化）
RUN apk add --no-cache ca-certificates tzdata && \
    adduser -D -u 1001 appuser

# 从构建阶段复制编译产物
COPY --from=builder /app/server /usr/local/bin/server
COPY --chown=appuser:appuser configs/ /etc/app/configs/

# 安全配置：非 root 用户运行
USER appuser
WORKDIR /home/appuser

# 健康检查
HEALTHCHECK --interval=30s --timeout=3s --retries=3 \
    CMD wget -qO- http://localhost:8080/health || exit 1

EXPOSE 8080
ENTRYPOINT ["server"]

多阶段构建优势：

最终镜像仅 10-20MB（从含完整 Go SDK 的 1GB+ 缩减而来）
构建依赖和工具链不会泄露到生产镜像中，减小攻击面
各阶段可并行构建，CI/CD 流水线效率更高
可在构建阶段集成安全扫描，实现左移安全

2.2 基础镜像选择策略

选择合适的基础镜像是 Docker 优化的第一步。不同基础镜像在体积、安全性、兼容性和性能方面存在显著差异。

镜像类型	体积	安全性	兼容性	适用场景
alpine	~5MB	高（组件少，攻击面小）	需注意 musl libc 兼容性	Go/Rust 静态编译、Node 应用
slim	~40MB	中等	好（基于 Debian）	Python、Java 运行时
distroless	~20MB	极高（无 shell、无包管理器）	有限（无法 exec 调试）	生产环境首选
ubuntu/debian	~150MB	较低（组件多）	最好	开发环境、复杂依赖应用

基础镜像选择建议：

生产环境优先选择 distroless 或 alpine，最小化攻击面
开发环境可使用 ubuntu/debian，方便调试和安装工具
固定镜像摘要（digest）而非标签，确保不可变性和可复现性
定期更新基础镜像，修复已知 CVE 漏洞

2.3 层优化与容量优化

Docker 镜像由分层文件系统组成，每一层都代表一组文件变更。合理的层组织可以提升构建缓存命中率并减小镜像体积。

层优化最佳实践 -- Dockerfile

# ❌ 不良实践：每次构建都会重新下载依赖
FROM node:20-alpine
WORKDIR /app
COPY . .
RUN npm install
RUN npm run build

# ✅ 最佳实践：按变更频率分层，利用 Docker 层缓存
FROM node:20-alpine AS builder
WORKDIR /app

# 第1层：系统依赖（极少变更）
RUN apk add --no-cache python3 make g++

# 第2层：package.json 和 lock 文件（相对少变更）
COPY package.json package-lock.json ./
RUN npm ci --only=production

# 第3层：源代码（最频繁变更）
COPY . .
RUN npm run build

# 第4层：运行时镜像
FROM node:20-alpine AS runtime
WORKDIR /app
COPY --from=builder /app/dist ./dist
COPY --from=builder /app/node_modules ./node_modules
EXPOSE 3000
CMD ["node", "dist/index.js"]

层优化六原则：

少即是多： 合并 RUN 指令，用 && 连接多个命令，减少层数
安装后清理： 在同一 RUN 层中清理 apt/yum 缓存，避免缓存残留在镜像中
恒定顺序： 先复制不易变更的文件（package.json），后复制源代码
.dockerignore： 排除 node_modules、.git、*.log 等无用文件
使用 --link： COPY --link 可独立缓存层，不依赖前置层
避免 ADD 替代 COPY： ADD 会自动解压 tar 文件，增加不确定性

.dockerignore 文件示例

# 版本控制相关
.git/
.gitignore

# 开发环境
node_modules/
vendor/
.env
.env.local
*.log
.cache/

# IDE 配置
.idea/
.vscode/
*.swp
*.swo

# 构建产物
dist/
build/
*.tar.gz
Dockerfile
docker-compose*.yml

# 测试和文档
test/
tests/
__pycache__/
*.pyc
coverage/
docs/
*.md

# CI/CD
.gitlab-ci.yml
.github/

2.4 安全扫描与镜像加固

容器安全是生产环境部署的关键考量。Claude Code 可以集成 Trivy 等安全扫描工具到 Dockerfile 构建流程中，实现左移安全。

集成 Trivy 安全扫描的构建脚本

#!/bin/bash
# build-and-scan.sh -- 构建并扫描 Docker 镜像
set -euo pipefail

IMAGE_NAME="${1:-myapp}"
IMAGE_TAG="${2:-latest}"
SEVERITY="${3:-HIGH,CRITICAL}"

echo ">>> 步骤1: 构建 Docker 镜像"
docker build \
    --build-arg BUILD_TIME=$(date -u +"%Y-%m-%dT%H:%M:%SZ") \
    --build-arg APP_VERSION=$(git describe --tags --always) \
    -t "${IMAGE_NAME}:${IMAGE_TAG}" .

echo ">>> 步骤2: Trivy 安全扫描"
docker run --rm \
    -v /var/run/docker.sock:/var/run/docker.sock \
    -v "${HOME}/trivy-cache:/root/.cache" \
    aquasec/trivy:latest \
    image --severity "${SEVERITY}" \
    --exit-code 1 \
    --no-progress \
    --ignore-unfixed \
    --format table \
    "${IMAGE_NAME}:${IMAGE_TAG}"

echo ">>> 步骤3: 扫描通过，镜像就绪"
docker images "${IMAGE_NAME}:${IMAGE_TAG}"

安全加固检查清单：

禁止使用 root 用户运行容器，使用 USER 指令切换到非特权用户
移除 setuid/setgid 权限位，防止提权攻击
使用只读根文件系统（readOnlyRootFilesystem: true）
限制 Linux Capabilities，遵循最小权限原则
定期扫描镜像已知 CVE 漏洞，修复后重新构建
不使用 latest 标签，使用语义化版本或 Git 提交 SHA
启用 Docker Content Trust 进行镜像签名验证

三、Docker Compose 配置

Docker Compose 是定义和运行多容器 Docker 应用的工具。通过一个 YAML 文件，可以配置应用的所有服务、网络、卷和环境变量。Claude Code 可以根据应用架构自动生成完整的 Docker Compose 配置。

3.1 完整服务定义

docker-compose.yml -- Web + API + DB + Redis + Nginx

version: "3.9"

# ========== 网络隔离 ==========
networks:
  frontend:
    driver: bridge
    ipam:
      config:
        - subnet: "172.20.0.0/24"
  backend:
    driver: bridge
    internal: true  # 内网网络，不对外暴露
    ipam:
      config:
        - subnet: "172.20.1.0/24"

# ========== 持久化卷 ==========
volumes:
  postgres_data:
    driver: local
    driver_opts:
      type: none
      device: ${PWD}/data/postgres
      o: bind
  redis_data:
  uploads_data:
  certs_data:

# ========== 服务定义 ==========
services:
  # ---- 反向代理 ----
  nginx:
    image: nginx:1.27-alpine
    ports:
      - "80:80"
      - "443:443"
    volumes:
      - ./nginx/conf.d:/etc/nginx/conf.d:ro
      - ./nginx/ssl:/etc/nginx/ssl:ro
      - certs_data:/etc/letsencrypt
    depends_on:
      frontend:
        condition: service_started
      api:
        condition: service_healthy
    networks:
      - frontend
    restart: unless-stopped
    healthcheck:
      test: ["CMD", "nginx", "-t"]
      interval: 30s
      timeout: 5s
      retries: 3

  # ---- 前端应用 ----
  frontend:
    build:
      context: ./frontend
      dockerfile: Dockerfile
      target: production
      args:
        - API_BASE_URL=https://api.example.com
    ports:
      - "3000:3000"
    environment:
      - NODE_ENV=production
      - NEXT_PUBLIC_API_URL=/api
    depends_on:
      api:
        condition: service_healthy
    networks:
      - frontend
    restart: unless-stopped

  # ---- API 服务 ----
  api:
    build:
      context: ./backend
      dockerfile: Dockerfile
      target: runtime
    expose:
      - "8080"
    environment:
      - DB_HOST=postgres
      - DB_PORT=5432
      - DB_USER=${DB_USER:-app}
      - DB_PASSWORD=${DB_PASSWORD:?err}
      - DB_NAME=${DB_NAME:-myapp}
      - REDIS_HOST=redis
      - REDIS_PORT=6379
      - JWT_SECRET=${JWT_SECRET:?err}
      - LOG_LEVEL=info
    volumes:
      - uploads_data:/data/uploads
    env_file:
      - ./backend/.env.production
    depends_on:
      postgres:
        condition: service_healthy
      redis:
        condition: service_started
    networks:
      - frontend
      - backend
    restart: unless-stopped
    deploy:
      replicas: 3
      resources:
        limits:
          cpus: "1.0"
          memory: 512M
        reservations:
          cpus: "0.5"
          memory: 256M
    healthcheck:
      test: ["CMD", "wget", "-qO-", "http://localhost:8080/health"]
      interval: 15s
      timeout: 5s
      retries: 3
      start_period: 30s

  # ---- PostgreSQL 数据库 ----
  postgres:
    image: postgres:16-alpine
    expose:
      - "5432"
    environment:
      POSTGRES_USER: ${DB_USER:-app}
      POSTGRES_PASSWORD: ${DB_PASSWORD:?err}
      POSTGRES_DB: ${DB_NAME:-myapp}
      POSTGRES_INITDB_ARGS: "--data-checksums --auth=scram-sha-256"
    volumes:
      - postgres_data:/var/lib/postgresql/data
      - ./db/init:/docker-entrypoint-initdb.d:ro
    networks:
      - backend
    restart: unless-stopped
    healthcheck:
      test: ["CMD-SHELL", "pg_isready -U app -d myapp"]
      interval: 10s
      timeout: 5s
      retries: 5
      start_period: 10s

  # ---- Redis 缓存 ----
  redis:
    image: redis:7.4-alpine
    expose:
      - "6379"
    command: >
      redis-server
      --appendonly yes
      --requirepass ${REDIS_PASSWORD:?err}
      --maxmemory 256mb
      --maxmemory-policy allkeys-lru
    volumes:
      - redis_data:/data
    networks:
      - backend
    restart: unless-stopped
    healthcheck:
      test: ["CMD", "redis-cli", "--raw", "incr", "ping"]
      interval: 10s
      timeout: 3s
      retries: 3

  # ---- 后台任务处理 ----
  worker:
    build:
      context: ./backend
      dockerfile: Dockerfile
      target: runtime
    command: ["celery", "-A", "tasks", "worker", "--loglevel=info"]
    environment:
      - REDIS_HOST=redis
      - REDIS_PORT=6379
      - REDIS_PASSWORD=${REDIS_PASSWORD:?err}
    env_file:
      - ./backend/.env.production
    depends_on:
      redis:
        condition: service_started
    networks:
      - backend
    restart: unless-stopped
    deploy:
      replicas: 2
      resources:
        limits:
          cpus: "0.5"
          memory: 256M

3.2 依赖启动与健康检查

在微服务架构中，服务之间的启动顺序依赖至关重要。Docker Compose 提供了 depends_on 结合 condition 来控制启动顺序，但真正可靠的方案是使用健康检查（healthcheck）。

三种依赖控制方式对比：

depends_on（基础）： 仅控制启动顺序，不等待服务就绪。服务 A 会在服务 B 的容器启动后立即启动，但此时 B 可能尚未完成初始化。
depends_on + condition: service_healthy： 等待服务健康检查通过后才启动依赖服务。这是生产环境推荐方式。
wait-for-it.sh 脚本： 在容器入口点使用脚本轮询等待依赖服务端口可用，适用于更复杂的启动逻辑。

wait-for-it.sh 脚本示例

#!/bin/bash
# wait-for-it.sh -- 等待 TCP 服务就绪
set -e

host="$1"
port="$2"
shift 2
cmd="$@"

until nc -z "$host" "$port"; do
  echo "等待 $host:$port 就绪..."
  sleep 2
done

echo "$host:$port 已就绪"
exec $cmd

3.3 环境变量管理

环境变量是配置容器化应用的标准方式。Docker Compose 支持多级环境变量加载机制，Claude Code 可以帮助设计合理的环境变量管理策略。

环境变量层级加载（从上到下优先级递增）

# 第1层: compose 文件中的 default 值（最低优先级）
environment:
  - LOG_LEVEL=info
  - PORT=8080

# 第2层: .env 文件中的全局变量
# docker-compose.yml 同级目录下的 .env 文件自动加载
# .env 文件内容:
DB_HOST=localhost
DB_PORT=5432

# 第3层: env_file 指定文件
env_file:
  - ./backend/.env.production

# 第4层: shell 环境变量 + 变量替换（最高优先级）
environment:
  - DB_PASSWORD=${DB_PASSWORD:?err}
  - JWT_SECRET=${JWT_SECRET:?err}
  - API_KEY=${API_KEY:-default_key}

环境变量最佳实践：

敏感信息（密码、密钥、Token）永远不要硬编码在 docker-compose.yml 中
使用 ${VAR:?err} 语法强制要求必须设置某变量，缺少时直接报错
为不同环境准备独立的 .env 文件：.env.development、.env.staging、.env.production
将 .env 文件加入 .gitignore，避免敏感信息泄露
使用 Docker Secrets 或外部密钥管理服务（如 HashiCorp Vault）管理生产密钥

四、容器化 CI/CD

将 Docker 构建集成到 CI/CD 流水线中可以实现自动化的镜像构建、安全扫描和部署。Claude Code 可以帮助生成完整的 CI/CD 配置文件。

4.1 GitHub Actions 自动化构建流水线

.github/workflows/docker-build.yml -- 完整 CI/CD 流水线

name: Docker Build & Deploy

on:
  push:
    branches: [main, develop]
    tags: ["v*"]
  pull_request:
    branches: [main]

env:
  REGISTRY: ghcr.io
  IMAGE_NAME: ${{ github.repository }}
  DOCKER_BUILDKIT: 1
  COMPOSE_DOCKER_CLI_BUILD: 1

jobs:
  # ======== 步骤1: 代码检查与测试 ========
  test:
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v4
      - name: 运行单元测试
        run: |
          docker compose -f docker-compose.test.yml run --rm test
      - name: 上传测试覆盖率
        uses: actions/upload-artifact@v4
        with:
          name: coverage
          path: coverage/

  # ======== 步骤2: 构建与安全扫描 ========
  build-and-scan:
    needs: test
    runs-on: ubuntu-latest
    permissions:
      contents: read
      packages: write
      security-events: write
    steps:
      - uses: actions/checkout@v4

      - name: 设置 Docker 元数据
        id: meta
        uses: docker/metadata-action@v5
        with:
          images: ${{ env.REGISTRY }}/${{ env.IMAGE_NAME }}
          tags: |
            type=semver,pattern={{version}}
            type=semver,pattern={{major}}.{{minor}}
            type=ref,event=branch
            type=sha,format=short
            type=raw,value=latest,enable={{is_default_branch}}

      - name: 登录容器仓库
        uses: docker/login-action@v3
        with:
          registry: ${{ env.REGISTRY }}
          username: ${{ github.actor }}
          password: ${{ secrets.GITHUB_TOKEN }}

      - name: 设置 Docker BuildKit 缓存
        uses: actions/cache@v4
        with:
          path: /tmp/.buildx-cache
          key: ${{ runner.os }}-buildx-${{ github.sha }}
          restore-keys: |
            ${{ runner.os }}-buildx-

      - name: 构建并推送镜像
        uses: docker/build-push-action@v6
        with:
          context: .
          push: true
          tags: ${{ steps.meta.outputs.tags }}
          labels: ${{ steps.meta.outputs.labels }}
          cache-from: type=local,src=/tmp/.buildx-cache
          cache-to: type=local,dest=/tmp/.buildx-cache-new
          build-args: |
            APP_VERSION=${{ github.ref_name }}
            BUILD_TIME=${{ github.event.repository.updated_at }}

      - name: Trivy 安全扫描
        uses: aquasecurity/trivy-action@master
        with:
          image-ref: ${{ env.REGISTRY }}/${{ env.IMAGE_NAME }}:${{ steps.meta.outputs.version }}
          format: sarif
          output: trivy-results.sarif
          severity: HIGH,CRITICAL
          exit-code: 1
          ignore-unfixed: true

      - name: 上传 Trivy 扫描结果
        uses: github/codeql-action/upload-sarif@v3
        with:
          sarif_file: trivy-results.sarif
          category: trivy

      - name: 镜像签名（cosign）
        uses: sigstore/cosign-installer@v3
      - name: 签名镜像
        run: |
          cosign sign --yes \
            --key env://COSIGN_PRIVATE_KEY \
            ${{ env.REGISTRY }}/${{ env.IMAGE_NAME }}@${{ steps.digest.outputs.digest }}
        env:
          COSIGN_PRIVATE_KEY: ${{ secrets.COSIGN_PRIVATE_KEY }}
          COSIGN_PASSWORD: ${{ secrets.COSIGN_PASSWORD }}

      # 缓存优化（限制缓存大小）
      - name: 移动缓存
        run: |
          rm -rf /tmp/.buildx-cache
          mv /tmp/.buildx-cache-new /tmp/.buildx-cache

  # ======== 步骤3: 部署到 Kubernetes ========
  deploy:
    needs: build-and-scan
    runs-on: ubuntu-latest
    if: github.ref == 'refs/heads/main'
    steps:
      - uses: actions/checkout@v4

      - name: 配置 kubeconfig
        uses: azure/k8s-set-context@v4
        with:
          kubeconfig: ${{ secrets.KUBECONFIG }}

      - name: 更新 Kubernetes 部署
        run: |
          kubectl set image deployment/myapp \
            myapp=${{ env.REGISTRY }}/${{ env.IMAGE_NAME }}:${{ github.sha }} \
            -n production
          kubectl rollout status deployment/myapp -n production --timeout=5m

4.2 镜像标签策略

合理的镜像标签策略对于版本回溯、审计和故障排查至关重要。

标签类型	格式示例	用途
语义化版本	v1.2.3, v2.0.0-rc.1	正式发布版本，Git Tag 触发
Git 提交 SHA	a1b2c3d4	每个提交对应唯一镜像，精确回溯
分支名称	main, develop, feature-login	开发过程中的持续构建
时间戳	20260508-1530	手动构建或紧急修复
latest	latest	仅主分支最新构建，不推荐生产使用

4.3 镜像仓库推送与签名验证

使用 cosign 进行镜像签名和验证

# ========== 镜像签名 ==========
# 生成密钥对
cosign generate-key-pair

# 签名镜像（推送前）
cosign sign --key cosign.key \
    ghcr.io/myorg/myapp:v1.2.3

# ========== 镜像验证 ==========
# 在部署前验证签名
cosign verify --key cosign.pub \
    ghcr.io/myorg/myapp:v1.2.3

# 在 Kubernetes 中强制验证签名（Kyverno 策略）
# policy.yaml:
apiVersion: kyverno.io/v1
kind: ClusterPolicy
metadata:
  name: verify-image
spec:
  validationFailureAction: Enforce
  rules:
    - name: verify-cosign
      match:
        any:
          - resources:
              kinds:
                - Pod
      verifyImages:
        - image: "ghcr.io/myorg/*"
          key: |-
            -----BEGIN PUBLIC KEY-----
            ...
            -----END PUBLIC KEY-----

五、Kubernetes 部署

Kubernetes 是生产环境中容器编排的事实标准。Claude Code 可以帮助生成完整的 Kubernetes 资源清单，包括 Deployment、Service、ConfigMap、Secrets、HPA 等核心资源。

5.1 Deployment 与 Service 配置

k8s/deployment.yaml -- 完整部署清单

apiVersion: apps/v1
kind: Deployment
metadata:
  name: myapp
  namespace: production
  labels:
    app: myapp
    tier: backend
    version: v1.2.3
  annotations:
    app.kubernetes.io/managed-by: Claude Code
    app.kubernetes.io/description: "微服务 API 后端"
spec:
  replicas: 3
  strategy:
    type: RollingUpdate
    rollingUpdate:
      maxSurge: 1          # 允许额外创建 1 个 Pod
      maxUnavailable: 0     # 更新期间必须保持所有 Pod 可用
  selector:
    matchLabels:
      app: myapp
      tier: backend
  template:
    metadata:
      labels:
        app: myapp
        tier: backend
        version: v1.2.3
    spec:
      # 安全上下文
      securityContext:
        runAsNonRoot: true
        runAsUser: 1001
        fsGroup: 1001
        seccompProfile:
          type: RuntimeDefault
      # 容器定义
      containers:
        - name: myapp
          image: ghcr.io/myorg/myapp:v1.2.3
          imagePullPolicy: IfNotPresent
          ports:
            - containerPort: 8080
              protocol: TCP
              name: http
            - containerPort: 9090
              protocol: TCP
              name: metrics
          # 资源限制
          resources:
            requests:
              cpu: 250m
              memory: 256Mi
            limits:
              cpu: 1000m
              memory: 512Mi
          # 存活探针
          livenessProbe:
            httpGet:
              path: /health
              port: http
            initialDelaySeconds: 30
            periodSeconds: 15
            timeoutSeconds: 3
            failureThreshold: 3
          # 就绪探针
          readinessProbe:
            httpGet:
              path: /ready
              port: http
            initialDelaySeconds: 5
            periodSeconds: 10
            timeoutSeconds: 3
            successThreshold: 1
          # 启动探针（慢启动应用）
          startupProbe:
            httpGet:
              path: /health
              port: http
            initialDelaySeconds: 10
            periodSeconds: 5
            failureThreshold: 30
          # 环境变量
          envFrom:
            - configMapRef:
                name: myapp-config
            - secretRef:
                name: myapp-secrets
          # 持久化存储
          volumeMounts:
            - name: data
              mountPath: /data
            - name: tmp
              mountPath: /tmp
          securityContext:
            allowPrivilegeEscalation: false
            readOnlyRootFilesystem: true
            capabilities:
              drop: ["ALL"]
      volumes:
        - name: data
          persistentVolumeClaim:
            claimName: myapp-data-pvc
        - name: tmp
          emptyDir:
            medium: Memory
      # Pod 调度策略
      affinity:
        podAntiAffinity:
          preferredDuringSchedulingIgnoredDuringExecution:
            - weight: 100
              podAffinityTerm:
                labelSelector:
                  matchExpressions:
                    - key: app
                      operator: In
                      values:
                        - myapp
                topologyKey: kubernetes.io/hostname
      tolerations:
        - key: "critical"
          operator: "Equal"
          value: "true"
          effect: "NoSchedule"

---
apiVersion: v1
kind: Service
metadata:
  name: myapp-service
  namespace: production
  annotations:
    service.beta.kubernetes.io/aws-load-balancer-type: "nlb"
spec:
  type: ClusterIP
  ports:
    - port: 80
      targetPort: 8080
      protocol: TCP
      name: http
    - port: 9090
      targetPort: 9090
      protocol: TCP
      name: metrics
  selector:
    app: myapp
    tier: backend

---
apiVersion: v1
kind: Service
metadata:
  name: myapp-ingress
  namespace: production
spec:
  type: LoadBalancer
  ports:
    - port: 443
      targetPort: 8080
      protocol: TCP
      name: https
  selector:
    app: myapp
    tier: backend

5.2 ConfigMap 与 Secrets 管理

k8s/configmap.yaml -- 应用配置

apiVersion: v1
kind: ConfigMap
metadata:
  name: myapp-config
  namespace: production
data:
  # 应用配置（非敏感信息）
  APP_ENV: "production"
  LOG_LEVEL: "info"
  LOG_FORMAT: "json"
  API_PORT: "8080"
  METRICS_PORT: "9090"
  DB_HOST: "postgres.production.svc.cluster.local"
  DB_PORT: "5432"
  DB_NAME: "myapp"
  REDIS_HOST: "redis.production.svc.cluster.local"
  REDIS_PORT: "6379"
  CORS_ORIGINS: "https://app.example.com"
  RATE_LIMIT: "1000"
  RATE_LIMIT_WINDOW: "60"

  # 配置文件挂载
  nginx.conf: |
    server {
        listen 80;
        location / {
            proxy_pass http://localhost:8080;
            proxy_set_header Host $host;
        }
    }

---
apiVersion: v1
kind: Secret
metadata:
  name: myapp-secrets
  namespace: production
type: Opaque
stringData:
  DB_PASSWORD: "your-db-password-here"
  JWT_SECRET: "your-jwt-secret-here"
  REDIS_PASSWORD: "your-redis-password-here"
  API_KEY: "your-api-key-here"
  ENCRYPTION_KEY: "base64-encoded-32-byte-key"

Secrets 管理警告：

永远不要将 Secret 的明文值提交到 Git 仓库
生产环境使用外部 Secret 管理工具：External Secrets Operator、HashiCorp Vault、AWS Secrets Manager
开启 Kubernetes 的加密存储（EncryptionConfiguration）保护 etcd 中的 Secret 数据
使用 RBAC 严格控制 Secret 的读取权限
定期轮换 Secret 并更新依赖的 Pod

5.3 滚动更新与 HPA 自动伸缩

k8s/hpa.yaml -- 水平 Pod 自动伸缩

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: myapp-hpa
  namespace: production
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: myapp
  minReplicas: 3
  maxReplicas: 20
  behavior:
    # 快速扩容，慢速缩容
    scaleUp:
      stabilizationWindowSeconds: 0
      policies:
        - type: Percent
          value: 100
          periodSeconds: 15
        - type: Pods
          value: 4
          periodSeconds: 15
      selectPolicy: Max
    scaleDown:
      stabilizationWindowSeconds: 300
      policies:
        - type: Percent
          value: 10
          periodSeconds: 60
  metrics:
    # CPU 利用率指标
    - type: Resource
      resource:
        name: cpu
        target:
          type: Utilization
          averageUtilization: 70
    # 内存利用率指标
    - type: Resource
      resource:
        name: memory
        target:
          type: Utilization
          averageUtilization: 80
    # 自定义指标：每秒请求数
    - type: Pods
      pods:
        metric:
          name: http_requests_per_second
        target:
          type: AverageValue
          averageValue: 1000

滚动更新策略配置建议：

maxSurge: 1 -- 每次滚动更新只额外创建一个新 Pod，控制资源消耗
maxUnavailable: 0 -- 确保更新期间服务完全不中断（零停机部署）
Readiness Probe + Rolling Update -- 新 Pod 就绪后才会继续销毁旧 Pod
PodDisruptionBudget -- 设置最小可用 Pod 数量，防止节点维护时服务中断
preStop hook -- 在 Pod 终止前优雅关闭，处理进行中的请求

k8s/pdb.yaml -- Pod 中断预算

apiVersion: policy/v1
kind: PodDisruptionBudget
metadata:
  name: myapp-pdb
  namespace: production
spec:
  minAvailable: 2
  selector:
    matchLabels:
      app: myapp
      tier: backend

六、开发环境容器化

开发环境容器化让团队成员在统一的环境中开发，消除"环境不一致"问题。VS Code 的 devcontainer 功能可以将容器作为完整的开发环境。

6.1 devcontainer 配置

.devcontainer/devcontainer.json -- 完整开发容器配置

{
    "name": "MyApp 开发环境",
    "image": "mcr.microsoft.com/devcontainers/base:ubuntu-24.04",
    "features": {
        "ghcr.io/devcontainers/features/go:1": {
            "version": "1.22"
        },
        "ghcr.io/devcontainers/features/node:1": {
            "version": "20"
        },
        "ghcr.io/devcontainers/features/docker-in-docker:1": {
            "version": "latest",
            "moby": true
        },
        "ghcr.io/devcontainers/features/kubectl-cli:1": {},
        "ghcr.io/devcontainers/features/helm:1": {}
    },
    "customizations": {
        "vscode": {
            "settings": {
                "go.useLanguageServer": true,
                "go.formatTool": "gofumpt",
                "go.lintTool": "golangci-lint",
                "editor.formatOnSave": true,
                "files.eol": "\n",
                "terminal.integrated.defaultProfile.linux": "zsh"
            },
            "extensions": [
                "golang.Go",
                "ms-azuretools.vscode-docker",
                "ms-kubernetes-tools.vscode-kubernetes-tools",
                "redhat.vscode-yaml",
                "eamodio.gitlens",
                "tamasfe.even-better-toml",
                "bierner.markdown-mermaid",
                "github.vscode-github-actions"
            ]
        }
    },
    "mounts": [
        "source=/var/run/docker.sock,target=/var/run/docker.sock,type=bind"
    ],
    "forwardPorts": [3000, 8080, 5432, 6379],
    "portsAttributes": {
        "3000": {
            "label": "前端服务",
            "onAutoForward": "notify"
        },
        "8080": {
            "label": "API 服务",
            "onAutoForward": "openBrowser"
        },
        "5432": {
            "label": "PostgreSQL",
            "onAutoForward": "silent"
        }
    },
    "postCreateCommand": "go mod download && make init-dev",
    "postStartCommand": "make dev-env-up",
    "remoteUser": "vscode",
    "containerEnv": {
        "DEV_ENV": "true",
        "COMPOSE_FILE": "docker-compose.dev.yml"
    },
    "runArgs": [
        "--network=host",
        "--memory=4g",
        "--memory-swap=6g"
    ]
}

# ========== 配套 Dockerfile ==========
# .devcontainer/Dockerfile
FROM mcr.microsoft.com/devcontainers/base:ubuntu-24.04

# 安装系统依赖
RUN apt-get update && export DEBIAN_FRONTEND=noninteractive && \
    apt-get install -y --no-install-recommends \
        build-essential \
        curl \
        git \
        zsh \
        fzf \
        ripgrep \
        jq \
        yq \
        htop \
        httpie \
        && rm -rf /var/lib/apt/lists/*

# 安装 oh-my-zsh
RUN sh -c "$(curl -fsSL https://raw.githubusercontent.com/ohmyzsh/ohmyzsh/master/tools/install.sh)" "" --unattended

# 安装 Taskfile（替代 Makefile 的现代构建工具）
RUN sh -c "$(curl -sSL https://taskfile.dev/install.sh)" -- -d -b /usr/local/bin

6.2 Volume 热重载与调试容器

开发环境中，源码热重载（Hot Reload）是提升开发效率的关键。通过 Volume 绑定挂载和文件监听工具，代码修改后可以立即生效，无需重新构建镜像。

docker-compose.dev.yml -- 开发环境配置（热重载 + 调试）

version: "3.9"

services:
  # ---- API 服务（开发模式）----
  api-dev:
    build:
      context: ./backend
      dockerfile: Dockerfile.dev
      args:
        - DEV_MODE=true
    ports:
      - "8080:8080"
      - "2345:2345"    # Delve 调试器端口
    volumes:
      # 源码热挂载（代码修改立即生效）
      - ./backend:/app:ro,delegated
      # 排除 node_modules（使用容器内安装的依赖）
      - /app/node_modules
      - /app/.git
    environment:
      - DEV_MODE=true
      - DEBUG_PORT=2345
      - GODEBUG=gctrace=1
    command: >
      air --  # Go 热重载工具
    # 或使用 Delve 调试模式:
    # command: dlv debug --headless --listen=:2345 --api-version=2 --accept-multiclient

  # ---- 前端服务（开发模式）----
  frontend-dev:
    build:
      context: ./frontend
      dockerfile: Dockerfile.dev
    ports:
      - "3000:3000"
      - "9229:9229"    # Node.js 调试器端口
    volumes:
      - ./frontend:/app:ro,delegated
      - /app/node_modules
      - /app/.next
    environment:
      - NODE_ENV=development
      - NEXT_PUBLIC_API_URL=http://localhost:8080
      - WATCHPACK_POLLING=true   # 文件系统轮询（解决 Docker 文件监听问题）
    command: npm run dev

  # ---- 数据库（开发优化配置）----
  postgres-dev:
    image: postgres:16-alpine
    ports:
      - "5432:5432"
    environment:
      POSTGRES_USER: dev
      POSTGRES_PASSWORD: dev
      POSTGRES_DB: myapp_dev
    volumes:
      - postgres_dev_data:/var/lib/postgresql/data
      - ./db/init:/docker-entrypoint-initdb.d:ro
      - ./db/dev-seed:/docker-entrypoint-initdb.d/seed:ro

volumes:
  postgres_dev_data:

6.3 调试容器配置

.vscode/launch.json -- VS Code 远程容器调试配置

{
    "version": "0.2.0",
    "configurations": [
        {
            "name": "Attach to Docker (Go)",
            "type": "go",
            "request": "attach",
            "mode": "remote",
            "remotePath": "/app",
            "port": 2345,
            "host": "127.0.0.1",
            "trace": "log",
            "showLog": true
        },
        {
            "name": "Attach to Docker (Node)",
            "type": "node",
            "request": "attach",
            "port": 9229,
            "address": "127.0.0.1",
            "localRoot": "${workspaceFolder}/frontend",
            "remoteRoot": "/app",
            "skipFiles": ["/**"]
        }
    ]
}

开发环境容器化优势：

零环境设置： 新成员只需安装 Docker 和 VS Code，clone 后一键启动开发环境
环境一致性： 所有开发者使用完全相同的工具链和依赖版本
隔离性： 不同项目的依赖不会相互冲突
接近生产： 开发环境使用与生产相同的操作系统和基础镜像
可复现的 Bug： 环境差异不再导致"我这边跑不起来"的问题

七、CLAUDE.md 配置 Docker 工作流

在项目根目录配置 CLAUDE.md 文件，可以让 Claude Code 在每次交互时自动遵循项目的 Docker 工作流规范。Claude Code 的 CLAUDE.md 可以存储项目的容器化配置、构建命令和最佳实践。

CLAUDE.md -- Docker 工作流配置指引

# MyApp 项目 Docker 工作流

## 开发环境
- 使用 `docker compose -f docker-compose.dev.yml up -d` 启动开发环境
- 源码通过 Volume 挂载到容器内，支持热重载
- 使用 `./dev.sh` 脚本一键启动（包含数据库迁移和种子数据）
- 调试端口映射：API (2345)、前端 (9229)

## 构建命令
- `make build` -- 使用 Docker BuildKit 构建生产镜像
- `make scan` -- 使用 Trivy 扫描镜像中的安全漏洞
- `make push` -- 推送镜像到 GHCR 仓库
- `make sign` -- 使用 cosign 签名镜像

## 镜像标签规范
- 生产发布: v{major}.{minor}.{patch}
- 开发构建: {branch}-{short-sha}
- 禁止在 CI 之外手动推送 latest 标签

## Dockerfile 要求
- 必须使用多阶段构建
- 基础镜像固定 digest（摘要）
- 运行阶段禁止包含编译工具链
- 必须设置 HEALTHCHECK
- 必须以非 root 用户运行

## Kubernetes 部署
- 命名空间: production / staging
- 部署文件: k8s/deployment.yaml
- 配置更新: `kubectl apply -f k8s/`
- 回滚命令: `kubectl rollout undo deployment/myapp -n production`

## 安全要求
- 每次构建必须通过 Trivy 扫描（HIGH/CRITICAL 级别阻断）
- 生产镜像必须经过 cosign 签名
- 敏感信息通过 Secret 注入，不得硬编码
- 容器安全上下文：readOnlyRootFilesystem + 丢弃所有 Capabilities

在 CLAUDE.md 中声明 Docker 工具函数

通过预定义的 shell 函数，可以让 Claude Code 在需要时直接调用 Docker 相关操作：

CLAUDE.md -- 工具函数声明

## 工具函数（Claude Code 可调用）

dev() {
    # 启动完整开发环境
    docker compose -f docker-compose.dev.yml up -d
    echo "开发环境已启动"
    docker compose -f docker-compose.dev.yml logs -f
}

rebuild() {
    # 重新构建并启动指定服务
    local service=${1:-api-dev}
    docker compose -f docker-compose.dev.yml build $service
    docker compose -f docker-compose.dev.yml up -d $service
}

logs() {
    # 查看服务日志
    docker compose -f docker-compose.dev.yml logs -f ${1:-api-dev}
}

exec-app() {
    # 进入容器交互终端
    docker compose -f docker-compose.dev.yml exec api-dev /bin/zsh
}

cleanup() {
    # 清理开发环境
    docker compose -f docker-compose.dev.yml down -v
    docker system prune -f
}

db-migrate() {
    # 执行数据库迁移
    docker compose -f docker-compose.dev.yml exec api-dev migrate up
}

db-shell() {
    # 进入数据库交互终端
    docker compose -f docker-compose.dev.yml exec postgres-dev psql -U dev -d myapp_dev
}

CLAUDE.md 配置最佳实践：

明确 Docker 版本要求： 在文件开头声明需要的最低 Docker Engine 和 Docker Compose 版本
列出所有可用的 Make 命令： 提供完整的构建、测试、部署命令表
声明端口映射： 列出所有开发环境中使用的端口，避免冲突
记录常见故障排除： 如 Docker for Mac 的性能问题、文件监听问题等解决方案
指定环境变量模板： 提供 .env.example 文件的完整说明
定义 Docker 网络策略： 说明服务之间的通信方式（网络名、别名等）

八、端到端工作流演示

以下是一个完整的端到端工作流示例，展示从代码修改到生产部署的全过程，使用 Claude Code 驱动各个步骤。

完整 DevOps 工作流 (简化版)

# ===========================================
# 端到端 Docker 工作流 (Claude Code 驱动)
# ===========================================

# ---- 阶段 1: 本地开发 ----
# 1. 启动开发环境
docker compose -f docker-compose.dev.yml up -d

# 2. 修改代码后，热重载自动生效
#    （无需手动操作，容器内文件监听自动重启）

# 3. 运行测试
docker compose -f docker-compose.dev.yml exec api-dev go test ./...
docker compose -f docker-compose.dev.yml exec frontend-dev npm run test

# ---- 阶段 2: 构建与发布 ----
# 4. 构建生产镜像
DOCKER_BUILDKIT=1 docker build -t myapp:$(git rev-parse --short HEAD) .

# 5. 安全扫描
trivy image --severity HIGH,CRITICAL --exit-code 1 myapp:$(git rev-parse --short HEAD)

# 6. 打标签并推送
docker tag myapp:$(git rev-parse --short HEAD) ghcr.io/myorg/myapp:v1.2.3
docker push ghcr.io/myorg/myapp:v1.2.3

# 7. 签名
cosign sign --key cosign.key ghcr.io/myorg/myapp:v1.2.3

# ---- 阶段 3: 部署上线 ----
# 8. 更新 Kubernetes 部署
kubectl set image deployment/myapp \
    myapp=ghcr.io/myorg/myapp:v1.2.3 \
    -n production

# 9. 监控滚动更新状态
kubectl rollout status deployment/myapp -n production --watch

# 10. 验证部署
kubectl get pods -n production -l app=myapp
kubectl describe deployment/myapp -n production

Claude Code 场景工作流示例：

"创建一个 Node.js 应用的 Dockerfile，使用多阶段构建" -- Claude Code 根据应用框架自动生成优化的 Dockerfile
"为这个微服务项目生成 docker-compose.yml" -- Claude Code 扫描项目结构，识别所有服务并生成编排配置
"添加 Trivy 安全扫描到 GitHub Actions" -- Claude Code 生成 CI/CD 配置文件并集成安全扫描
"生成 Kubernetes 部署清单，3 副本 + HPA" -- Claude Code 根据资源需求生成完整的 K8s 清单
"配置 devcontainer，包含 Go 和 Node.js 开发环境" -- Claude Code 生成 devcontainer.json 和相关配置
"将 Docker 工作流写入 CLAUDE.md" -- Claude Code 记录项目的容器化最佳实践到项目文档

十、进一步思考

容器化技术栈正在快速演进。以下是几个值得关注的方向和实践建议：

进阶方向：

eBPF 与容器可观测性： 使用 Cilium、Pixie 等 eBPF 技术实现无侵入的容器网络和安全监控
WebAssembly 与容器互补： WASM 运行时（如 WasmEdge）可作为轻量级替代方案，适合边缘计算场景
FinOps 成本优化： 使用 Karpenter、Spot Instances 等工具优化 Kubernetes 集群成本
GitOps 工作流： 使用 ArgoCD 或 Flux 实现声明式的持续部署，镜像更新自动同步到集群
Service Mesh： 引入 Istio 或 Linkerd 实现流量管理、可观测性和零信任安全
容器安全演进： 关注 Kyverno 策略引擎、OPA Gatekeeper 等容器安全治理工具

GitOps 与 ArgoCD 集成示例

将容器镜像更新自动同步到 Kubernetes 集群是 GitOps 的核心能力。以下 ArgoCD Application 配置可自动从 Git 仓库同步部署状态：

argocd-application.yaml -- GitOps 自动同步

apiVersion: argoproj.io/v1alpha1
kind: Application
metadata:
  name: myapp-production
  namespace: argocd
spec:
  project: default
  source:
    repoURL: https://github.com/myorg/myapp-deploy.git
    targetBranch: main
    path: k8s/production
    kustomize:
      images:
        - ghcr.io/myorg/myapp:v1.2.3
  destination:
    server: https://kubernetes.default.svc
    namespace: production
  syncPolicy:
    automated:
      prune: true
      selfHeal: true
    syncOptions:
      - CreateNamespace=true
      - ApplyOutOfSyncOnly=true

通过 Claude Code 结合上述 Docker 工作流，开发者可以用自然语言描述需求，由 AI 自动生成符合最佳实践的容器化配置，将 DevOps 效率提升到新的高度。