2025年02月13日

Kubernetes多叢集管理與外部服務整合

深入探討Kubernetes多叢集管理的現代方法與最佳實踐，涵蓋Operator模式自動化、GitOps工作流程、外部服務整合策略，以及跨叢集服務發現與網路架構設計

容器技術 DevOps

Kubernetes 多叢集管理 Operator GitOps 外部服務整合服務網格

企業級Kubernetes環境的複雜度隨著業務規模擴張而急遽攀升，單一叢集架構已難以滿足高可用性、地理分散部署、法規遵循以及資源隔離等多元需求。多叢集管理成為現代雲原生架構的核心議題，它不僅涉及技術層面的叢集協調與資源調度，更牽涉組織流程、安全治理以及營運效率的全面考量。傳統的手動管理方式在面對數十甚至數百個叢集時顯得力不從心，組態漂移、版本不一致以及故障排查困難等問題層出不窮。本文將深入探討Kubernetes多叢集管理的現代化方法，從Operator模式的自動化能力到GitOps的宣告式管理哲學，再到外部服務整合的實務策略，為讀者建構完整的多叢集管理知識體系。

@startuml
!define PLANTUML_FORMAT svg
!theme _none_

skinparam dpi auto
skinparam shadowing false
skinparam linetype ortho
skinparam roundcorner 5
skinparam defaultFontName "Microsoft JhengHei UI"
skinparam defaultFontSize 16
skinparam minClassWidth 100

rectangle "多叢集管理生態系統" as ecosystem {
    rectangle "管理層" as management {
        component "Operator模式" as operator
        component "GitOps工作流" as gitops
        component "聯邦控制平面" as federation
    }

    rectangle "工具層" as tools {
        component "Flux CD" as flux
        component "ArgoCD" as argo
        component "Rancher" as rancher
        component "Gardener" as gardener
    }

    rectangle "叢集層" as clusters {
        component "生產叢集" as prod
        component "開發叢集" as dev
        component "邊緣叢集" as edge
    }

    rectangle "整合層" as integration {
        component "外部服務" as external
        component "服務網格" as mesh
        component "DNS整合" as dns
    }
}

operator --> flux
operator --> argo
gitops --> flux
gitops --> argo
federation --> rancher
federation --> gardener

flux --> prod
flux --> dev
argo --> prod
argo --> edge
rancher --> prod
rancher --> dev
rancher --> edge

prod --> external
prod --> mesh
dev --> dns
edge --> mesh

@enduml

Kubernetes多叢集架構的設計需要考量多個維度的因素。首先是故障隔離的需求，將不同業務單元或服務等級的工作負載分散到獨立叢集中，可以有效限制故障的影響範圍，避免單點故障導致全面性的服務中斷。其次是法規遵循的要求，特定產業如金融、醫療必須將資料儲存在特定地理區域，多叢集架構可以滿足資料主權與隱私保護的法規需求。第三是效能最佳化的考量，透過在不同地理位置部署叢集，可以降低使用者存取延遲，提升整體服務品質。第四是資源最佳化的目標，根據工作負載特性選擇最適合的基礎設施，例如將GPU密集型工作負載部署到配備專用硬體的叢集中。

多叢集管理面臨的挑戰是多方面的。組態一致性是首要問題，當叢集數量增加時，確保所有叢集維持相同的組態標準變得極為困難，手動操作容易導致組態漂移。可觀測性整合是另一個挑戰，需要建立統一的監控、日誌收集與追蹤系統，以便從全局視角理解系統狀態。網路連通性也是關鍵議題，跨叢集的服務發現與流量管理需要精心設計的網路架構。安全治理則要求在多叢集環境中實施一致的存取控制、密鑰管理與稽核政策。

Operator模式的出現為Kubernetes自動化管理開創了新的篇章。CoreOS團隊在2016年首次提出這個概念，其核心思想是將人類運維人員的領域知識編碼到軟體中，透過程式化的方式執行複雜的運維任務。Operator本質上是一個自訂控制器，它監聽特定的Kubernetes資源變化，並根據預定義的邏輯執行相應的操作。這種模式將Kubernetes的控制迴圈概念延伸到應用層面，使得複雜應用的部署、擴展、備份與故障恢復等操作可以完全自動化。

自訂資源定義是Operator模式的基礎構件。CRD允許使用者擴展Kubernetes API，定義新的資源類型。這些自訂資源代表了特定應用或服務的期望狀態，而Operator則負責確保實際狀態與期望狀態保持一致。以Prometheus Operator為例，它引入了Prometheus、ServiceMonitor、PodMonitor、PrometheusRule以及AlertManager等自訂資源，使用者只需透過這些高階抽象來描述監控需求，Operator就會自動處理底層的所有細節。

# Prometheus Operator 自訂資源定義範例
# 這個組態定義了一個高可用的 Prometheus 叢集
# 包含副本數量、資源限制、持久化儲存以及服務監控選擇器
apiVersion: monitoring.coreos.com/v1
kind: Prometheus
metadata:
  # Prometheus 實例名稱
  # 這個名稱會用於生成相關的 StatefulSet 和 Service
  name: prometheus-production
  # 部署到 monitoring 命名空間
  # 集中管理所有監控相關資源
  namespace: monitoring
  labels:
    # 標籤用於識別這是生產環境的 Prometheus
    app: prometheus
    environment: production
spec:
  # 副本數量設為 2 以實現高可用
  # Prometheus 會自動處理資料複製
  replicas: 2
  # 服務帳戶用於 Prometheus 存取 Kubernetes API
  # 需要適當的 RBAC 權限來發現監控目標
  serviceAccountName: prometheus
  # 選擇要監控的 ServiceMonitor 資源
  # 使用標籤選擇器來篩選
  serviceMonitorSelector:
    matchLabels:
      # 只監控標記為 prometheus: enabled 的 ServiceMonitor
      prometheus: enabled
  # 選擇要監控的 PodMonitor 資源
  podMonitorSelector:
    matchLabels:
      prometheus: enabled
  # 資源請求與限制
  # 確保 Prometheus 有足夠的資源處理監控資料
  resources:
    requests:
      # 請求 2 個 CPU 核心
      cpu: "2"
      # 請求 4GB 記憶體
      memory: 4Gi
    limits:
      # 限制最多使用 4 個 CPU 核心
      cpu: "4"
      # 限制最多使用 8GB 記憶體
      memory: 8Gi
  # 持久化儲存組態
  # 確保 Prometheus 資料在 Pod 重啟後不會遺失
  storage:
    volumeClaimTemplate:
      spec:
        # 使用 SSD 儲存類別以獲得更好的 I/O 效能
        storageClassName: ssd-storage
        # 存取模式為單節點讀寫
        accessModes:
          - ReadWriteOnce
        resources:
          requests:
            # 請求 100GB 儲存空間
            storage: 100Gi
  # 資料保留期限
  # 保留 30 天的監控資料
  retention: 30d
  # 外部標籤會附加到所有指標
  # 用於在多叢集環境中識別資料來源
  externalLabels:
    cluster: production-cluster-01
    region: asia-east1

自訂控制器是Operator模式的執行引擎。控制器持續監聽Kubernetes API伺服器，當自訂資源發生變化時，控制器會被觸發並執行相應的協調邏輯。這個過程稱為協調迴圈，它會比較資源的期望狀態與實際狀態，然後執行必要的操作來消除差異。控制器的設計通常遵循冪等性原則，意即多次執行相同操作應該產生相同結果，這確保了系統的最終一致性。

Elasticsearch Operator展示了Operator模式處理複雜分散式系統的能力。Elasticsearch叢集的管理涉及節點角色分配、分片平衡、索引生命週期管理以及滾動升級等複雜操作。傳統上這些操作需要深厚的專業知識和大量手動干預，但透過Operator，這些複雜性被封裝在控制器邏輯中，使用者只需要聲明期望的叢集規格即可。

# Elasticsearch Operator 自訂資源定義範例
# 定義一個具有多種節點角色的 Elasticsearch 叢集
apiVersion: elasticsearch.k8s.elastic.co/v1
kind: Elasticsearch
metadata:
  # Elasticsearch 叢集名稱
  name: elasticsearch-production
  namespace: elastic-system
spec:
  # Elasticsearch 版本
  # Operator 會自動處理版本升級
  version: 8.11.0
  # 節點集合定義
  # 可以定義多個節點集合，每個有不同的角色和規格
  nodeSets:
    # 主節點集合
    # 負責叢集管理和元資料操作
    - name: master
      # 主節點數量
      # 建議使用奇數以避免腦裂問題
      count: 3
      config:
        # 節點角色設定
        # 主節點只負責叢集協調
        node.roles: ["master"]
        # 禁用機器學習功能以節省資源
        xpack.ml.enabled: false
      # Pod 模板用於自訂 Pod 規格
      podTemplate:
        spec:
          containers:
            - name: elasticsearch
              resources:
                requests:
                  # 主節點資源需求較低
                  cpu: "1"
                  memory: 2Gi
                limits:
                  cpu: "2"
                  memory: 4Gi
      # 持久化儲存組態
      volumeClaimTemplates:
        - metadata:
            name: elasticsearch-data
          spec:
            accessModes:
              - ReadWriteOnce
            resources:
              requests:
                # 主節點儲存需求較小
                storage: 10Gi
            storageClassName: ssd-storage
    # 資料節點集合
    # 負責資料儲存和搜尋操作
    - name: data
      # 資料節點數量
      count: 6
      config:
        # 資料節點角色
        node.roles: ["data", "ingest"]
        # 啟用資料分層儲存
        node.attr.data: hot
      podTemplate:
        spec:
          # 節點親和性設定
          # 確保資料節點分散到不同的可用區
          affinity:
            podAntiAffinity:
              requiredDuringSchedulingIgnoredDuringExecution:
                - labelSelector:
                    matchLabels:
                      elasticsearch.k8s.elastic.co/cluster-name: elasticsearch-production
                      elasticsearch.k8s.elastic.co/statefulset-name: elasticsearch-production-es-data
                  topologyKey: topology.kubernetes.io/zone
          containers:
            - name: elasticsearch
              resources:
                requests:
                  # 資料節點需要較多資源
                  cpu: "4"
                  memory: 16Gi
                limits:
                  cpu: "8"
                  memory: 32Gi
      volumeClaimTemplates:
        - metadata:
            name: elasticsearch-data
          spec:
            accessModes:
              - ReadWriteOnce
            resources:
              requests:
                # 資料節點需要大量儲存空間
                storage: 500Gi
            storageClassName: ssd-storage
  # HTTP 組態
  http:
    tls:
      # 啟用自簽憑證
      # Operator 會自動管理憑證生命週期
      selfSignedCertificate:
        disabled: false

GitOps代表了基礎設施管理的典範轉移，它將軟體開發的最佳實踐引入到運維領域。GitOps的核心原則是將Git儲存庫作為系統期望狀態的唯一可信來源，所有的組態變更都必須透過Git提交來完成，而自動化系統則負責將這些變更套用到目標環境。這種方法帶來了多項顯著優勢，包括完整的變更歷史記錄、簡化的回滾機制、透明的審計軌跡以及一致的部署流程。

Weaveworks作為GitOps概念的主要推廣者，開發了Flux這個工具來實現GitOps工作流程。Flux持續監控指定的Git儲存庫，當偵測到變更時，它會自動將變更同步到Kubernetes叢集。這種拉取式的部署模型與傳統的推送式部署相比具有更好的安全性，因為叢集內的元件主動拉取組態，而不是由外部系統推送，這減少了攻擊面並簡化了網路組態。

# Flux GitRepository 組態範例
# 定義 Flux 要監控的 Git 儲存庫
apiVersion: source.toolkit.fluxcd.io/v1
kind: GitRepository
metadata:
  # GitRepository 資源名稱
  name: infrastructure-repo
  # 部署到 flux-system 命名空間
  namespace: flux-system
spec:
  # 同步間隔
  # Flux 每分鐘檢查一次 Git 儲存庫的變更
  interval: 1m
  # Git 儲存庫 URL
  url: https://github.com/myorg/infrastructure
  # 要追蹤的分支
  ref:
    branch: main
  # 存取憑證
  # 參考包含 SSH 金鑰或存取令牌的 Secret
  secretRef:
    name: git-credentials
  # 忽略特定路徑
  # 避免不必要的同步觸發
  ignore: |
    # 忽略文件目錄
    /docs/
    # 忽略測試檔案
    /**/*_test.yaml
---
# Flux Kustomization 組態範例
# 定義如何將 Git 儲存庫中的組態套用到叢集
apiVersion: kustomize.toolkit.fluxcd.io/v1
kind: Kustomization
metadata:
  # Kustomization 資源名稱
  name: infrastructure
  namespace: flux-system
spec:
  # 同步間隔
  interval: 10m
  # 來源參考
  # 指向前面定義的 GitRepository
  sourceRef:
    kind: GitRepository
    name: infrastructure-repo
  # Git 儲存庫中的路徑
  # Flux 會套用這個目錄下的所有 Kubernetes 資源
  path: ./clusters/production
  # 啟用修剪功能
  # 當資源從 Git 移除時，也會從叢集中刪除
  prune: true
  # 健康檢查超時
  timeout: 5m
  # 啟用等待功能
  # 確保資源完全就緒後才繼續
  wait: true
  # 變數替換
  # 支援環境特定的組態
  postBuild:
    substitute:
      CLUSTER_NAME: production-cluster-01
      ENVIRONMENT: production
    substituteFrom:
      - kind: ConfigMap
        name: cluster-config

ArgoCD是另一個廣受歡迎的GitOps工具，它提供了豐富的視覺化介面和應用程式管理功能。ArgoCD採用應用程式作為核心抽象，每個應用程式對應到Git儲存庫中的一組Kubernetes資源。它支援多種組態管理工具，包括Kustomize、Helm以及純YAML，並提供了詳細的同步狀態、健康狀態以及資源樹狀視圖。

# ArgoCD Application 組態範例
# 定義一個由 ArgoCD 管理的應用程式
apiVersion: argoproj.io/v1alpha1
kind: Application
metadata:
  # 應用程式名稱
  name: microservice-platform
  # ArgoCD 應用程式必須部署在 argocd 命名空間
  namespace: argocd
  # 終結器確保應用程式刪除時相關資源也被清理
  finalizers:
    - resources-finalizer.argocd.argoproj.io
spec:
  # 專案參考
  # 用於存取控制和資源限制
  project: production
  # 來源組態
  # 定義應用程式的 Git 儲存庫位置
  source:
    # Git 儲存庫 URL
    repoURL: https://github.com/myorg/microservices
    # 目標修訂版本
    # 可以是分支名、標籤或提交 SHA
    targetRevision: HEAD
    # Git 儲存庫中的路徑
    path: apps/microservice-platform
    # Helm 組態
    # 如果應用程式使用 Helm Chart
    helm:
      # Helm values 檔案
      valueFiles:
        - values-production.yaml
      # 額外的 Helm 參數
      parameters:
        - name: image.tag
          value: "v2.3.1"
        - name: replicas
          value: "5"
  # 目標叢集組態
  destination:
    # 目標 Kubernetes API 伺服器
    # https://kubernetes.default.svc 表示 ArgoCD 所在的叢集
    server: https://kubernetes.default.svc
    # 目標命名空間
    namespace: microservices
  # 同步策略
  syncPolicy:
    # 自動同步組態
    automated:
      # 啟用自動修剪
      # 當資源從 Git 移除時也從叢集刪除
      prune: true
      # 啟用自我修復
      # 當叢集狀態與 Git 不符時自動修復
      selfHeal: true
      # 允許同步空白應用程式
      allowEmpty: false
    # 同步選項
    syncOptions:
      # 驗證資源
      - Validate=true
      # 建立命名空間
      - CreateNamespace=true
      # 伺服器端套用
      - ServerSideApply=true
    # 重試策略
    retry:
      limit: 5
      backoff:
        duration: 5s
        factor: 2
        maxDuration: 3m
  # 忽略差異
  # 某些欄位可能被動態修改，忽略這些差異
  ignoreDifferences:
    - group: apps
      kind: Deployment
      jsonPointers:
        - /spec/replicas

多叢集管理的實務操作需要一套完善的工具鏈。kubectx和kubens是兩個輕量級但極為實用的工具，它們簡化了在多個叢集上下文和命名空間之間切換的操作。kubectx允許使用者快速列出和切換Kubernetes上下文，而kubens則提供了類似的功能來管理命名空間。這些工具雖然簡單，但在日常操作中可以顯著提升效率。

#!/bin/bash
# 多叢集管理腳本範例
# 這個腳本展示了如何自動化多叢集的常見管理任務

# 定義叢集組態陣列
# 每個項目包含叢集名稱和上下文名稱
declare -A CLUSTERS
CLUSTERS["production"]="aks-production-eastasia"
CLUSTERS["staging"]="aks-staging-eastasia"
CLUSTERS["development"]="minikube"

# 函式：列出所有叢集的節點狀態
# 這個函式遍歷所有叢集並顯示節點資訊
list_all_nodes() {
    echo "=========================================="
    echo "多叢集節點狀態報告"
    echo "=========================================="

    # 遍歷所有叢集
    for cluster_name in "${!CLUSTERS[@]}"; do
        context="${CLUSTERS[$cluster_name]}"
        echo ""
        echo "叢集: $cluster_name (上下文: $context)"
        echo "------------------------------------------"

        # 切換到目標叢集上下文
        # --context 參數允許在不改變當前上下文的情況下執行命令
        kubectl --context="$context" get nodes \
            -o custom-columns=\
'NAME:.metadata.name,'\
'STATUS:.status.conditions[?(@.type=="Ready")].status,'\
'VERSION:.status.nodeInfo.kubeletVersion,'\
'CPU:.status.capacity.cpu,'\
'MEMORY:.status.capacity.memory'

        # 檢查命令執行結果
        if [ $? -ne 0 ]; then
            echo "警告: 無法連線到叢集 $cluster_name"
        fi
    done
}

# 函式：同步組態到所有叢集
# 這個函式將指定的 Kubernetes 資源套用到所有叢集
sync_config_to_all() {
    local config_file="$1"

    # 檢查組態檔案是否存在
    if [ ! -f "$config_file" ]; then
        echo "錯誤: 組態檔案 $config_file 不存在"
        return 1
    fi

    echo "同步組態: $config_file"
    echo ""

    # 遍歷所有叢集
    for cluster_name in "${!CLUSTERS[@]}"; do
        context="${CLUSTERS[$cluster_name]}"
        echo "套用到叢集: $cluster_name"

        # 使用 kubectl apply 套用組態
        # --server-side 啟用伺服器端套用以獲得更好的合併行為
        kubectl --context="$context" apply \
            --server-side \
            --force-conflicts \
            -f "$config_file"

        # 檢查執行結果
        if [ $? -eq 0 ]; then
            echo "✓ 成功套用到 $cluster_name"
        else
            echo "✗ 套用到 $cluster_name 失敗"
        fi
        echo ""
    done
}

# 函式：檢查所有叢集的資源使用狀況
# 這個函式收集並顯示各叢集的資源使用指標
check_resource_usage() {
    echo "=========================================="
    echo "多叢集資源使用報告"
    echo "=========================================="

    # 遍歷所有叢集
    for cluster_name in "${!CLUSTERS[@]}"; do
        context="${CLUSTERS[$cluster_name]}"
        echo ""
        echo "叢集: $cluster_name"
        echo "------------------------------------------"

        # 取得節點資源使用狀況
        # 需要安裝 metrics-server
        kubectl --context="$context" top nodes 2>/dev/null

        # 如果 metrics-server 未安裝，顯示替代資訊
        if [ $? -ne 0 ]; then
            echo "提示: 請安裝 metrics-server 以取得資源指標"
            # 顯示節點容量作為替代
            kubectl --context="$context" get nodes \
                -o jsonpath='{range .items[*]}{.metadata.name}{"\t"}{.status.capacity.cpu}{"\t"}{.status.capacity.memory}{"\n"}{end}'
        fi
    done
}

# 函式：備份所有叢集的關鍵資源
# 這個函式將各叢集的重要資源匯出為 YAML 檔案
backup_critical_resources() {
    local backup_dir="$1"
    local timestamp=$(date +%Y%m%d_%H%M%S)

    # 建立備份目錄
    mkdir -p "$backup_dir"

    echo "開始備份 - 時間戳記: $timestamp"
    echo ""

    # 定義要備份的資源類型
    local resource_types=(
        "configmaps"
        "secrets"
        "services"
        "deployments"
        "statefulsets"
        "ingresses"
    )

    # 遍歷所有叢集
    for cluster_name in "${!CLUSTERS[@]}"; do
        context="${CLUSTERS[$cluster_name]}"
        cluster_backup_dir="$backup_dir/$cluster_name/$timestamp"
        mkdir -p "$cluster_backup_dir"

        echo "備份叢集: $cluster_name"

        # 遍歷資源類型
        for resource_type in "${resource_types[@]}"; do
            echo "  備份 $resource_type..."

            # 匯出所有命名空間的資源
            kubectl --context="$context" get "$resource_type" \
                --all-namespaces \
                -o yaml > "$cluster_backup_dir/${resource_type}.yaml" 2>/dev/null
        done

        echo "  備份完成: $cluster_backup_dir"
        echo ""
    done
}

# 主程式進入點
# 根據命令列參數執行相應功能
case "$1" in
    "nodes")
        list_all_nodes
        ;;
    "sync")
        sync_config_to_all "$2"
        ;;
    "usage")
        check_resource_usage
        ;;
    "backup")
        backup_critical_resources "${2:-./backups}"
        ;;
    *)
        echo "使用方法: $0 {nodes|sync|usage|backup}"
        echo ""
        echo "命令說明:"
        echo "  nodes         列出所有叢集的節點狀態"
        echo "  sync <file>   同步組態到所有叢集"
        echo "  usage         檢查所有叢集的資源使用狀況"
        echo "  backup [dir]  備份所有叢集的關鍵資源"
        exit 1
        ;;
esac

Rancher是一個功能全面的多叢集管理平台，它提供了統一的使用者介面來管理橫跨本地、雲端以及邊緣環境的Kubernetes叢集。Rancher的核心優勢在於其簡化了叢集生命週期管理，包括叢集建立、升級以及備份恢復。它整合了使用者認證、存取控制以及稽核日誌功能，使得組織可以在單一平台上實施統一的安全政策。Rancher還提供了應用程式目錄功能，使用者可以透過圖形介面輕鬆部署常見的應用程式和服務。

Gardener採用了獨特的方法來解決多叢集管理問題。它由SAP團隊開發，目標是提供Kubernetes即服務的能力。Gardener的設計哲學是使用Kubernetes來管理Kubernetes叢集，它將叢集本身視為Kubernetes資源，透過CRD和控制器來自動化叢集的整個生命週期。這種方法特別適合需要建構內部Kubernetes平台即服務產品的組織，因為它提供了一致的API來管理不同雲端供應商上的叢集。

Open Cluster Management是一個社群驅動的專案，專注於多叢集和多雲場景下的Kubernetes應用程式管理。它提供了叢集註冊、工作負載分發以及政策管理等功能。OCM採用了中心輻射架構，其中一個中心叢集作為控制平面，管理多個受管叢集。這種架構使得組織可以從單一控制點管理大量叢集，同時保持每個叢集的獨立性。

多叢集管理的最佳實踐涵蓋了多個層面的考量。故障隔離是首要原則，每個叢集的故障範圍應該被嚴格限制，避免級聯故障影響整個系統。這意味著需要仔細規劃叢集邊界，確定哪些工作負載應該部署在同一個叢集中，哪些應該分開。一般而言，具有緊密依賴關係的服務應該放在同一個叢集中以降低延遲，而具有不同安全等級或可用性要求的服務則應該分開部署。

法規遵循和資料治理是許多組織面臨的重要挑戰。不同地區可能有不同的資料保護法規，例如歐盟的GDPR或中國的網路安全法。多叢集架構可以透過在特定地區部署專屬叢集來滿足這些要求。此外，一些產業如金融和醫療有特定的合規標準，例如PCI DSS或HIPAA，可能需要將敏感工作負載部署到經過特殊認證的叢集中。

網路設計是多叢集架構中的關鍵議題。跨叢集的服務發現需要統一的DNS策略，可能需要使用外部DNS或服務網格來實現。流量管理涉及全域負載平衡、故障轉移以及流量分割等功能，通常需要結合雲端供應商的負載平衡服務和專用的流量管理工具。網路安全則需要考慮叢集間的通訊加密、存取控制以及網路分段。

# 多叢集管理器類別範例
# 這個 Python 類別展示了如何程式化管理多個 Kubernetes 叢集

import os
import yaml
import json
from typing import Dict, List, Optional, Any
from datetime import datetime
from kubernetes import client, config
from kubernetes.client.rest import ApiException
from concurrent.futures import ThreadPoolExecutor, as_completed

class MultiClusterManager:
    """
    多叢集管理器

    這個類別提供了統一的介面來管理多個 Kubernetes 叢集
    支援叢集健康檢查、資源同步以及組態管理等功能
    """

    def __init__(self, kubeconfig_path: Optional[str] = None):
        """
        初始化多叢集管理器

        參數:
            kubeconfig_path: kubeconfig 檔案路徑
                           如果未指定，使用預設路徑 ~/.kube/config
        """
        # 設定 kubeconfig 路徑
        self.kubeconfig_path = kubeconfig_path or os.path.expanduser(
            "~/.kube/config"
        )
        # 儲存各叢集的 API 客戶端
        self.cluster_clients: Dict[str, client.CoreV1Api] = {}
        # 儲存各叢集的 Apps API 客戶端
        self.apps_clients: Dict[str, client.AppsV1Api] = {}
        # 載入叢集組態
        self._load_clusters()

    def _load_clusters(self) -> None:
        """
        從 kubeconfig 載入所有叢集組態

        這個方法讀取 kubeconfig 檔案並為每個上下文建立 API 客戶端
        """
        # 載入 kubeconfig 檔案
        # 讀取檔案內容以取得所有上下文
        with open(self.kubeconfig_path, 'r') as f:
            kubeconfig = yaml.safe_load(f)

        # 遍歷所有上下文
        for context in kubeconfig.get('contexts', []):
            context_name = context['name']

            try:
                # 為特定上下文載入組態
                # new_client_from_config 返回一個 API 客戶端
                api_client = config.new_client_from_config(
                    config_file=self.kubeconfig_path,
                    context=context_name
                )

                # 建立 CoreV1Api 客戶端
                # 用於存取 Pod、Service、ConfigMap 等核心資源
                self.cluster_clients[context_name] = client.CoreV1Api(
                    api_client
                )

                # 建立 AppsV1Api 客戶端
                # 用於存取 Deployment、StatefulSet 等應用資源
                self.apps_clients[context_name] = client.AppsV1Api(
                    api_client
                )

                print(f"已載入叢集: {context_name}")

            except Exception as e:
                print(f"載入叢集 {context_name} 失敗: {str(e)}")

    def get_cluster_health(self, cluster_name: str) -> Dict[str, Any]:
        """
        取得指定叢集的健康狀態

        參數:
            cluster_name: 叢集名稱（上下文名稱）

        返回:
            包含叢集健康資訊的字典
        """
        # 檢查叢集是否存在
        if cluster_name not in self.cluster_clients:
            return {
                "cluster": cluster_name,
                "status": "unknown",
                "error": "叢集未找到"
            }

        api = self.cluster_clients[cluster_name]
        health_info = {
            "cluster": cluster_name,
            "timestamp": datetime.utcnow().isoformat(),
            "nodes": [],
            "status": "healthy"
        }

        try:
            # 取得所有節點
            nodes = api.list_node()

            # 檢查每個節點的狀態
            for node in nodes.items:
                node_status = {
                    "name": node.metadata.name,
                    "ready": False,
                    "conditions": []
                }

                # 檢查節點條件
                for condition in node.status.conditions:
                    node_status["conditions"].append({
                        "type": condition.type,
                        "status": condition.status
                    })

                    # 檢查 Ready 條件
                    if condition.type == "Ready":
                        node_status["ready"] = condition.status == "True"

                # 取得節點容量
                node_status["capacity"] = {
                    "cpu": node.status.capacity.get("cpu"),
                    "memory": node.status.capacity.get("memory"),
                    "pods": node.status.capacity.get("pods")
                }

                health_info["nodes"].append(node_status)

                # 如果有節點未就緒，更新整體狀態
                if not node_status["ready"]:
                    health_info["status"] = "degraded"

            # 計算節點統計
            health_info["node_count"] = len(health_info["nodes"])
            health_info["ready_nodes"] = sum(
                1 for n in health_info["nodes"] if n["ready"]
            )

        except ApiException as e:
            health_info["status"] = "error"
            health_info["error"] = str(e)

        return health_info

    def get_all_clusters_health(self) -> List[Dict[str, Any]]:
        """
        取得所有叢集的健康狀態

        使用多執行緒並行檢查以提高效率

        返回:
            包含所有叢集健康資訊的列表
        """
        results = []

        # 使用 ThreadPoolExecutor 並行執行
        with ThreadPoolExecutor(max_workers=10) as executor:
            # 提交所有任務
            future_to_cluster = {
                executor.submit(
                    self.get_cluster_health, cluster_name
                ): cluster_name
                for cluster_name in self.cluster_clients.keys()
            }

            # 收集結果
            for future in as_completed(future_to_cluster):
                cluster_name = future_to_cluster[future]
                try:
                    result = future.result()
                    results.append(result)
                except Exception as e:
                    results.append({
                        "cluster": cluster_name,
                        "status": "error",
                        "error": str(e)
                    })

        return results

    def sync_configmap(
        self,
        source_cluster: str,
        source_namespace: str,
        configmap_name: str,
        target_clusters: List[str],
        target_namespace: Optional[str] = None
    ) -> Dict[str, str]:
        """
        將 ConfigMap 從來源叢集同步到目標叢集

        參數:
            source_cluster: 來源叢集名稱
            source_namespace: 來源命名空間
            configmap_name: ConfigMap 名稱
            target_clusters: 目標叢集列表
            target_namespace: 目標命名空間，如果未指定則使用來源命名空間

        返回:
            包含每個目標叢集同步結果的字典
        """
        results = {}

        # 使用來源命名空間作為預設目標命名空間
        if target_namespace is None:
            target_namespace = source_namespace

        # 從來源叢集讀取 ConfigMap
        try:
            source_api = self.cluster_clients[source_cluster]
            configmap = source_api.read_namespaced_config_map(
                name=configmap_name,
                namespace=source_namespace
            )

            # 清理元資料以便在其他叢集中建立
            # 移除叢集特定的欄位
            configmap.metadata.resource_version = None
            configmap.metadata.uid = None
            configmap.metadata.creation_timestamp = None
            configmap.metadata.namespace = target_namespace

        except ApiException as e:
            return {
                "error": f"無法從來源叢集讀取 ConfigMap: {str(e)}"
            }

        # 同步到每個目標叢集
        for target_cluster in target_clusters:
            if target_cluster not in self.cluster_clients:
                results[target_cluster] = "叢集未找到"
                continue

            target_api = self.cluster_clients[target_cluster]

            try:
                # 嘗試更新現有的 ConfigMap
                target_api.replace_namespaced_config_map(
                    name=configmap_name,
                    namespace=target_namespace,
                    body=configmap
                )
                results[target_cluster] = "已更新"

            except ApiException as e:
                if e.status == 404:
                    # ConfigMap 不存在，建立新的
                    try:
                        target_api.create_namespaced_config_map(
                            namespace=target_namespace,
                            body=configmap
                        )
                        results[target_cluster] = "已建立"
                    except ApiException as create_error:
                        results[target_cluster] = f"建立失敗: {str(create_error)}"
                else:
                    results[target_cluster] = f"更新失敗: {str(e)}"

        return results

    def get_cross_cluster_service_status(
        self,
        service_name: str,
        namespace: str
    ) -> Dict[str, Any]:
        """
        取得跨叢集的服務狀態

        檢查指定服務在所有叢集中的部署狀態

        參數:
            service_name: 服務名稱
            namespace: 命名空間

        返回:
            包含所有叢集中服務狀態的字典
        """
        status = {
            "service_name": service_name,
            "namespace": namespace,
            "clusters": {}
        }

        for cluster_name, api in self.cluster_clients.items():
            cluster_status = {
                "service_exists": False,
                "deployment_exists": False,
                "ready_replicas": 0,
                "desired_replicas": 0
            }

            # 檢查 Service 是否存在
            try:
                service = api.read_namespaced_service(
                    name=service_name,
                    namespace=namespace
                )
                cluster_status["service_exists"] = True
                cluster_status["service_type"] = service.spec.type
                cluster_status["cluster_ip"] = service.spec.cluster_ip

            except ApiException:
                pass

            # 檢查 Deployment 是否存在
            try:
                apps_api = self.apps_clients[cluster_name]
                deployment = apps_api.read_namespaced_deployment(
                    name=service_name,
                    namespace=namespace
                )
                cluster_status["deployment_exists"] = True
                cluster_status["desired_replicas"] = deployment.spec.replicas or 0
                cluster_status["ready_replicas"] = (
                    deployment.status.ready_replicas or 0
                )
                cluster_status["available_replicas"] = (
                    deployment.status.available_replicas or 0
                )

            except ApiException:
                pass

            status["clusters"][cluster_name] = cluster_status

        return status

    def generate_health_report(self) -> str:
        """
        產生多叢集健康報告

        返回:
            格式化的健康報告字串
        """
        # 取得所有叢集健康狀態
        health_data = self.get_all_clusters_health()

        # 建立報告
        report_lines = [
            "=" * 60,
            "多叢集健康報告",
            f"產生時間: {datetime.utcnow().isoformat()}",
            "=" * 60,
            ""
        ]

        # 統計總覽
        total_clusters = len(health_data)
        healthy_clusters = sum(
            1 for h in health_data if h.get("status") == "healthy"
        )
        degraded_clusters = sum(
            1 for h in health_data if h.get("status") == "degraded"
        )
        error_clusters = total_clusters - healthy_clusters - degraded_clusters

        report_lines.extend([
            "總覽:",
            f"  總叢集數: {total_clusters}",
            f"  健康叢集: {healthy_clusters}",
            f"  降級叢集: {degraded_clusters}",
            f"  錯誤叢集: {error_clusters}",
            ""
        ])

        # 各叢集詳細資訊
        report_lines.append("叢集詳細資訊:")
        report_lines.append("-" * 60)

        for cluster_health in health_data:
            cluster_name = cluster_health.get("cluster", "未知")
            status = cluster_health.get("status", "未知")

            report_lines.append(f"\n叢集: {cluster_name}")
            report_lines.append(f"  狀態: {status}")

            if "error" in cluster_health:
                report_lines.append(f"  錯誤: {cluster_health['error']}")

            if "nodes" in cluster_health:
                node_count = cluster_health.get("node_count", 0)
                ready_nodes = cluster_health.get("ready_nodes", 0)
                report_lines.append(f"  節點: {ready_nodes}/{node_count} 就緒")

                # 列出未就緒的節點
                for node in cluster_health["nodes"]:
                    if not node.get("ready"):
                        report_lines.append(
                            f"    - {node['name']}: 未就緒"
                        )

        report_lines.append("\n" + "=" * 60)

        return "\n".join(report_lines)

# 使用範例
if __name__ == "__main__":
    # 建立多叢集管理器實例
    manager = MultiClusterManager()

    # 產生並輸出健康報告
    report = manager.generate_health_report()
    print(report)

    # 取得特定服務的跨叢集狀態
    service_status = manager.get_cross_cluster_service_status(
        service_name="api-gateway",
        namespace="production"
    )
    print("\n跨叢集服務狀態:")
    print(json.dumps(service_status, indent=2, ensure_ascii=False))

外部服務整合是多叢集管理中的重要議題，因為現實世界的系統很少是完全自包含的。Kubernetes叢集中的服務通常需要存取位於叢集外部的資源，例如傳統的資料庫伺服器、訊息佇列系統或第三方API。反過來，外部系統也可能需要存取Kubernetes叢集中的服務。有效的外部服務整合策略可以使混合架構平滑過渡，同時保持服務發現和負載平衡的一致性。

將外部服務引入Kubernetes叢集的第一步是確保網路連通性。根據叢集的部署環境，這可能涉及VPC對等連線、VPN隧道或專用線路。大多數雲端供應商的Kubernetes服務都允許將叢集部署到使用者指定的虛擬網路中，這使得叢集可以直接存取同一網路中的其他資源。對於跨區域或跨雲端的場景，可能需要更複雜的網路組態。

當網路連通性建立後，下一步是讓外部服務在Kubernetes服務發現機制中可見。Kubernetes使用DNS進行服務發現，因此需要在叢集DNS中為外部服務建立對應的記錄。這可以透過無選擇器服務或ExternalName服務來實現。無選擇器服務允許手動指定服務的端點IP位址，而ExternalName服務則使用CNAME記錄將服務名稱對映到外部DNS名稱。

# 無選擇器服務範例
# 用於將外部資料庫整合到 Kubernetes 服務發現中
# 這種方法適用於外部服務具有穩定 IP 位址的情況
apiVersion: v1
kind: Service
metadata:
  # 服務名稱
  # Pod 可以使用這個名稱存取外部資料庫
  name: external-database
  namespace: production
  labels:
    app: database
    type: external
spec:
  # 注意：沒有定義 selector
  # 這表示 Kubernetes 不會自動管理端點
  ports:
    # MySQL 連接埠
    - name: mysql
      protocol: TCP
      port: 3306
      targetPort: 3306
    # 監控連接埠
    - name: metrics
      protocol: TCP
      port: 9104
      targetPort: 9104
---
# 端點資源
# 手動定義服務的後端 IP 位址
apiVersion: v1
kind: Endpoints
metadata:
  # 名稱必須與服務名稱完全相同
  # 這是 Kubernetes 關聯服務和端點的方式
  name: external-database
  namespace: production
subsets:
  - addresses:
      # 主要資料庫伺服器
      - ip: 10.0.1.100
        # 可選：設定節點名稱用於拓撲感知路由
        nodeName: db-primary
      # 備用資料庫伺服器
      - ip: 10.0.1.101
        nodeName: db-secondary
    ports:
      - name: mysql
        port: 3306
        protocol: TCP
      - name: metrics
        port: 9104
        protocol: TCP
---
# ExternalName 服務範例
# 用於外部服務具有穩定 DNS 名稱但沒有固定 IP 的情況
# 例如雲端供應商的受管服務
apiVersion: v1
kind: Service
metadata:
  # 服務名稱
  name: external-cache
  namespace: production
  labels:
    app: cache
    type: external
spec:
  # ExternalName 類型會建立 CNAME 記錄
  type: ExternalName
  # 外部服務的 DNS 名稱
  # 對 external-cache 的查詢會被解析為此名稱
  externalName: redis-cluster.cache.svc.external
  # 連接埠定義是可選的，主要用於文件目的
  ports:
    - name: redis
      port: 6379
      protocol: TCP

在某些複雜場景中，外部服務可能沒有穩定的IP位址或DNS名稱。例如，服務可能部署在動態分配IP的環境中，或者需要從雲端供應商的API動態取得端點資訊。在這種情況下，可以實作自訂控制器來自動更新服務端點。這個控制器會定期查詢外部系統以取得最新的端點資訊，然後更新Kubernetes中的Endpoints資源。

// 外部服務端點控制器範例
// 這個 Go 程式碼展示了如何實作自訂控制器
// 用於動態更新外部服務的端點

package main

import (
	"context"
	"encoding/json"
	"fmt"
	"io/ioutil"
	"net/http"
	"time"

	corev1 "k8s.io/api/core/v1"
	metav1 "k8s.io/apimachinery/pkg/apis/meta/v1"
	"k8s.io/client-go/kubernetes"
	"k8s.io/client-go/rest"
)

// ExternalServiceEndpoint 代表外部服務的端點資訊
// 這個結構對應外部服務 API 返回的資料格式
type ExternalServiceEndpoint struct {
	// IP 位址
	Address string `json:"address"`
	// 連接埠
	Port    int32  `json:"port"`
	// 健康狀態
	Healthy bool   `json:"healthy"`
	// 區域
	Zone    string `json:"zone"`
}

// EndpointController 管理外部服務端點的控制器
type EndpointController struct {
	// Kubernetes 客戶端
	clientset *kubernetes.Clientset
	// 外部服務 API 端點
	externalAPIURL string
	// 服務名稱
	serviceName string
	// 命名空間
	namespace string
	// 同步間隔
	syncInterval time.Duration
}

// NewEndpointController 建立新的端點控制器實例
// 參數:
//   - externalAPIURL: 外部服務 API 的 URL
//   - serviceName: 要管理的 Kubernetes 服務名稱
//   - namespace: 服務所在的命名空間
//   - syncInterval: 同步間隔
func NewEndpointController(
	externalAPIURL string,
	serviceName string,
	namespace string,
	syncInterval time.Duration,
) (*EndpointController, error) {
	// 使用叢集內組態
	// 這假設控制器運行在 Kubernetes 叢集內
	config, err := rest.InClusterConfig()
	if err != nil {
		return nil, fmt.Errorf("無法取得叢集組態: %w", err)
	}

	// 建立 Kubernetes 客戶端
	clientset, err := kubernetes.NewForConfig(config)
	if err != nil {
		return nil, fmt.Errorf("無法建立 Kubernetes 客戶端: %w", err)
	}

	return &EndpointController{
		clientset:      clientset,
		externalAPIURL: externalAPIURL,
		serviceName:    serviceName,
		namespace:      namespace,
		syncInterval:   syncInterval,
	}, nil
}

// Run 啟動控制器的主迴圈
// 這個方法會持續運行，直到 context 被取消
func (c *EndpointController) Run(ctx context.Context) error {
	fmt.Printf("啟動端點控制器，服務: %s/%s\n", c.namespace, c.serviceName)

	// 建立定時器
	ticker := time.NewTicker(c.syncInterval)
	defer ticker.Stop()

	// 立即執行一次同步
	if err := c.syncEndpoints(ctx); err != nil {
		fmt.Printf("初始同步失敗: %v\n", err)
	}

	// 主迴圈
	for {
		select {
		case <-ctx.Done():
			// context 被取消，退出迴圈
			fmt.Println("控制器收到停止信號")
			return ctx.Err()
		case <-ticker.C:
			// 定時同步
			if err := c.syncEndpoints(ctx); err != nil {
				fmt.Printf("同步端點失敗: %v\n", err)
			}
		}
	}
}

// syncEndpoints 從外部 API 取得端點並更新 Kubernetes
func (c *EndpointController) syncEndpoints(ctx context.Context) error {
	// 從外部 API 取得端點列表
	endpoints, err := c.fetchExternalEndpoints(ctx)
	if err != nil {
		return fmt.Errorf("取得外部端點失敗: %w", err)
	}

	// 篩選健康的端點
	var healthyAddresses []corev1.EndpointAddress
	var ports []corev1.EndpointPort

	for _, ep := range endpoints {
		if ep.Healthy {
			healthyAddresses = append(healthyAddresses, corev1.EndpointAddress{
				IP: ep.Address,
			})
		}
	}

	// 如果有健康的端點，使用第一個端點的連接埠
	if len(endpoints) > 0 {
		ports = []corev1.EndpointPort{
			{
				Name:     "default",
				Port:     endpoints[0].Port,
				Protocol: corev1.ProtocolTCP,
			},
		}
	}

	// 建立 Endpoints 資源
	k8sEndpoints := &corev1.Endpoints{
		ObjectMeta: metav1.ObjectMeta{
			Name:      c.serviceName,
			Namespace: c.namespace,
			Labels: map[string]string{
				"managed-by": "external-endpoint-controller",
			},
		},
		Subsets: []corev1.EndpointSubset{
			{
				Addresses: healthyAddresses,
				Ports:     ports,
			},
		},
	}

	// 更新 Kubernetes 中的端點
	// 首先嘗試更新，如果不存在則建立
	_, err = c.clientset.CoreV1().Endpoints(c.namespace).Update(
		ctx,
		k8sEndpoints,
		metav1.UpdateOptions{},
	)

	if err != nil {
		// 如果端點不存在，嘗試建立
		_, err = c.clientset.CoreV1().Endpoints(c.namespace).Create(
			ctx,
			k8sEndpoints,
			metav1.CreateOptions{},
		)
		if err != nil {
			return fmt.Errorf("建立端點失敗: %w", err)
		}
		fmt.Printf("已建立端點，健康端點數: %d\n", len(healthyAddresses))
	} else {
		fmt.Printf("已更新端點，健康端點數: %d\n", len(healthyAddresses))
	}

	return nil
}

// fetchExternalEndpoints 從外部 API 取得端點資訊
func (c *EndpointController) fetchExternalEndpoints(
	ctx context.Context,
) ([]ExternalServiceEndpoint, error) {
	// 建立 HTTP 請求
	req, err := http.NewRequestWithContext(ctx, "GET", c.externalAPIURL, nil)
	if err != nil {
		return nil, err
	}

	// 發送請求
	client := &http.Client{Timeout: 10 * time.Second}
	resp, err := client.Do(req)
	if err != nil {
		return nil, err
	}
	defer resp.Body.Close()

	// 檢查回應狀態
	if resp.StatusCode != http.StatusOK {
		return nil, fmt.Errorf("API 返回非 200 狀態碼: %d", resp.StatusCode)
	}

	// 讀取回應內容
	body, err := ioutil.ReadAll(resp.Body)
	if err != nil {
		return nil, err
	}

	// 解析 JSON
	var endpoints []ExternalServiceEndpoint
	if err := json.Unmarshal(body, &endpoints); err != nil {
		return nil, err
	}

	return endpoints, nil
}

func main() {
	// 建立控制器
	controller, err := NewEndpointController(
		"http://service-registry.internal/api/endpoints",
		"external-service",
		"production",
		30*time.Second,
	)
	if err != nil {
		panic(err)
	}

	// 執行控制器
	ctx := context.Background()
	if err := controller.Run(ctx); err != nil {
		panic(err)
	}
}

將Kubernetes服務匯出到外部環境是整合的另一個面向。當外部系統需要存取Kubernetes叢集中的服務時，可以使用內部負載平衡器或NodePort。內部負載平衡器在雲端環境中特別有用，它會在虛擬網路內分配一個可路由的IP位址，使得同一網路中的其他資源可以存取該服務。NodePort則在每個節點上開放一個特定連接埠，外部流量可以透過任意節點的IP位址和該連接埠存取服務。

# 內部負載平衡器服務範例
# 用於將 Kubernetes 服務匯出到虛擬網路
# 這個範例展示了不同雲端供應商的組態方式
apiVersion: v1
kind: Service
metadata:
  name: internal-api-gateway
  namespace: production
  annotations:
    # Azure 內部負載平衡器
    # 這個註解告訴 Azure 建立內部 LB 而非公開 LB
    service.beta.kubernetes.io/azure-load-balancer-internal: "true"
    # 指定內部 LB 的子網路
    service.beta.kubernetes.io/azure-load-balancer-internal-subnet: "internal-subnet"

    # AWS 內部負載平衡器（如果使用 AWS）
    # service.beta.kubernetes.io/aws-load-balancer-internal: "true"
    # service.beta.kubernetes.io/aws-load-balancer-scheme: "internal"

    # GCP 內部負載平衡器（如果使用 GCP）
    # cloud.google.com/load-balancer-type: "Internal"
    # networking.gke.io/internal-load-balancer-subnet: "internal-subnet"
spec:
  # LoadBalancer 類型會請求雲端供應商分配負載平衡器
  type: LoadBalancer
  # 選擇器定義要路由到的 Pod
  selector:
    app: api-gateway
    environment: production
  ports:
    # HTTPS 連接埠
    - name: https
      protocol: TCP
      port: 443
      targetPort: 8443
    # gRPC 連接埠
    - name: grpc
      protocol: TCP
      port: 9090
      targetPort: 9090
  # 會話親和性
  # ClientIP 確保同一客戶端的請求路由到同一 Pod
  sessionAffinity: ClientIP
  sessionAffinityConfig:
    clientIP:
      timeoutSeconds: 3600
---
# NodePort 服務範例
# 用於本地部署環境，沒有雲端負載平衡器
apiVersion: v1
kind: Service
metadata:
  name: external-web-service
  namespace: production
spec:
  # NodePort 類型在每個節點上開放連接埠
  type: NodePort
  selector:
    app: web-service
  ports:
    - name: http
      protocol: TCP
      # 服務連接埠
      port: 80
      # Pod 連接埠
      targetPort: 8080
      # 節點連接埠
      # 如果不指定，Kubernetes 會自動分配 30000-32767 範圍內的連接埠
      nodePort: 30080
    - name: https
      protocol: TCP
      port: 443
      targetPort: 8443
      nodePort: 30443
  # 外部流量政策
  # Local 確保流量只路由到本地節點上的 Pod
  # 這可以保留客戶端 IP 並減少網路跳躍
  externalTrafficPolicy: Local

服務網格技術為多叢集環境提供了進階的服務發現和流量管理能力。Istio和Linkerd等服務網格可以實現跨叢集的服務發現、負載平衡以及安全通訊。它們透過在每個Pod旁邊部署側車代理來攔截和管理所有網路流量，提供了統一的觀測性、安全性以及流量控制。

跨叢集DNS是實現服務發現的另一種方法。CoreDNS支援多種外掛來實現跨叢集DNS解析，例如使用etcd外掛將所有叢集的服務記錄儲存在共享的etcd叢集中。另一種方法是使用external-dns專案，它可以自動將Kubernetes服務和Ingress資源同步到外部DNS供應商如Route53或CloudDNS。

# CoreDNS 跨叢集組態範例
# 這個組態展示了如何設定 CoreDNS 實現跨叢集 DNS 解析
apiVersion: v1
kind: ConfigMap
metadata:
  name: coredns
  namespace: kube-system
data:
  Corefile: |
    # 預設叢集域名
    cluster.local:53 {
        errors
        health {
           lameduck 5s
        }
        ready
        # kubernetes 外掛處理叢集內服務發現
        kubernetes cluster.local in-addr.arpa ip6.arpa {
           pods insecure
           fallthrough in-addr.arpa ip6.arpa
           ttl 30
        }
        prometheus :9153
        # 轉發到上游 DNS
        forward . /etc/resolv.conf {
           max_concurrent 1000
        }
        cache 30
        loop
        reload
        loadbalance
    }

    # 全域服務域名
    # 用於跨叢集服務發現
    global.svc:53 {
        errors
        cache 30
        # 使用 etcd 作為後端儲存
        # 所有叢集將服務記錄寫入這個共享的 etcd
        etcd {
           stubzones
           path /skydns
           # etcd 端點
           endpoint http://etcd-cluster.etcd-system:2379
        }
    }

    # 其他叢集的服務域名
    # 轉發到對應叢集的 DNS 伺服器
    cluster-east.svc:53 {
        errors
        cache 30
        forward . 10.0.2.10:53
    }

    cluster-west.svc:53 {
        errors
        cache 30
        forward . 10.0.3.10:53
    }

    # 根域名
    .:53 {
        errors
        health
        ready
        # 預設轉發
        forward . /etc/resolv.conf
        cache 30
        reload
        loadbalance
    }
---
# External-DNS 組態範例
# 自動將 Kubernetes 服務同步到外部 DNS
apiVersion: apps/v1
kind: Deployment
metadata:
  name: external-dns
  namespace: kube-system
spec:
  replicas: 1
  selector:
    matchLabels:
      app: external-dns
  template:
    metadata:
      labels:
        app: external-dns
    spec:
      serviceAccountName: external-dns
      containers:
        - name: external-dns
          # External-DNS 映像檔
          image: registry.k8s.io/external-dns/external-dns:v0.14.0
          args:
            # DNS 供應商
            - --source=service
            - --source=ingress
            # DNS 供應商設定（以 AWS Route53 為例）
            - --provider=aws
            # 只管理這個域名下的記錄
            - --domain-filter=k8s.example.com
            # 記錄擁有者 ID，用於識別由這個 external-dns 管理的記錄
            - --txt-owner-id=production-cluster
            # 同步策略
            # sync 會建立、更新和刪除記錄
            # upsert-only 只建立和更新，不刪除
            - --policy=sync
            # 記錄 TTL
            - --registry=txt
            - --txt-prefix=external-dns-
            # 日誌級別
            - --log-level=info
          resources:
            requests:
              cpu: 50m
              memory: 64Mi
            limits:
              cpu: 100m
              memory: 128Mi

監控和可觀測性在多叢集環境中尤為重要。統一的監控系統可以提供跨叢集的全域視圖，幫助運維團隊快速識別和定位問題。Prometheus聯邦機制允許中央Prometheus從多個叢集的Prometheus實例中聚合指標。Thanos和Cortex等專案則提供了更完善的長期儲存和查詢能力。對於日誌和追蹤，可以使用集中式的ELK堆疊或Jaeger來收集和分析來自所有叢集的資料。

安全性在多叢集環境中需要特別關注。統一的身份認證和授權機制是基礎，可以使用OIDC整合企業身份供應商，並透過RBAC實施細粒度的存取控制。Secret管理應該使用外部密鑰管理系統如HashiCorp Vault，避免在多個叢集間複製敏感資料。網路政策應該在所有叢集中一致實施，限制不必要的叢集間通訊。稽核日誌應該集中收集和分析，以便偵測異常活動。

多叢集管理的自動化程度決定了維運效率。除了前面討論的GitOps和Operator模式，還可以實作自動化的叢集生命週期管理。這包括根據預定義的範本自動建立新叢集、自動執行叢集升級、自動調整叢集規模以及自動處理叢集故障。Cluster API是一個提供此類功能的專案，它將叢集本身視為Kubernetes資源，透過聲明式API管理叢集基礎設施。

災難恢復和業務連續性是多叢集架構的重要考量。多區域部署可以保護服務免受單一區域故障的影響，但需要仔細設計資料複製策略。對於狀態資料，需要在延遲、一致性和可用性之間做出權衡。全域負載平衡器可以在叢集之間分配流量，並在故障時自動切換到健康的叢集。定期演練災難恢復程序是確保計畫有效性的關鍵。

成本最佳化也是多叢集管理的重要面向。多叢集架構通常比單一大型叢集有更高的管理開銷，因此需要仔細評估是否真正需要多個叢集。對於確實需要多叢集的場景，可以透過資源請求和限制的合理設定、自動擴展策略以及叢集間的工作負載均衡來最佳化成本。使用現貨實例或搶占式實例可以顯著降低非關鍵工作負載的成本。

多叢集管理的未來趨勢指向更高程度的自動化和智慧化。機器學習技術可以用於預測資源需求、偵測異常以及最佳化工作負載放置。邊緣運算的興起推動了輕量級叢集管理方案的發展，如K3s和KubeEdge。服務網格的功能持續增強，提供了更豐富的跨叢集能力。標準化的多叢集API正在發展中，旨在提供一致的多叢集管理介面。

總結而言，Kubernetes多叢集管理是一個複雜但日益重要的領域。成功的多叢集策略需要綜合考慮技術、流程和組織等多個面向。Operator模式和GitOps方法提供了強大的自動化能力，可以顯著降低管理複雜度。外部服務整合策略使得混合架構成為可能，讓組織可以漸進式地遷移到Kubernetes。選擇適合的工具和實踐需要根據具體需求和約束條件來評估。隨著雲原生生態系統的持續發展，多叢集管理的工具和最佳實踐也將不斷演進，為企業提供更強大的能力來管理分散式的Kubernetes環境。