2025年03月23日玄貓（BlackCat）

Kafka多叢集架構設計與災難復原策略

本文探討 Apache Kafka 的多叢集架構設計與災難復原策略，涵蓋 Hub-and-Spoke、Active-Standby 和拉伸叢集等常見模式，並詳細介紹 MirrorMaker 的進階功能與組態，包括偏移量遷移、主題組態遷移、ACL

分散式系統資料工程

Apache Kafka 多叢集架構災難復原 MirrorMaker 高用性偏移量管理

在分散式系統中，確保資料串流平台的穩定性和可靠性至關重要。Apache Kafka 作為一個廣泛使用的訊息佇列和串流處理平台，其多叢集架構設計和災難復原策略對於應對資料中心故障、網路中斷等突發情況至關重要。本文將探討 Kafka 的多叢集架構，包括 Hub-and-Spoke、Active-Standby 和拉伸叢集等模式，並分析其優缺點和適用場景。同時，本文也將詳細介紹 MirrorMaker 的進階功能與組態，包括偏移量遷移、主題組態遷移、ACL 遷移、聯結器任務組態、多叢集複製拓撲以及安全組態，以協助工程師構建高用性和容錯能力的 Kafka 系統，確保業務的連續性和資料的一致性。

詳細解說

此圖表呈現了Hub-and-Spoke與Active-Active兩種架構的主要優缺點。Hub-and-Spoke以其簡單性著稱，但受限於跨區域存取。Active-Active提供更好的效能和彈性，但伴隨著非同步更新和衝突管理的挑戰。選擇適當的架構需要根據具體業務需求和技術挑戰進行仔細評估。

最後檢查

在完成多資料中心架構的設計後，需要進行最終檢查，以確保滿足所有技術要求和業務需求。這包括檢查組態的一致性、效能的最佳化、以及對潛在錯誤和衝突的處理機制。只有經過嚴格測試和驗證的系統，才能夠在實際環境中穩定執行，並提供所需的服務品質。

多叢集架構的設計與應用

在處理多資料中心或地理位置分散的系統時，Apache Kafka的多叢集架構扮演著至關重要的角色。這種架構不僅能夠提升系統的可用性和容錯能力，還能滿足不同業務需求和法規要求。

多叢集架構的常見模式

多叢集架構有多種實作方式，其中最常見的有Hub-and-Spoke（中心輻射）架構和Active-Standby（主備）架構。

Hub-and-Spoke架構

在Hub-and-Spoke架構中，一個中心叢集（Hub）負責匯總和處理來自多個邊緣叢集（Spoke）的資料。這種架構非常適合需要集中處理和分析資料的應用場景。然而，它也帶來了一些挑戰，如單點故障風險和資料傳輸延遲。

Active-Standby架構

Active-Standby架構涉及兩個或多個叢集，其中一個叢集處於活躍狀態（Active），處理所有生產和消費請求，而其他叢集則處於備用狀態（Standby），作為災難還原（Disaster Recovery, DR）的目的。

Active-Standby架構的優缺點

優點

簡單易設：只需安裝第二個叢集並設定映象（Mirroring）流程，即可實作資料備份。
適用廣泛：幾乎適用於所有使用案例，無需擔心資料存取和衝突處理等複雜問題。

缺點

資源浪費：備用叢集在正常情況下不處理任何工作負載，造成資源浪費。
容錯移轉困難：Kafka叢集之間的容錯移轉（Failover）並不簡單，可能導致資料丟失或重複處理。

災難還原規劃

在規劃災難還原時，需要考慮兩個關鍵指標：還原時間目標（Recovery Time Objective, RTO）和還原點目標（Recovery Point Objective, RPO）。RTO定義了災難發生後所有服務必須還原的最大時間，而RPO則定義了災難發生後允許丟失的最大資料量。

容錯移轉挑戰

由於Kafka的映象解決方案都是非同步的，DR叢集通常會滯後於主叢集。這意味著在非計劃性容錯移轉時，可能會丟失部分資料。此外，目前的映象解決方案不支援事務，這可能導致相關事件的不一致性。

應用程式在容錯移轉後的起始偏移量

在容錯移轉到另一個叢集時，確保應用程式知道從哪裡開始消費資料是一個挑戰。有幾種常見的方法，包括自動偏移重置（Auto Offset Reset）等。這些方法有的簡單但可能導致額外的資料丟失或重複處理，有的則更為複雜但能夠最小化這些問題。

災難復原（DR）策略在Apache Kafka中的重要性

在現代分散式系統中，災難復原（Disaster Recovery, DR）策略對於確保業務連續性至關重要。Apache Kafka作為一個分散式流處理平台，其DR策略的設計和實施對於維持系統的高用性和資料一致性具有關鍵作用。本文將探討Kafka在DR場景下的不同策略，包括其優缺點及實施細節。

初始偏移量組態

當Kafka消費者（consumer）在沒有之前提交的偏移量（offset）時，會根據組態決定從分割槽（partition）的開始還是結束位置開始讀取資料。如果未將這些偏移量納入DR計畫的一部分，則需要在以下兩個選項中進行選擇：

從分割槽的起始位置開始讀取：這可能會導致處理大量的重複資料。
```
// 消費者組態示例
Properties props = new Properties();
props.put("auto.offset.reset", "earliest");
```
內容解密：
- auto.offset.reset 引數設定為 earliest 表示當沒有有效的偏移量時，消費者將從最早的可用資料開始讀取。
- 這種方法的優點是可以確保不會遺失任何資料，但缺點是可能會處理大量的重複資料。
跳至分割槽的末尾：這可能會遺失部分資料。
```
// 消費者組態示例
Properties props = new Properties();
props.put("auto.offset.reset", "latest");
```
內容解密：
- auto.offset.reset 引數設定為 latest 表示當沒有有效的偏移量時，消費者將從最新的資料開始讀取。
- 這種方法的優點是簡便易行，且能快速還原服務，但缺點是可能會遺失部分資料。

偏移量主題的複製

對於使用0.9.0及以上版本的Kafka消費者，它們會將偏移量提交到一個特殊的主題：__consumer_offsets。如果將這個主題映象（mirror）到DR叢集，當消費者在DR叢集開始消費時，它們能夠還原到之前的偏移量，繼續處理資料。

@startuml
skinparam backgroundColor #FEFEFE
skinparam defaultTextAlignment center
skinparam rectangleBackgroundColor #F5F5F5
skinparam rectangleBorderColor #333333
skinparam arrowColor #333333

title 偏移量主題的複製

rectangle "映象" as node1
rectangle "生產資料" as node2
rectangle "映象 __consumer_offsets" as node3

node1 --> node2
node2 --> node3

@enduml

此圖示說明瞭如何將 __consumer_offsets 主題從主叢集映象到DR叢集，從而實作偏移量的還原。

內容解密：

映象 __consumer_offsets 主題使得消費者在DR叢集上能夠還原之前的消費進度。
但是，這種方法存在一些限制，例如偏移量在主叢集和DR叢集之間可能不一致。

根據時間的容錯移轉

從0.10.0版本開始，Kafka的訊息中包含了時間戳，從0.10.1.0版本開始，Kafka代理（broker）提供了根據時間戳查詢偏移量的API和索引。因此，在容錯移轉時，可以根據時間戳指定消費者從特定的時間點開始消費資料。

bin/kafka-consumer-groups.sh --bootstrap-server localhost:9092 --reset-offsets --all-topics --group my-group --to-datetime 2021-03-31T04:03:00.000 --execute

內容解密：

使用 kafka-consumer-groups.sh 工具可以根據時間戳重置消費者的偏移量。
這種方法可以讓系統在指定的時間點還原服務，從而減少資料遺失或重複處理的影響。

偏移量轉換

由於主叢集和DR叢集之間的偏移量可能不一致，因此需要一種機制來對映這兩個叢集之間的偏移量。一些組織選擇使用外部資料儲存（如Apache Cassandra）來儲存偏移量的對映關係。現代的映象工具（如MirrorMaker）使用Kafka主題來儲存偏移量轉換的中繼資料。

@startuml
skinparam backgroundColor #FEFEFE
skinparam defaultTextAlignment center
skinparam rectangleBackgroundColor #F5F5F5
skinparam rectangleBorderColor #333333
skinparam arrowColor #333333

title 偏移量轉換

rectangle "對映" as node1
rectangle "儲存對映關係" as node2

node1 --> node2

@enduml

此圖示展示瞭如何透過映象工具將主叢集和DR叢集之間的偏移量進行對映，並將對映關係儲存到特定的主題中。

內容解密：

偏移量轉換是解決主叢集和DR叢集偏移量不一致問題的關鍵。
使用Kafka主題儲存偏移量轉換的中繼資料是一種現代且有效的方法。

災難復原與高用性架構

在現代資料驅動的企業中，災難復原（Disaster Recovery, DR）與高用性（High Availability, HA）是確保業務連續性的關鍵要素。Apache Kafka作為一個分散式串流處理平台，提供了多種架構模式來滿足不同場景下的DR與HA需求。

主備（Active-Standby）架構

主備架構是一種常見的災難復原策略，其中一個主叢集（Primary Cluster）處理所有生產和消費請求，而一個或多個備用叢集（Standby Cluster）則保持同步但不處理請求。

偏移量對映（Offset Mapping）

在主備架構中，偏移量對映是一個重要的挑戰。由於主叢集和備用叢集的偏移量可能不同，因此需要在容錯移轉（Failover）時將主叢集的偏移量對映到備用叢集。


### 偏移量對映問題
- 主叢集偏移量與備用叢集偏移量不一致
- 需要在容錯移轉時進行偏移量對映

為瞭解決這個問題，可以使用以下兩種技術：

時間戳記對映：將時間戳記對映到偏移量，但這種方法可能導致不準確性。
直接偏移量對映：記錄主叢集和備用叢集之間的偏移量對映關係。

容錯移轉後的操作

在容錯移轉後，需要決定如何處理原主叢集。簡單地反轉映象（Mirroring）過程可能會導致資料不一致，因為原主叢集可能包含備用叢集所沒有的事件。


### 容錯移轉後的處理
1. 清除原叢集資料和已提交的偏移量
2. 從新主叢集映象到新的備用叢集

叢集發現（Cluster Discovery）

在主備架構中，應用程式需要能夠發現並連線到新的叢集。通常使用DNS名稱來指向主叢集，並在容錯移轉時更新DNS記錄。


### 叢集發現機制
- 使用DNS名稱指向主叢集
- 在容錯移轉時更新DNS記錄

拉伸叢集（Stretch Clusters）

拉伸叢集是一種特殊的架構，將單一Kafka叢集跨多個資料中心佈署。這種架構使用Kafka的正常複製機制來保持所有代理之間的同步。

組態拉伸叢集

為了實作拉伸叢集，需要：

機架定義：確保每個分割槽在多個資料中心都有副本。
同步複製：使用min.insync.replicas和acks=all來確保每次寫入都被至少兩個資料中心確認。

// 示例組態
min.insync.replicas=2
acks=all

拉伸叢集的優缺點

優點：

同步複製：確保DR站點始終與主站點100%同步。
無資源浪費：所有資料中心和代理都被利用。

缺點：

有限的災難保護：僅保護免受資料中心故障的影響。
對基礎設施的要求：需要低延遲、高頻寬的網路連線。

內容解密：

上述內容詳細介紹了Kafka在災難復原和高用性方面的不同架構模式，包括主備架構和拉伸叢集。主備架構透過映象機制保持備用叢集與主叢集的同步，而拉伸叢集則是將單一Kafka叢集跨多個資料中心佈署，利用Kafka的複製機制保持資料的一致性。每種架構都有其優缺點和適用場景，企業應根據自身需求選擇合適的方案。

2.5 資料中心架構與Apache Kafka的MirrorMaker

在現代資料驅動的企業中，多資料中心架構已成為確保高用性和災難還原的關鍵組成部分。Apache Kafka作為一個領先的分散式串流處理平台，提供了多種工具和功能來支援多資料中心佈署。其中，2.5資料中心架構和MirrorMaker是兩個重要的概念。

2.5 資料中心架構

2.5資料中心架構是一種流行的伸縮叢集模型，它涉及在兩個資料中心執行Kafka和ZooKeeper，並在第三個「0.5」資料中心執行一個ZooKeeper節點，以在資料中心故障時提供仲裁。這種架構允許手動容錯移轉，但相對較少見。

Apache Kafka的MirrorMaker

Apache Kafka包含一個名為MirrorMaker的工具，用於在兩個資料中心之間映象資料。早期的MirrorMaker版本使用消費者群組來讀取源主題的資料，並使用共用的Kafka生產者將事件傳送到目標叢集。雖然這種方法在某些情況下足夠，但它存在一些問題，特別是在組態變更和新增主題時會導致延遲尖峰。MirrorMaker 2.0是下一代的多叢集映象解決方案，根據Kafka Connect框架，克服了許多前代版本的缺點。

MirrorMaker的工作原理

MirrorMaker使用源聯結器從另一個Kafka叢集消費資料，而不是從資料函式庫消費。Kafka Connect框架的使用最小化了忙碌的企業IT部門的管理開銷。每個聯結器將工作分配給可組態數量的任務。在MirrorMaker中，每個任務是一對消費者和生產者。Connect框架根據需要將這些任務分配給不同的Connect工作節點。

組態MirrorMaker

MirrorMaker具有高度的可組態性。除了定義拓撲、Kafka Connect和聯結器設定的叢集設定外，還可以自定義MirrorMaker使用的底層生產者、消費者和管理客戶端的每個組態屬性。

以下是一個啟動MirrorMaker的範例命令：

bin/connect-mirror-maker.sh etc/kafka/connect-mirror-maker.properties

設定複製流程

以下範例顯示了在紐約和倫敦兩個資料中心之間設定主備複製流程的組態選項：

clusters = NYC, LON
NYC.bootstrap.servers = kafka.nyc.example.com:9092
LON.bootstrap.servers = kafka.lon.example.com:9092
NYC->LON.enabled = true
NYC->LON.topics = .*

映象主題

對於每個複製流程，可以指定一個正規表示式來比對要映象的主題名稱。在這個範例中，我們選擇複製每個主題，但通常使用類別似prod.*的模式來避免複製測試主題。可以指定一個單獨的主題排除列表，以排除不需要映象的主題。

消費者偏移遷移

MirrorMaker還支援消費者偏移、主題組態和主題ACL的遷移，使其成為多叢集佈署的完整映象解決方案。

MirrorMaker的優勢

簡化管理：使用Kafka Connect框架，最小化了管理開銷。
靈活的拓撲：支援多種複雜拓撲，如hub-and-spoke、active-standby和active-active架構。
自動化：自動檢測新主題和分割槽，並自動進行映象。

MirrorMaker 的進階功能與組態

MirrorMaker 是 Apache Kafka 中用於跨叢集資料複製的重要工具，支援多種複雜的拓撲結構與安全組態。本文將探討 MirrorMaker 的進階功能，包括偏移量遷移、主題組態遷移、ACL 遷移、聯結器任務組態、多叢集複製拓撲，以及安全組態。

偏移量遷移

MirrorMaker 提供 RemoteClusterUtils 工具類別，讓消費者在主叢集容錯移轉至災難復原（DR）叢集時，能夠根據檢查點偏移量進行正確的消費。從 2.7.0 版本開始，MirrorMaker 支援週期性地將消費者偏移量遷移至目標叢集的 __consumer_offsets 主題，確保消費者在切換至 DR 叢集時能夠從上次中斷的位置繼續消費，實作零資料丟失和最小的重複處理。

程式碼範例：偏移量遷移組態

# 啟用偏移量遷移
offset.storage.topic=mm-offsets
offset.flush.interval.ms=10000

內容解密：

offset.storage.topic 指定了儲存偏移量的主題名稱。
offset.flush.interval.ms 設定了偏移量重新整理的間隔，單位為毫秒。

主題組態與 ACL 遷移

除了資料記錄的映象複製，MirrorMaker 還可以組態為映象主題組態和存取控制列表（ACL），以保持映象主題在目標叢集上的行為一致。預設組態下，MirrorMaker 會定期重新整理這些組態，但某些組態（如 min.insync.replicas）預設不會被應用到目標主題。

程式碼範例：主題組態遷移

# 映象主題組態
topic.config.sync=true
topic.config.sync.interval.ms=10000

內容解密：

topic.config.sync 啟用主題組態的同步。
topic.config.sync.interval.ms 設定了主題組態同步的間隔。

聯結器任務組態

tasks.max 組態選項限制了 MirrorMaker 所使用的最大任務數。預設值為 1，但建議至少設定為 2，以提高複製的平行度。

程式碼範例：聯結器任務組態

tasks.max=4

內容解密：

將 tasks.max 設定為 4，以允許最多 4 個任務平行執行，提高資料複製的效率。

多叢集複製拓撲

MirrorMaker 支援多種複雜的複製拓撲結構，包括主動-主動和主動-備用模式。例如，可以在紐約（NYC）和倫敦（LON）兩個資料中心之間建立主動-主動複製拓撲。

程式碼範例：主動-主動複製組態

clusters=NYC,LON
NYC.bootstrap.servers=kafka.nyc.example.com:9092
LON.bootstrap.servers=kafka.lon.example.com:9092
NYC->LON.enabled=true
NYC->LON.topics=.*
LON->NYC.enabled=true
LON->NYC.topics=.*

內容解密：

clusters 列出了參與複製的叢集別名。
NYC.bootstrap.servers 和 LON.bootstrap.servers 指定了兩個叢集的引導伺服器。
NYC->LON.enabled 和 LON->NYC.enabled 分別啟用了從 NYC 到 LON 和從 LON 到 NYC 的複製。
NYC->LON.topics 和 LON->NYC.topics 指定了要複製的主題，使用正規表示式 .* 表示所有主題。

安全組態

在生產環境中，確保跨資料中心流量安全至關重要。MirrorMaker 需要組態為使用安全的代理監聽器，並為每個叢集組態客戶端安全選項。建議使用 SSL 或 SASL_SSL 來加密跨資料中心的流量。

程式碼範例：安全組態

NYC.security.protocol=SASL_SSL
NYC.sasl.mechanism=PLAIN
NYC.sasl.jaas.config=org.apache.kafka.common.security.plain.PlainLoginModule required username="MirrorMaker" password="MirrorMaker-password";

內容解密：

NYC.security.protocol 設定了 NYC 叢集的安全協定為 SASL_SSL。
NYC.sasl.mechanism 指定了 SASL 的機制為 PLAIN。
NYC.sasl.jaas.config 組態了 JAAS 登入模組，並提供了使用者名稱和密碼。