
发布
一个金融系统需在两个 GKE 集群(生产与灾备)间同步 Kafka 主题数据,实现跨区域容灾。使用 Strimzi Operator 部署 Kafka,但直接复制数据面临网络延迟与存储性能问题。技术挑战包括:如何部署 KafkaMirrorMaker2
CRD 并配置 sourceCluster
与 targetCluster
连接信息;设置 replicationPolicy
控制主题复制规则(如包含/排除);为 Kafka
CRD 的 storage
配置 JbodStorage
使用多块高性能 SSD(如 pd-ssd
)提升 IOPS;调整 broker
的 JVM
参数(Xmx
, XX:MaxGCPauseMillis
)和 OS
参数(vm.swappiness
);以及监控 kafka_server_BrokerTopicMetrics
指标确保复制延迟(ReplicationLatencyMs
)达标。应如何构建高吞吐、低延迟的云原生消息队列灾备方案?