在现代企业级应用中,数据库的高可用性(High Availability, HA)已成为不可或缺的核心需求。PostgreSQL 作为一款功能强大、开源且高度可扩展的关系型数据库管理系统,凭借其稳定性、性能和丰富的特性,被广泛应用于金融、电商、物联网等关键业务场景。而主从复制(Replication)作为实现高可用性的基础技术之一,能够有效提升系统的容灾能力、读写分离能力和数据安全性。
然而,仅仅配置好主从复制并不足以保障系统稳定运行。如何实时监控复制状态?如何在主库发生故障时快速、安全地完成故障切换(Failover)? 这些问题直接关系到业务连续性和用户体验。本文将深入探讨 PostgreSQL 主从复制的监控机制与自动化故障切换策略,并结合 Java 代码示例,构建一套实用的高可用解决方案。
在深入监控与故障切换之前,我们有必要先理解 PostgreSQL 主从复制的基本工作原理。
PostgreSQL 自 9.0 版本起引入了基于 WAL(Write-Ahead Logging)日志的流复制(Streaming Replication)机制。其核心思想是:主库(Primary)将事务产生的 WAL 日志实时传输给一个或多个从库(Standby/Replica),从库重放这些日志以保持与主库的数据同步。
提示:可通过 synchronous_standby_names 参数配置同步从库。
本文主要讨论物理流复制下的监控与故障切换。
要有效监控主从复制,我们需要关注一系列关键指标。这些指标不仅能反映复制是否正常,还能帮助我们评估延迟、吞吐量和潜在风险。
| 指标 | 说明 | 查询方式 |
|---|---|---|
| 复制延迟(Replication Lag) | 从库落后主库的时间或 WAL 位置 | pg_stat_replication / pg_last_wal_receive_lsn() 等 |
| WAL 发送/接收状态 | 主库是否正在向从库发送 WAL,从库是否正常接收 | pg_stat_replication 表 |
| 从库是否处于恢复模式 | 判断节点是否为从库 | pg_is_in_recovery() |
| 复制槽(Replication Slot)状态 | 防止 WAL 被过早清理,需监控是否堆积 | pg_replication_slots |
| 连接状态 | 主从之间的网络连接是否正常 | 系统日志或 pg_stat_replication |
-- 查看所有从库的连接和复制进度SELECT pid, usename, application_name, client_addr, state, sync_state, sent_lsn, write_lsn, flush_lsn, replay_lsn, pg_wal_lsn_diff(sent_lsn, replay_lsn) AS replay_lag_bytesFROM pg_stat_replication;
sent_lsn:主库已发送的 WAL 位置replay_lsn:从库已重放的 WAL 位置replay_lag_bytes:重放延迟(字节数)-- 判断是否为从库SELECT pg_is_in_recovery(); -- true 表示是从库-- 获取最后接收到的 WAL 位置SELECT pg_last_wal_receive_lsn();-- 获取最后重放的 WAL 位置SELECT pg_last_wal_replay_lsn();-- 计算时间延迟(需主库支持 track_commit_timestamp)SELECT EXTRACT(EPOCH FROM (now() - pg_last_xact_replay_timestamp())) AS replay_lag_seconds;
注意:pg_last_xact_replay_timestamp() 返回的是从库上最后一个重放事务的时间戳。若长时间无写入,该值可能不准确。
我们可以编写一个 Java 程序,定期连接主库和从库,采集上述指标,并在异常时触发告警或自动处理。
使用 Maven 引入 PostgreSQL JDBC 驱动:
<dependency> <groupId>org.postgresql</groupId> <artifactId>postgresql</artifactId> <version>42.7.3</version></dependency>
public class ReplicationStatus { private String host; private boolean isStandby; private long replayLagBytes; private double replayLagSeconds; private boolean isConnected; private String errorMessage; // getters and setters}import java.sql.*;import java.time.Duration;import java.time.Instant;public class PgReplicationMonitor { public static ReplicationStatus checkReplication(String jdbcUrl, String username, String password) { ReplicationStatus status = new ReplicationStatus(); status.setHost(jdbcUrl); status.setConnected(false); try (Connection conn = DriverManager.getConnection(jdbcUrl, username, password)) { status.setConnected(true); // 检查是否为从库 try (PreparedStatement ps = conn.prepareStatement("SELECT pg_is_in_recovery()")) { ResultSet rs = ps.executeQuery(); if (rs.next()) { status.setIsStandby(rs.getBoolean(1)); } } if (status.isIsStandby()) { // 从库:获取延迟 try (PreparedStatement ps = conn.prepareStatement( "SELECT " + "pg_last_wal_receive_lsn(), " + "pg_last_wal_replay_lsn(), " + "EXTRACT(EPOCH FROM (now() - pg_last_xact_replay_timestamp()))")) { ResultSet rs = ps.executeQuery(); if (rs.next()) { String receiveLsn = rs.getString(1); String replayLsn = rs.getString(2); double lagSeconds = rs.getDouble(3); // 计算字节延迟(需转换 LSN) long byteLag = calculateLsnDiff(receiveLsn, replayLsn); status.setReplayLagBytes(byteLag); status.setReplayLagSeconds(lagSeconds); } } } else { // 主库:可选,检查从库连接数等 // 此处略 } } catch (SQLException e) { status.setErrorMessage(e.getMessage()); } return status; } // 简化版 LSN 差值计算(实际应解析 LSN 格式) private static long calculateLsnDiff(String lsn1, String lsn2) { if (lsn1 == null || lsn2 == null) return 0; // 实际项目中建议使用 PostgreSQL 的 pg_wal_lsn_diff 函数在 SQL 中计算 // 此处仅为示意 return Math.abs(lsn1.hashCode() - lsn2.hashCode()); }}说明:LSN(Log Sequence Number)格式如 0/1A2B3C4D,不能直接用字符串哈希计算。生产环境中应在 SQL 中使用 pg_wal_lsn_diff(receive_lsn, replay_lsn) 获取字节差。
import java.util.concurrent.Executors;import java.util.concurrent.ScheduledExecutorService;import java.util.concurrent.TimeUnit;public class ReplicationWatcher { private static final String PRIMARY_URL = "jdbc:postgresql://primary-db:5432/mydb"; private static final String STANDBY_URL = "jdbc:postgresql://standby-db:5432/mydb"; private static final String USERNAME = "repuser"; private static final String PASSWORD = "secret"; public static void main(String[] args) { ScheduledExecutorService scheduler = Executors.newScheduledThreadPool(2); scheduler.scheduleAtFixedRate(() -> { ReplicationStatus standby = PgReplicationMonitor.checkReplication(STANDBY_URL, USERNAME, PASSWORD); if (!standby.isConnected()) { alert("Standby DB connection failed: " + standby.getErrorMessage()); } else if (standby.getReplayLagSeconds() > 30) { alert("High replication lag: " + standby.getReplayLagSeconds() + " seconds"); } }, 0, 10, TimeUnit.SECONDS); // 每10秒检查一次 } private static void alert(String message) { System.err.println("[ALERT] " + Instant.now() + ": " + message); // 可集成邮件、钉钉、企业微信等通知 }}通过上述代码,我们可以实现对从库复制状态的持续监控,并在延迟过高或连接中断时发出告警。
当主库发生不可恢复的故障(如硬件损坏、网络分区、服务崩溃等)时,必须将一个从库提升为新的主库,以恢复写服务能力。这个过程称为故障切换(Failover)。
pg_ctl promote 或创建 trigger_file。适用于可控环境,但 RTO(恢复时间目标)较长。推荐:生产环境应使用自动化工具,避免人为失误。
Patroni 是一个基于 Python 的 PostgreSQL 高可用模板,它利用分布式配置存储(如 etcd、ZooKeeper、Consul)来协调主从角色,实现自动故障检测与切换。
Patroni 的核心优势:
scope: myclusternamespace: /service/name: pg-node1restapi: listen: 0.0.0.0:8008 connect_address: 192.168.1.10:8008etcd: hosts: ["etcd1:2379", "etcd2:2379", "etcd3:2379"]bootstrap: dcs: ttl: 30 loop_wait: 10 retry_timeout: 10 maximum_lag_on_failover: 1048576 # 1MB postgresql: use_pg_rewind: true parameters: wal_level: replica hot_standby: on max_wal_senders: 10 wal_keep_segments: 8postgresql: listen: 0.0.0.0:5432 connect_address: 192.168.1.10:5432 data_dir: /var/lib/postgresql/14/main bin_dir: /usr/lib/postgresql/14/bin authentication: replication: username: replicator password: rep-pass superuser: username: postgres password: admin-pass
启动 Patroni 后,它会自动初始化集群或加入现有集群。
ttl 秒内未更新)promote,停止恢复模式即使底层完成了故障切换,Java 应用仍需能自动连接到新主库。以下是几种常见方案:
HikariCP、Druid 等连接池支持连接失败重试。配合合理的 SQL 重试逻辑,可在主库切换后自动恢复。
// HikariCP 配置示例HikariConfig config = new HikariConfig();config.setJdbcUrl("jdbc:postgresql://new-primary:5432/mydb");config.setUsername("appuser");config.setPassword("pass");config.setConnectionTimeout(3000);config.setIdleTimeout(60000);config.setMaxLifetime(1800000);config.setMaximumPoolSize(20);// 关键:启用自动重连config.addDataSourceProperty("reWriteBatchedInserts", "true");config.addDataSourceProperty("tcpKeepAlive", "true");HikariDataSource ds = new HikariDataSource(config);通过 Spring Cloud Consul,应用可动态获取数据库主库地址:
@RefreshScope@RestControllerpublic class DatabaseController { @Value("${db.primary.host}") private String primaryHost; @GetMapping("/db/host") public String getDbHost() { return primaryHost; // 由 Consul 动态注入 }}当 Patroni 切换主库后,更新 Consul 中的服务注册,应用自动拉取新地址。
在无法使用外部服务发现时,可编写探测逻辑:
public class MasterDetector { private volatile String currentMaster = "primary-db"; public void startDetection() { Executors.newSingleThreadScheduledExecutor().scheduleWithFixedDelay(() -> { try { // 尝试连接候选主库列表 for (String candidate : Arrays.asList("node1", "node2", "node3")) { if (isMaster(candidate)) { currentMaster = candidate; break; } } } catch (Exception e) { // log error } }, 0, 5, TimeUnit.SECONDS); } private boolean isMaster(String host) { try (Connection conn = DriverManager.getConnection( "jdbc:postgresql://" + host + ":5432/mydb", "user", "pass")) { try (Statement stmt = conn.createStatement(); ResultSet rs = stmt.executeQuery("SELECT pg_is_in_recovery()")) { return rs.next() && !rs.getBoolean(1); // 不在恢复模式即为主库 } } catch (SQLException e) { return false; } } public String getCurrentMaster() { return currentMaster; }}注意:此方法在高并发下可能产生大量连接,仅适用于小规模系统。
故障切换后,必须确保数据一致性,尤其是避免“旧主库复活”导致的脑裂。
pg_rewind 是 PostgreSQL 提供的工具,可将原主库快速同步到新主库的状态,避免全量重建。
前提条件:
wal_log_hints = on 或 data checksums$PGDATA 未被修改Patroni 默认启用 use_pg_rewind: true,在原主库恢复后自动执行。
复制槽可防止主库在从库断开时清理 WAL 日志,确保从库重连后能继续同步。
-- 创建物理复制槽SELECT pg_create_physical_replication_slot('standby1_slot');-- 查看槽状态SELECT * FROM pg_replication_slots;在 Patroni 中,可自动管理复制槽:
postgresql: parameters: max_replication_slots: 5 use_slots: true # 启用自动槽管理

该流程展示了从故障发生到恢复的完整生命周期,强调了自动化工具在协调各组件中的作用。
pg_replication_slots.active = false 且 restart_lsn 滞后,说明从库长期离线,WAL 可能撑爆磁盘。synchronous_commit = 'remote_write' 或 local 降低风险。SQLTransientConnectionException,触发重试。PostgreSQL 的主从复制为高可用架构奠定了坚实基础,但真正的高可用不仅在于“能复制”,更在于“能感知、能切换、能恢复”。通过结合有效的监控手段(如 Java 程序采集指标)、可靠的自动化工具(如 Patroni)以及健壮的应用设计(如服务发现与重试机制),我们能够构建出具备分钟级甚至秒级故障恢复能力的数据库系统。
在云原生时代,PostgreSQL 的高可用方案也在不断演进。无论是传统虚拟机部署,还是 Kubernetes 上的 Operator 模式(如 Zalando Postgres Operator),核心思想始终不变:自动化、可观测、可恢复。
以上就是PostgreSQL主从复制的监控与故障切换指南的详细内容,更多关于PostgreSQL主从复制监控与故障切换的资料请关注本站其它相关文章!