maximum_lag_on_failover这个值原来是1M,但是发现,通过reboot模拟主机宕机时,有时会出现两个备机的lag都是16M的情况,
此时会影响备机升为主机。
猜测原因可能是:主机生成完一个wal文件,备机正在同步这个文件时,重启。经过查看,主机比备机多一个wal文件,而一个wal文件大小就是16M。
patroni的maximum_lag_on_failover 和 pg 的 wal_segsize 的大小,需在可用性和持久性之间做平衡。
降低恢复的条件限制,就更容易拉起服务,但代价就是容许丢失更多的事务数据,这就是durability and availability trade-off。