MySQL高可用架构设计分析
高可用HA(High Availability)是分布式系统架构设计中必须考虑的因素之一,它通常是指,通过设计减少系统不能提供服务的时间。
假设系统一直能够提供服务,我们说系统的可用性是100%。如果系统每运行100个时间单位,会有1个时间单位无法提供服务,我们说系统的可用性是99%。很多公司的高可用目标是4个9,也就是99.99%,这就意味着,系统的年停机时间为8.76个小时。
1. MySQL高可用
说到MySQL的高可用,不得不提到复制,复制是MySQL高可用的基础。复制解决了什么问题呢?
-
实现数据备份
-
如果有从服务器,主服务器发生故障之后,开通从服务器的写入功能,从而提供高可用的使用功能
-
异地容灾
-
分摊负载(scale out )主服务器:写、从服务器:读
1.1 主从复制流程
不同的复制协议:
1.2 高可用复制架构
1.3.mysql 高可用架构
1.3.1 MySQL Cluster架构
限制存储引擎为NDB存储引擎:
1.3.2 MySQL+MMM架构
MMM即Master-Master Replication Manager for MySQL(mysql主主复制管理器),是关于mysql主主复制配置的监控、故障转移和管理的一套可伸缩的脚本套件(在任何时候只有一个节点可以被写入),这个套件也能基于标准的主从配置的任意数量的从服务器进行读负载均衡,所以你可以用它来在一组居于复制的服务器启动虚拟ip,除此之外,它还有实现数据备份、节点之间重新同步功能的脚本。
MySQL本身没有提供replication failover的解决方案,通过MMM方案能实现服务器的故障转移,从而实现mysql的高可用。
此方案特点:
1、安全、稳定性较高,可扩展性好
2、 对服务器数量要求至少三台及以上
3、 对双主(主从复制性要求较高)
4、 同样可实现读写分离
1.3.3 MySQL+MHA架构
MHA目前在MySQL高可用方案中应该也是比较成熟和常见的方案,它由日本人开发出来,在MySQL故障切换过程中,MHA能做到快速自动切换操作,而且还能最大限度保持数据的一致性。
此架构特点
1、安装布署简单,不影响现有架构
2、自动监控和故障转移
3、保障数据一致性
4、故障切换方式可使用手动或自动多向选择
5、适应范围大(适用任何存储引擎)
2.MySQL高可用带给我们对高可用架构设计的思考
为了保证数据的一致性,MySQL提出了复制的概念。
为了满足acid,MySQL提供了两种日志 redo和undo日志 ,redo log是重做日志,提供前滚操作,undo log是回滚日志,提供回滚操作。 undo log不是redo log的逆向过程,其实它们都算是用来恢复的日志: redo log通常是物理日志,记录的是数据页的物理修改,而不是某一行或某几行修改成怎样怎样,它用来恢复提交后的物理数据页(恢复数据页,且只能恢复到最后一次提交的位置)。 undo用来回滚行记录到某个版本。undo log一般是逻辑日志,根据每行记录进行记录。 为了高可用的保证,有了多主或者主从切换。
数据库的高可用架构一般在系统的底层,这方面的技术要求比较高,整个高可用系统大致如下:
3.总结
我们都知道,单点是系统高可用的大敌,单点往往是系统高可用最大的风险和敌人,应该尽量在系统设计的过程中避免单点。
方法论上,高可用保证的原则是“集群化”,或者叫“冗余”:只有一个单点,挂了服务会受影响;如果有冗余备份,挂了还有其他backup能够顶上。冗余的最大难道是一致性即复制技术,MySQL提供了一个思路。
有了冗余之后,还不够,每次出现故障需要人工介入恢复势必会增加系统的不可服务实践。所以,又往往是通过“自动故障转移”来实现系统的高可用。灾备的恢复一般通过日志来做,日志的设计也是难点, MySQL 提供了一个思路。
数据库之互联网常用架构方案- 高可用
- 高性能
- 一致性
- 扩展性
方案一:主备架构,只有主库提供读写服务,备库冗余作故障转移用
jdbc:mysql://vip:3306/xxdb
- 高可用分析: 高可用,主库挂了,keepalive(只是一种工具)会自动切换到备库。这个过程对业务层是透明的,无需修改代码或配置。
- 高性能分析: 读写都操作主库,很容易产生瓶颈。大部分互联网应用读多写少,读会先成为瓶颈,进而影响写性能。另外,备库只是单纯的备份,资源利用率50%,这点方案二可解决。
- 一致性分析: 读写都操作主库,不存在数据一致性问题。
- 扩展性分析: 无法通过加从库来扩展读性能,进而提高整体性能。
- 可落地分析: 两点影响落地使用。第一,性能一般,这点可以通过建立高效的索引和引入缓存来增加读性能,进而提高性能。这也是通用的方案。第二,扩展性差,这点可以通过 分库分表 来扩展。
方案二:双主架构,两个主库同时提供服务,负载均衡
jdbc:mysql://vip:3306/xxdb
- 高可用分析: 高可用,一个主库挂了,不影响另一台主库提供服务。这个过程对业务层是透明的,无需修改代码或配置。
- 高性能分析: 读写性能相比于方案一都得到提升,提升一倍。
- 一致性分析: 存在数据一致性问题。请看, 一致性解决方案 。
- 扩展性分析: 当然可以扩展成三主循环,但笔者不建议(会多一层 数据同步 ,这样同步的时间会更长)。如果非得在数据库架构层面扩展的话,扩展为方案四。
- 可落地分析: 两点影响落地使用。第一,数据一致性问题, 一致性解决方案 可解决问题 。 第二,主键冲突问题,ID统一地由分布式ID生成服务来生成可解决问题。
方案三:主从架构,一主多从,读写分离
jdbc:mysql://master-ip:3306/xxdb
jdbc:mysql://slave1-ip:3306/xxdb
jdbc:mysql://slave2-ip:3306/xxdb
- 高可用分析: 主库单点,从库高可用。一旦主库挂了,写服务也就无法提供。
- 高性能分析: 大部分互联网应用读多写少,读会先成为瓶颈,进而影响整体性能。读的性能提高了,整体性能也提高了。另外,主库可以不用索引,线上从库和线下从库也可以建立不同的索引(线上从库如果有多个还是要建立相同的索引,不然得不偿失;线下从库是平时开发人员排查线上问题时查的库,可以建更多的索引)。
- 一致性分析: 存在数据一致性问题。请看, 一致性解决方案 。
- 扩展性分析: 可以通过加从库来扩展读性能,进而提高整体性能。(带来的问题是,从库越多需要从主库拉取binlog日志的端就越多,进而影响主库的性能,并且 数据同步 完成的时间也会更长)
- 可落地分析: 两点影响落地使用。第一,数据一致性问题, 一致性解决方案 可解决问题 。 第二,主库单点问题,笔者暂时没想到很好的解决方案。
注:思考一个问题,一台从库挂了会怎样?读写分离之读的负载均衡策略怎么容错?
方案四:双主+主从架构,看似完美的方案
jdbc:mysql://vip:3306/xxdb
jdbc:mysql://slave1-ip:3306/xxdb
jdbc:mysql://slave2-ip:3306/xxdb
- 高可用分析: 高可用。
- 高性能分析: 高性能。
- 一致性分析: 存在数据一致性问题。请看, 一致性解决方案 。
- 扩展性分析: 可以通过加从库来扩展读性能,进而提高整体性能。(带来的问题 同方案二 )
- 可落地分析: 同方案二 ,但 数据同步 又多了一层,数据延迟更严重 。
第一类:主库和从库一致性解决方案
注:图中圈出的是数据同步的地方,数据同步(从库从主库拉取binlog日志,再执行一遍)是需要时间的,这个同步时间内主库和从库的数据会存在不一致的情况。如果同步过程中有读请求,那么读到的就是从库中的老数据。如下图。
既然知道了数据不一致性产生的原因,有下面几个解决方案供参考:
- 直接忽略,如果业务允许延时存在,那么就不去管它。
- 强制读主,采用 主备架构 方案,读写都走主库。用缓存来扩展数据库读性能 。有一点需要知道:如果缓存挂了,可能会产生雪崩现象,不过一般分布式缓存都是高可用的。
- 选择读主,写操作时根据库+表+业务特征生成一个key放到Cache里并设置超时时间(大于等于主从数据同步时间)。读请求时,同样的方式生成key先去查Cache,再判断是否命中。若命中,则读主库,否则读从库。代价是多了一次缓存读写,基本可以忽略。
- 半同步复制,等主从同步完成,写请求才返回。就是大家常说的“半同步复制”semi-sync。这可以利用数据库原生功能,实现比较简单。代价是写请求时延增长,吞吐量降低。
- 数据库中间件,引入开源(mycat等)或自研的数据库中间层。个人理解,思路同 选择读主 。 数据库中间件的成本比较高,并且还多引入了一层。
第二类:DB和缓存一致性解决方案
先来看一下常用的缓存使用方式:
第一步:淘汰缓存;
第二步:写入数据库;
第三步:读取缓存?返回:读取数据库;
第四步:读取数据库后写入缓存。
注:如果按照这种方式,图一,不会产生DB和缓存不一致问题;图二,会产生DB和缓存不一致问题,即4.read先于3.sync执行。 如果不做处理,缓存里的数据可能一直是脏数据。解决方式如下:
注:设置缓存时,一定要加上失效时间,以防延时淘汰缓存失败的情况!
四、个人的一些见解 ↑1、架构演变
- 架构演变一:方案一 -> 方案一+分库分表 -> 方案二+分库分表 -> 方案四+分库分表;
- 架构演变二:方案一 -> 方案一+分库分表 -> 方案三+分库分表 -> 方案四+分库分表;
- 架构演变三:方案一 -> 方案二 -> 方案四 -> 方案四+分库分表;
- 架构演变四:方案一 -> 方案三 -> 方案四 -> 方案四+分库分表;
2、个人见解
- 加缓存和索引是通用的提升数据库性能的方式;
- 分库分表带来的好处是巨大的,但同样也会带来一些问题,详见 数据库之分库分表-垂直?水平?
- 不管是主备+分库分表还是主从+读写分离+分库分表,都要考虑具体的业务场景。某 8到家发展四年,绝大部分的数据库架构还是采用方案一和方案一+分库分表,只有极少部分用方案三+读写分离+分库分表。
- 记住一句话:不考虑业务场景的架构都是耍流氓。