searchusermenu
  • 发布文章
  • 消息中心
点赞
收藏
评论
分享
原创

RIAD、副本和纠删介绍和对比

2023-05-31 07:14:20
172
0

RAID:

独立磁盘冗余阵列(又称 RAID) 是由多个硬盘构成的集合,它们充当一个逻辑单元,用于提供更高的性能、针对驱动器故障的更好的数据安全性和更高的存储容量。最常用的是 RAID 0、RAID1RAID 5、RAID 6 和 RAID 10。接下来,我们简要了解一下:

RAID 0 – 它根据条带化机制来存储数据,数据被分成块,进行跨磁盘写入,从而提高数据读写性能。但是在可靠性上并没有得到提高。

RAID 1 – 它遵循镜像机制,这意味着块上的数据被复制并复制到两个硬盘,冗余度得到保证。它提供了很好的阅读速度。但是,在不同的驱动器上写入相同的数据会减慢该过程。

RAID 5 – 它基于奇偶校验机制,将数据分为多个分片和一个校验数据,因此至少需要三个磁盘构成这个级别。它在两个磁盘之间拆分数据,第三个磁盘从其他两个磁盘收集信息——“奇偶校验数据”。但是,奇偶校验数据不断分布在每个磁盘上,使每个磁盘都成为奇偶校验驱动器,从而提供针对两个驱动器故障的容错能力。存在写入时的放大,即写惩罚,写入速度低于raid0raid1

RAID 6 – 此 RAID 级别遵循条带化和奇偶校验机制来存储数据。它最多可以承受两个磁盘的故障。从而提供平衡的读/写速度和更好的冗余。

RAID 10 – 此混合 RAID 设置结合了 RAID 1(镜像)和 RAID 0(条带化)机制。它对跨磁盘条带化存储的数据创建镜像,提供最多两个磁盘的容错能力。

 

RIAD本身的应用在服务器上需要依赖RIAD卡将多块硬盘组件raid,从而实现硬盘的冗余,同时在企业级存储设备中也会用此方式提高数据的可靠性。部分存储常见在基础raid的技术基础上拓展开发了RAID2.0,将物理硬盘在划分为更小单位,然后跨硬盘来组件raid,这样一定程度上解决了热备盘分布和重构速度的问题。

 

副本:

多副本从一开始就被分布式存储广泛使用,是指数据在系统中切片,而每一个数据的切片都有多个副本,分布在不同节点中。这种机制不仅提供数据的可靠性,还能改善性能。由于多副本能够支持更多并发访问,无论是多个应用并发访问还是单个访问,数据可以从最快响应的节点获得,因此系统会提供更好的性能响应。副本的个数从2个到多个,通常应用最多的为2个或3个,副本数量过多虽然提高了数据冗余,但是在写入数据时消耗的时间更长,影响性能。

 

纠删码(EC

纠删码的实现方式与RIAD5RAID6的原理类似, 都是以将写入数据分片后通过计算校验数据来保证数据的冗余和可恢复性。不同的是raid5固定只有一个校验位,raid6固定只有2个校验位,但是EC可以灵活设置校验位数量,如EC4+2 为四个数据分片两个校验分片,EC8+38个数据分片三个校验分片。

另外,EC的算法目的是应用在分布式存储上的,因此设计之初就可以支持跨节点的,相较于raid只能支持硬盘间的冗余,纠删码可以灵活的设置为硬盘级、节点级,从而可以保证单个硬盘故障或者单个节点故障。

在成员故障后的热备上,纠删码原生就是将所有节点或硬盘作为参与热备的成员,也被称为全局热备。当出现成员故障时,纠删的方式是所有正常成员盘都会参与到重构中,因此重构速度是非常快的,但是传统RAID是有固定热备盘,只有RAID2.0在硬盘虚机话技术基础上才解决了固定热备盘的问题。

 

以上三者由于实现原理的不同,因此在实现冗余的同时有不同的磁盘利用率,通常来说冗余度越高带来的通常会有容量利用率或者性能的损耗。

类型 容量利用率
RAID0 100%
RAID1 50%
RIAD5 N/(N+1)
RAID6 N/(N+2)
RAID10 50%
N副本 1/N
EC N+M N/(N+M)

说明:EC N+M :N数据分片个数,M为校验分片个数。

0条评论
0 / 1000
郑****杰
2文章数
0粉丝数
郑****杰
2 文章 | 0 粉丝
郑****杰
2文章数
0粉丝数
郑****杰
2 文章 | 0 粉丝
原创

RIAD、副本和纠删介绍和对比

2023-05-31 07:14:20
172
0

RAID:

独立磁盘冗余阵列(又称 RAID) 是由多个硬盘构成的集合,它们充当一个逻辑单元,用于提供更高的性能、针对驱动器故障的更好的数据安全性和更高的存储容量。最常用的是 RAID 0、RAID1RAID 5、RAID 6 和 RAID 10。接下来,我们简要了解一下:

RAID 0 – 它根据条带化机制来存储数据,数据被分成块,进行跨磁盘写入,从而提高数据读写性能。但是在可靠性上并没有得到提高。

RAID 1 – 它遵循镜像机制,这意味着块上的数据被复制并复制到两个硬盘,冗余度得到保证。它提供了很好的阅读速度。但是,在不同的驱动器上写入相同的数据会减慢该过程。

RAID 5 – 它基于奇偶校验机制,将数据分为多个分片和一个校验数据,因此至少需要三个磁盘构成这个级别。它在两个磁盘之间拆分数据,第三个磁盘从其他两个磁盘收集信息——“奇偶校验数据”。但是,奇偶校验数据不断分布在每个磁盘上,使每个磁盘都成为奇偶校验驱动器,从而提供针对两个驱动器故障的容错能力。存在写入时的放大,即写惩罚,写入速度低于raid0raid1

RAID 6 – 此 RAID 级别遵循条带化和奇偶校验机制来存储数据。它最多可以承受两个磁盘的故障。从而提供平衡的读/写速度和更好的冗余。

RAID 10 – 此混合 RAID 设置结合了 RAID 1(镜像)和 RAID 0(条带化)机制。它对跨磁盘条带化存储的数据创建镜像,提供最多两个磁盘的容错能力。

 

RIAD本身的应用在服务器上需要依赖RIAD卡将多块硬盘组件raid,从而实现硬盘的冗余,同时在企业级存储设备中也会用此方式提高数据的可靠性。部分存储常见在基础raid的技术基础上拓展开发了RAID2.0,将物理硬盘在划分为更小单位,然后跨硬盘来组件raid,这样一定程度上解决了热备盘分布和重构速度的问题。

 

副本:

多副本从一开始就被分布式存储广泛使用,是指数据在系统中切片,而每一个数据的切片都有多个副本,分布在不同节点中。这种机制不仅提供数据的可靠性,还能改善性能。由于多副本能够支持更多并发访问,无论是多个应用并发访问还是单个访问,数据可以从最快响应的节点获得,因此系统会提供更好的性能响应。副本的个数从2个到多个,通常应用最多的为2个或3个,副本数量过多虽然提高了数据冗余,但是在写入数据时消耗的时间更长,影响性能。

 

纠删码(EC

纠删码的实现方式与RIAD5RAID6的原理类似, 都是以将写入数据分片后通过计算校验数据来保证数据的冗余和可恢复性。不同的是raid5固定只有一个校验位,raid6固定只有2个校验位,但是EC可以灵活设置校验位数量,如EC4+2 为四个数据分片两个校验分片,EC8+38个数据分片三个校验分片。

另外,EC的算法目的是应用在分布式存储上的,因此设计之初就可以支持跨节点的,相较于raid只能支持硬盘间的冗余,纠删码可以灵活的设置为硬盘级、节点级,从而可以保证单个硬盘故障或者单个节点故障。

在成员故障后的热备上,纠删码原生就是将所有节点或硬盘作为参与热备的成员,也被称为全局热备。当出现成员故障时,纠删的方式是所有正常成员盘都会参与到重构中,因此重构速度是非常快的,但是传统RAID是有固定热备盘,只有RAID2.0在硬盘虚机话技术基础上才解决了固定热备盘的问题。

 

以上三者由于实现原理的不同,因此在实现冗余的同时有不同的磁盘利用率,通常来说冗余度越高带来的通常会有容量利用率或者性能的损耗。

类型 容量利用率
RAID0 100%
RAID1 50%
RIAD5 N/(N+1)
RAID6 N/(N+2)
RAID10 50%
N副本 1/N
EC N+M N/(N+M)

说明:EC N+M :N数据分片个数,M为校验分片个数。

文章来自个人专栏
文章 | 订阅
0条评论
0 / 1000
请输入你的评论
0
0