前几天接到一组4块盘SCSI RAID0+1的数据恢复,客户说做了两组raid1,现在raid状态里显示有3快盘offline。如果两组盘分别作raid1,现在也应该有一组逻辑盘可以正常工作,但是事实并不是这样,我就表示有疑问了,什么原因? 把硬盘单独链接SCSI适配器进入系统没有发现异常,也没有明显的raid信息区域,比较之后发现1、3号盘及2、4号盘每组都有相同性,但后面有大量不一致数据。1号盘及2号盘里有分区表,每个分区表里的描述都大约指出原逻辑盘分区总和大约68G。 莫非是两组RAID0?但1、3号及2、4号均有部分完全相同的数据,这不科学。那就是RAID1+0(即两两做RAID1,再做RAID0,这种安全级别高,客户是集成商做的,可能性最大),一段时间内,两组RAID1中先后都有一块硬盘离线(此后就相当于RAID0,再不能提供任何冗余)。再后来,又有一块硬盘离线,系统崩溃。这种情况非常符合RAID里的表现。也有可能是RAID0+1(即两两做RAID0,再做RAID1,这种不太好,推断可能性不大)。这样一来的话除1、3组成的RAID,没有任何错误,重组数据直接写回RAID,系统正常可以启动,文件访问也正常。 但是验证的时候出现了问题,这都是两年前的数据!!!难道是用户做了RAID0+1,结果组成RAID1中的其中一组RAID0中有一块盘离线(应该为1或3),导致整个RAID0离线(两块离线了),之后一直以单RAID0的方式工作(想起来竟然两年有余,汗!),直到最近,剩下的一组RAID0中有一块盘离线,RAID彻底瘫痪。用户使用的RAID卡为ADAPTEC的0通道RAID卡,比较低端,无法安全缓冲数据,最后离线时,因数据部分未写入等原因导致文件系统一致性有问题。 重新组织3及5号盘,修正错误,数据100%恢复成功。