服务器数据恢复环境:
raid5磁盘阵列;
10块磁盘,单盘容量1TB;
6号盘是热备盘。
服务器故障:
阵列中2块磁盘离线,黄色警报灯亮起。管理员对服务器初步检测,发现阵列磁盘序列号不能读取/无法通过扩展卡识别,初步推断磁盘物理故障。管理员联系我们数据恢复中心进行数据恢复。
服务器raid数据恢复过程:
1、服务器数据恢复工程师对故障服务器进行初检,发现该磁盘阵列故障情况比较复杂。正常硬盘和掉线硬盘需要采用不同的方法处理:正常磁盘可通过数据恢复软件镜像备份,存在物理故障的离线硬盘则需要修复硬件故障后再进行备份。常用的磁盘故障修复方法为加电检测,判断故障硬盘有无起转、磁头能否寻道,然后通过清洁HDA氧化组件、更换ROM芯片、更换磁头等方法进行修复。本案例中掉线的2块硬盘中的1块磁盘的物理损坏严重无法修复,只能通过另一块磁盘进行备份和数据恢复。
2、判断起始扇区。将不包括热备盘的其他9块磁盘通过数据恢复工具打开,并将镜像文件解析为磁盘,发现该raid5中所有磁盘的0扇区都为“55AA”,0x01C2H处显示“05”代表一个扩展分区,该MBR分区不正确。继续查找发现该阵列在另外1块磁盘中的MBR分区是正常的(0x01C6处数值代表指向的下一个扇区为GPT的头部),基本可以确定该盘是第一块硬盘,GPT分区所在扇区起始于172032扇区,因此初步确定LUN的起始扇区是172032扇区。
3、判断raid阵列stripe(条带)大小。
stripe(条带)是raid磁盘阵列中用于数据处理的基本单元,条带的大小受raid磁盘阵列影响,分析条带大小的依据是raid5中每一条带组含一个大小与之相等的校验区。通过查询分析确定该raid阵列中的条带大小为1024扇区。
4、确定磁盘阵列磁盘盘序。
该阵列的条带大小为1024扇区,按照此规律进行分割,使每一条带与记录大小相同且阵列中所有磁盘全部跳到283123。然后通过对比分析raid5阵列走向,将已经分析出来的第一块硬盘放在第一位即可,实际分析的阵列盘序为9-3-10-4-2-1-5-8-7。
5、重组RAID阵列。
借助利用北亚数据恢复中心自主开发的工具将raid阵列进行重组,属性为raid5/Stripe size 512KB/左异步。阵列重组完成后进行数据验证。
6、数据验证。
对重组好的阵列进行数据验证没有发现问题,本次数据恢复成功。