服务器数据恢复背景
北京某国企的一台服务器在正常运行过程中突然崩溃,该服务器共有240块硬盘,其中元数据存储使用了24块硬盘,硬盘搭配情况为9组raid1磁盘阵列和1组raid10磁盘阵列。其余所有硬盘平均组成了36组raid5磁盘阵列。而到这这一存储瘫痪的最终原因是其中的一组磁盘阵列中有2块硬盘先后离线,进而影响到整个服务器无法使用,只好联系北京数据恢复公司进行上门检测和恢复服务器数据。
服务器数据恢复初检情况
数据恢复中心安排工程师来到客户现场对故障服务器进行简单初检和评估随后开始进行数据备份。由于离线硬盘属于同一组raid阵列,所以对服务器采取两种不同的备份方式,即对离线的raid进行全盘扇区级镜像,其他未出现离线硬盘的raid阵列进行存储层面备份即可。在对故障raid阵列的备份过程中发现两块掉线的硬盘中有一块硬盘存在着大量的不规则坏道导致无法进行继续备份,只好对该硬盘进行固件更换和修复后继续备份,但大量的坏道依然存在。
数据分析
服务器数据恢复工程师首先对故障的RAID阵列底层结构进行详细分析,然后根据分析出来的raid信息虚拟重组出raid阵列进行进一步分析。通过进一步分析发现坏道极多的那块硬盘离线较晚,可能对最终的数据恢复结果产生一定影响。 登录到存储设备的管理系统获取文件系统中关于卷的基本信息发现文件系统中有2个卷,再继续分析Meta卷的目录和节点信息以及Meta卷到Data卷的索引算法。
服务器数据恢复
经过服务器数据恢复工程师的努力分析获取到了数据恢复必须的基础信息后,工程师通过编写程序进行节点和目录项扫描解析,导出文件系统的完整目录结构,解析每一个节点中的指针信息,将这些信息记录在数据库中。 客户对工程师恢复出的所有数据进行了随机抽样检测后确认数据完整,同意移交数据恢复结果,本次服务器数据恢复成功。