searchusermenu
  • 发布文章
  • 消息中心
点赞
收藏
评论
分享
原创

raid掉线无法修复后数据救援流程

2023-10-24 02:12:32
17
0

线上机器raid1,raid10,raid50同组raid发生两块及多块盘同时故障(UBAD/CSHEILD/FAILED状态),常规操作无法修复raid状态的情况下,尝试用复制整块硬盘信息的方式救援数据

1.救援方式:

linux系统下用dd命令将故障盘整盘复制到备盘上,具体命令:
ddif=/dev/sdxof=/dev/sdy bs=1Mconv=noerror,sync &
其中/dev/sdx为故障盘盘符,/dev/sdy为备盘盘符

2.操作步骤:

 a. 系统运维:记录故障盘的硬盘槽位和SN,并为故障盘做上标记,避免和备盘SN搞混淆,然后将故障机关机。
例:故障盘slot2~slot11对应标记为dd盘2~dd盘11,所有硬盘标记完后均需要拍照发群里,并记录下标记所对应的SN号。

如上图:如故障盘所在故障机的槽位为slot4,则标记为dd盘4,对应的SN:S2UJNX0J203899

>>> 实际操作不能直接在硬盘写标记(手写标记会影响维保更换),用便利贴贴在硬盘上,然后在便利贴上做标记。
b. IDC:根据故障盘个数寻找对应数量的备盘,备盘容量、规格要跟故障盘一致(三星PM863A SSD故障时备盘不要再用同型号),记录下备盘的SN并做好标
记,避免和故障盘搞混淆。
例:备盘标记为好2~好11(尽量与故障机数据盘的slot相对应),分别对应故障盘的a~j,所有硬盘标记完后均需要拍照发群里,记录下标记所对应的SN号

如上图:备盘上标记备盘4,与故障盘的槽位号slot4匹配,对应的SN:PHYS736203T1480BGN
>>> 实际操作不能直接在硬盘写标记(手写标记会影响维保更换),用便利贴贴在硬盘上,然后在便利贴上做标记。
c. 硬件运维:寻找带有HBA卡的备机,IDC现场运维人员可根据照片标记好每个槽位对应标记的
硬盘,如下图,将步骤a b标记了的硬盘对应插入槽位。 

 

 

d.系统运维:系统下再次确认故障盘SN和备盘SN,并记录下备盘和故障盘盘符对应关系,确认完成后开始步骤2的救援方式开始dd操作,多块盘依次dd。
e. IDC现场运维: 系统运维人员完成所有的dd操作后,通知IDC现场运维人员将备盘按照步骤c的对应关系插到故障机上,0~5槽位为dd盘1~dd盘6,6~11槽位为备盘1~备盘6,如下图

4.注意事项:
>>>牢记上述故障盘和备盘的标记方式,有任何不确定的地方第一时间和系统运维人员进行沟通,双方确认无误后才能操作。
>>数据中心购买一些便利贴做“标识“用途

0条评论
0 / 1000
z****n
4文章数
0粉丝数
z****n
4 文章 | 0 粉丝
原创

raid掉线无法修复后数据救援流程

2023-10-24 02:12:32
17
0

线上机器raid1,raid10,raid50同组raid发生两块及多块盘同时故障(UBAD/CSHEILD/FAILED状态),常规操作无法修复raid状态的情况下,尝试用复制整块硬盘信息的方式救援数据

1.救援方式:

linux系统下用dd命令将故障盘整盘复制到备盘上,具体命令:
ddif=/dev/sdxof=/dev/sdy bs=1Mconv=noerror,sync &
其中/dev/sdx为故障盘盘符,/dev/sdy为备盘盘符

2.操作步骤:

 a. 系统运维:记录故障盘的硬盘槽位和SN,并为故障盘做上标记,避免和备盘SN搞混淆,然后将故障机关机。
例:故障盘slot2~slot11对应标记为dd盘2~dd盘11,所有硬盘标记完后均需要拍照发群里,并记录下标记所对应的SN号。

如上图:如故障盘所在故障机的槽位为slot4,则标记为dd盘4,对应的SN:S2UJNX0J203899

>>> 实际操作不能直接在硬盘写标记(手写标记会影响维保更换),用便利贴贴在硬盘上,然后在便利贴上做标记。
b. IDC:根据故障盘个数寻找对应数量的备盘,备盘容量、规格要跟故障盘一致(三星PM863A SSD故障时备盘不要再用同型号),记录下备盘的SN并做好标
记,避免和故障盘搞混淆。
例:备盘标记为好2~好11(尽量与故障机数据盘的slot相对应),分别对应故障盘的a~j,所有硬盘标记完后均需要拍照发群里,记录下标记所对应的SN号

如上图:备盘上标记备盘4,与故障盘的槽位号slot4匹配,对应的SN:PHYS736203T1480BGN
>>> 实际操作不能直接在硬盘写标记(手写标记会影响维保更换),用便利贴贴在硬盘上,然后在便利贴上做标记。
c. 硬件运维:寻找带有HBA卡的备机,IDC现场运维人员可根据照片标记好每个槽位对应标记的
硬盘,如下图,将步骤a b标记了的硬盘对应插入槽位。 

 

 

d.系统运维:系统下再次确认故障盘SN和备盘SN,并记录下备盘和故障盘盘符对应关系,确认完成后开始步骤2的救援方式开始dd操作,多块盘依次dd。
e. IDC现场运维: 系统运维人员完成所有的dd操作后,通知IDC现场运维人员将备盘按照步骤c的对应关系插到故障机上,0~5槽位为dd盘1~dd盘6,6~11槽位为备盘1~备盘6,如下图

4.注意事项:
>>>牢记上述故障盘和备盘的标记方式,有任何不确定的地方第一时间和系统运维人员进行沟通,双方确认无误后才能操作。
>>数据中心购买一些便利贴做“标识“用途

文章来自个人专栏
文章 | 订阅
0条评论
0 / 1000
请输入你的评论
0
0