2009年4月30日星期四

某网站服务器4*136G RAID数据恢复过程

作者:张宇,北亚服务器数据恢复中心,转载请联系作者,如果实在不想联系作者,至少请保留版权,谢谢。

[数据恢复故障描述]
  某网站服务器,品牌为组装,使用tyan(泰安)主板,AMD CPU*4,由4块68针SCSI硬盘 RAID0组成存储体系(听说2007年花了5万元买的,而且采用RAID0,这个专业程度真是不敢恭维)。
  操作系统为LINUX,重要数据为MYSQL数据库及网站数据文件。
  由于电源损坏(5万元买的设备竟然没有冗余电源),重新更换了电源测试,硬件销售商竟然怕数据损坏,留下RAID卡把硬盘全部拔掉启系统(真是无语了),再次连接启动系统时,RAID信息已经损坏。
  之后做了一些操作。(此部分操作可能涉及责任问题,无法询问清楚)
  最后的现象是:启动操作系统时提示无效的引导记录。
  需要恢复服务器数据,同时重新激活修复服务器系统。

[数据恢复分析]
  更换电源后,因硬盘全部拔掉,但RAID卡依然留在主机系统里,这样,加电检测RAID控制器时,就会认为所有硬盘已经存在故障,导致RAID逻辑卷下线。
  重新加电后,虽然硬盘可能还是好的,但RAID控制器作为安全考虑,不会试图重新加载所有硬盘,重建RAID卷。这时候如果有一些正确有方式还有可能恢复数据(但数据重要的话不建议,可以参考我的其它文章),但估计用户采用的错误的方式进行了重建等操作,导致所有数据不可用。
  RAID0本身不会涉及同步操作,故而除非重建时清0数据,其余情况应该不会有致命性损坏,但需要分析原RAID的结构,并进行虚拟重组。

[数据恢复过程]
  1、对所有硬盘按单盘方式完整镜像。
  2、在镜像中分析原RAID的结构参数。
  3、搭建虚拟RAID环境,组织RAID逻辑卷。
  4、为保证完整性,将数据打包为TAR.GZ。
  5、重新配置RAID,安装系统,将恢复后的数据迁移回原系统。

没有评论:

发表评论