加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 业界 > 正文

服务器数据全没了!一次RAID5崩溃引发的思考...

发布时间:2018-09-14 10:08:48 所属栏目:业界 来源:DOIT
导读:9月15日技术沙龙 | 与东华软件、AWS、京东金融、饿了么四位大咖探讨精准运维! 事件发生在Linus工作室乔迁之际,主力军Whonnock服务器中途崩掉,自动下线关机,宕机导致电脑全卡,离开了服务器,啥也干不了啊! 怎样快速恢复?重组RAID很容易破坏原数据。Li
9月15日技术沙龙 | 与东华软件、AWS、京东金融、饿了么四位大咖探讨精准运维!

事件发生在Linus工作室乔迁之际,主力军Whonnock服务器中途崩掉,自动下线关机,宕机导致电脑全卡,离开了服务器,啥也干不了啊!

怎样快速恢复?重组RAID很容易破坏原数据。Linus团队尝试把文件全部转移到其unRAID Vault备份服务器,期待系统能重新上线。

此时Linus却发现

这台服务器由三组RAID5构成,24块SSD在Windows内全部并成一块,如果任意一组RAID5彻底损坏,全部数据就会丢失,经检查,当时仅有不到10%的数据备份完成。

重建服务器?这可不是件易事,有可能会变得更糟。为了诊断出原因,这位小哥首先把服务器转移到另一台机箱,换一套新的SATA背板再接上更强的电源就可以了吧?...

服务器数据全没了!一次RAID5崩溃引发的思考...

服务器数据全没了!一次RAID5崩溃引发的思考...

服务器数据全没了!一次RAID5崩溃引发的思考...

小哥甚至换用另一张LSI RAID控制卡,试图导入阵列,虽然这玩意儿检测到了磁盘,形成了阵列,但就是无法正常导入,几乎前14个小时都花在了联系专业数据恢复服务上!!

服务商也只能通过SSH命令远程将文件包导回故障服务器,帮助恢复那组挂掉的RAID5。下载远程恢复平台后,试着重启磁盘,接上UPS(不间断电源)后,小哥心想,要是能有个能接入24个磁盘的主板或HBA集成卡来恢复数据就更好了,他准备在每个RAID5重建时,8个一组依次接入主板,但RAID5偏偏死活不让其他软件直接访问磁盘原数据,把磁盘全拔出来直接连主板,按理说该重新启动了,虽然磁盘在BIOS里能被检测到,但困难重重,PCIE端口错误,SATA口全部未检测到 …

服务器数据全没了!一次RAID5崩溃引发的思考...

服务器数据全没了!一次RAID5崩溃引发的思考...

如果失去任意一组RAID5中的3块磁盘挂掉

意味着所有RAID数据再也找不回了

word天,真的要吃土?

此时,系统持续处于无法启动状态

实在让人恼火

小哥表示自己有坐过山车的赶脚了,要知道Whonnock服务器里存着很多正在制作的视频项目,还没来及备份就… 其中一段视频,光租设备录制就花了一千多刀,处理视频的模板、台词模板、用户协议等一大堆重要文件都在这台服务器上,异地备份服务器还没装好,如果这些数据没了,蓝瘦香菇…

网友不禁感叹:小哥够大胆,在服务器中用SSD重组RAID,SSD一旦挂掉,数据是完全不可能恢复的!用机械盘组RAID会更安全。

这20分钟的视频让观众的心随着小哥跌宕起伏,好在经过重新挂载文件,原数据恢复正常!

 

虽然服务器最终恢复正常,但团队始终冒着极高风险,并为此付出了时间和精力,业务效率受到了重大影响。这还只是个小型服务器,若在上市企业或政府平台的大规模数据中心中出现此类问题,后果不堪设想,任何一丁点儿差错带来的直接经济损失不可估量!!

【编辑推荐】

  1. 从四种场景出发,详细解读无服务器架构的落地应用
  2. 高并发环境下服务器该如何优化
  3. 高防服务器如何防御别人恶意攻击
  4. 服务器周期内只会关机一次,为什么能够长时间持续工作而不宕机?
  5. Apple ID 连接服务器时出错的原因!解决办法!
【责任编辑:武晓燕 TEL:(010)68476606】

点赞 0

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读