作者:监控易 来源:美信时代
发布时间:2021-04-09
欧洲最大云服务公司OVH机房着火
据法国东部下莱茵省省政府于当地时间2021年3月10日发布的公告,欧洲最大数据中心运营商OVH发生严重火灾,其位于下莱茵省首府斯特拉斯堡的数据中心起火,当地消防部门动用了上百名消防员才得以将大火扑灭。
OVH公司创始人克拉巴在社交媒体上表示,该数据中心的4个分区当中有一个分区被大火完全烧毁,另有2个分区部分受损,最后一个分区则未受到影响。他建议客户启动容灾恢复计划。他表示将在接下来的 1-2 周对服务器进行紧急修复,完全恢复时间待定。据了解,由于OVH公司的客户有大量服务器在此托管,所以大火已造成部分网页登陆异常,相关企业和机构表示将尽快启用备份服务器来恢复网页。
OVH 在全球拥有 27 个数据中心,其中 15 个位于欧洲。这场灾难被认为已导致超过 350 万个网站下线,而这一切发生在 OVH 启动了首次公开募股 (IPO) 计划两天后。
频频起火的机房
这场大火对 OVH 的众多客户公司可真是“飞来横祸”。虽然本次 OVH 数据中心机房火灾原因尚未明晰,但机房起火早已不是新鲜事。由于机房内布线复杂老化、线缆负载过大、设备积尘未及时清理、老旧设备未及时更换、机房温度过高、空调水管漏水等原因导致的火灾频发。
2015 年 10 月,由于服务器所在机房着火断电,引起 WindowsAzure 上海数据中心发生故障,导致 Azure 基础设施离线无法提供正常服务
2018年8月,东京某建筑发生火灾,据称该建筑为建设中的亚马逊AWS东京数据中心。大火燃烧了八个小时,导致五人死亡,五十人受伤,烧毁了大约三分之一建筑物。
2019年8月12日,中国台湾台北故宫南院3楼空调机房着火,消防员奋战近40分钟将火扑灭。
......
机房是一个企业的核心价值区域,在信息化建设和数字化转型过程中,机房运行处于信息交换管理和数据存储的核心位置。信息化的建设,相关系统构建中的计算、交换、存储、控制等设备成为它们的核心硬件。这些核心设备能否正常工作,将直接关系到信息化系统的安全稳定运行。一旦某台设备出现故障,对数据传输、存储及系统运行构成威胁,就会影响到全局系统的运行。如果不能及时处理,更有可能损坏硬件设备,耽误业务系统运转,造成的后果不堪设想。那么,是否配置了高质量高性能的设备就高枕无忧了呢?答案肯定是否定的,以上频频发生的火灾已经发出了警示。那么为了机房安全我们该做些什么?
美信监控易——机房动环监测,保障机房环境安全
机房着火事件频频发生,很大原因是对机房环境监管不到位造成的。因此,做好“预防”,保证机房环境安全才是避免损失和灾难最重要的事情。机房建设过程中必须要搭配行之有效的监控系统,避免因为监控不到位而引发的一系列安全故障问题
美信科技“监控易”机房动环监控平台可将机房分散的设备运行情况实现集中化的管理,对机房的动力、环境、安防、资产等系统进行可视化集中监控,实时感知机房所有系统和设备的运行健康状态,将可能发生的威胁扼杀在摇篮里,保障我们机房的安全。
机房监控系统实现的功能
美信监控易监控系统需要实现的主要功能有以下5个主要方面:
1、 集中管理:一个平台汇集所有机房动力环境监控信息和IT监控信息,系统所有状态一目了然。
2、 实时监控:改变传统人工巡检排查的方式,采用24小时不间断智能实时巡检,避免了因运维人员能力水平差异或其他原因导致的巡检不到位的情况。
3、 智能告警:机房运行中出现异常情况,如机房温度过高、湿度异常等情况,多种智能告警方式实时通知运维人员机房运行状况。
4、 能效管理:通过大数据技术对各类用电设备的监测数据精确统计,为机房降低PUE提供依据。
5、 资产管理:对机房设备和IT设备进行全生命周期管理,历史记录查询和趋势分析辅助运维决策。