暴雨预警信号的级别依据气象灾害可能造成的危害程度、紧急程度和发展态势一般划分为四级:Ⅳ级(一般)、Ⅲ级(较重)、Ⅱ级(严重)、Ⅰ级(特别严重),依次用蓝色、黄色、橙色和红色表示,其中暴雨红色预警:3小时内降雨量将达100毫米以上,或者已达100毫米以上且降雨可能持续。根据国务院新闻办公室2021年7月28日举行的新闻发布会介绍的情况,2021年7月20日郑州降雨量最大时,一小时降雨量达到201.9毫米,突破我国大陆小时降雨量的历史极值,由此可见,本次郑州大雨已经远远超过红色预警值。
数据中心是全球特定的设备网络,用来在因特网基础设施上传递、加速、展示,计算、存储数据信息。数据中心作为承担国家关键基础设施的重要组成部分,主要负责计算机基础环境和应用系统日常运行的工作,包括计算机系统,通信系统,存储系统等,还包括冗余的数据通信连接、环境控制设备、监控设备以及各种安全设备等,当发生上述极端暴雨天气情况时,数据中心应思考如何保持自身业务连续性。
通过暴雨对数据中心的影响分析,可以分为两个阶段来提升业务连续性,第一个阶段是数据中心前期规划到建设阶段,第二个阶段是后期正常运营阶段,参照业务连续性管理体系的标准来提升。
一、新建数据中心的前期规划到建设阶段
1.前期规划阶段
对于新建数据中心,必须做好新建数据中心的选址工作。
除了需要考虑数据中心将来业务开展情况,数据中心的地理位置应避开多雨或者易发洪水的地区,安全的地理位置将成为衡量数据中心安全的重要指标。
2.数据中心设计规划阶段
对于新建数据中心,在进行数据中心的规划和设计过程中,依据GB 50174-2017版标准,新建A级数据中心首层建筑完成面应高出当地洪水百年重现期水位线1.0m以上,并应高出室外地坪0.6m以上。
由于数据中心内部放置计算机和网络设备等设备,承载着重要的功能,并且价格不菲。如果机房顶面防水没有做好,漏水事故一旦发生,导致数据大量丢失,其经济损失不可估量。企业数据中心机房顶面的防水对整个机房起着举足轻重的作用。
在机房的结构设计过程中,除了要注重主体建筑物结构设计,还必须考虑发电机房的结构设计,依据GB 50174-2017版标准,标准中只规定了屋面的防水等级为Ⅰ级或者Ⅱ级,并没有对发电机房的防水等级作出规定,因此建议发电机房的防水等级应该至少要达到Ⅰ级。
同时,在设计过程中,需考虑对主机房、发电机房的排水系统和应急排水系统的合理设计,无论排水系统和应急排水系统均需考虑如何过滤杂物。此外,在进行储油罐安装设计时,储油罐应使用漂浮带将油罐固定到机座上,罐坑需要进行防水处理,油罐防渗池内空间选用中性沙回填,上部采用预制板做防护并提前进行防水处理,防止雨水、地表水和外部油品渗入池内导致油罐出现上浮问题。
3.数据中心建设阶段
在数据中心建设过程中,需特别注意整体建筑物的防水施工,尤其是主机房的防水、发电机房的防水、雨水管线、排水系统施工对施工工艺提出高标准要求。为了便于事故排水,排水立管不应小于DN150,排水系统主干管道不应小于DN100,应设置室外排水管道,地漏位置避开下层强电配电柜,任何条件下禁用PVC排水管。
施工完成以后,应制定合理的验收标准。验收内容必须包含防水材料、防水工艺等内容。
二、数据中心的运营阶段
在策划阶段,数据中心依照ISO 22301:2019版标准要求,应建立相关职能和不同层次的业务连续性目标,由此组建针对暴雨天气业务连续性小组,将保证数据中心全年业务中断时间为0作为业务连续性管理目标。
1.业务影响分析和风险评估
通过业务影响分析,针对数据中心的运营,确定影响数据中心业务连续性的主要因素是确保供电系统的连续性,业务连续性小组针对暴雨极端天气,组织进行风险评估工作,分析暴雨极端天气情况下,可能出现的风险,以及这些风险会给业务带来的影响级别,确定风险等级,识别高风险项。
2.业务连续性策略和解决方案
业务连续性小组针对风险,制定业务连续性管理策略,业务连续性实施策略和业务连续性资源保障策略。
在业务连续性实施策略中,业务连续性管理目标、业务连续性计划的制定等形成了管理性文件。资源保障策略从管理的层面定义了暴雨天气业务连续性小组的组织分工,天气信息的收集和发布,工作环境和基础设施,暴雨天气应急装备和物资需求,信息通信技术系统,资金和财务状况,以及相关方管控。
对于应急物资的储备,需要特别关注柴油发电机的供油问题,必要情况下,提前多采购燃油进行储备。依据GB 50174-2017版标准,柴油发电机燃料存储量至少满足12小时用油量,为应对极端暴雨天气出现的市电断电情况,必须保障柴油发电机系统持续供油需求,在预警发布后提前进行燃油补给,甚至在发生极端暴雨天气情况下,要求供油车提前停靠在公司院内油库附近待命。除此之外,数据中心还应与供油单位签署供油协议,保证在紧急情况下优先紧急供油。
3.业务连续性计划和程序
根据场景,制订应急预案,同时识别应急过程中所需的物资,建立应急物资清单,定义业务连续性小组的职责分工,建立紧急联系人清单,保障应急物资有效使用,做好各项暴雨前检查、演练及应急物资准备和管控工作。
规划应急响应流程,并做好预防和预警工作。人员的意识和能力对整体应急流程和控制起到非常重要的作用。为保证紧急情况下应急工作的
顺利进行,要提前做好培训和演练工作,确保数据中心员工尤其是关键岗位的员工得到专业完整的培训。
制定并发布业务连续性计划。业务连续性计划的制定,首先是高可用性,保障在暴雨情况下业务流程是可用的,需经过公司内部高管批准的计划。另外,业务连续性工作小组应共同开发和实施业务连续性计划,根据数据中心的业务范围和组织环境,尽快实现所描述的过程和预备目标,同时业务连续性计划应在监督的情况下进行,监督业务连续性维护程序的执行情况,以确保当业务需求发生变化的情况下不断变化。
(1)演练程序
制订应急预案,定期实施应急演练,并确保所有规划的场景均能进行演练。通过演练及时总结应急预案中的问题,及时更新应急预案,确保持续改进。
通常数据中心机房漏水事故的发生原因是由于空调的冷凝水泄露和地板渗水所致。但是,在极端暴雨情况下,机房或者发电机房很可能已经大量进水,在实施演练过程中,模拟场景从关注天气预报开始,在暴雨来临时,满足应急预案启动条件即启动应急预案,组织专业人员进行漏雨检查,检查点覆盖所有关键场所,尤其是机房及屋面、供配电区域、发电机房、冷站等区域。
在演练过程中,业务连续性小组根据事先的分工情况,注意沟通流程和沟通方式是否通畅,启动应急物资调配,检验应急预案的处置流程是否合理。
(2)业务连续性文档和能力评估
应急演练之后,需要认真做好总结工作。针对预案中人员分工,沟通流程,处置流程是否合理等问题进行总结,及时分析并对规划的机制中不合理的地方进行改进,更新应急预案,并做好演练记录,形成业务连续性文档,并做好归档工作。
业务连续性文档化的工作主要包括:业务连续性管理策略,连续性计划的目标,重要性声明,优先级声明,组织责任声明,紧急程度和时限声明,业务影响分析策略文件和实施文件,风险评估及风险处置,风险接受和风险减轻,应急预案手册,应急预案操作手册,应急响应指南,应急维护手册,应急维护指南,以及业务连续性测试和演练计划,演练过程记录等。
同时,要对能力评估,人员能力,技术能力,资源供需能力等方面进行评估,形成培训计划。
三、总结
以上是针对在极端暴雨天气情况下,如何减轻对数据中心业务连续性方面影响的一些应对措施,能够在极端暴雨天气下保证数据中心业务连续性方面起到参考作用。
中嘉和信作为深耕IDC行业十余年的数据中心服务商,致力于成为行业领先的数字化业务连续性保障服务提供商。业务覆盖金融机构、银行保险、人工智能、电商零售、交通运输、生产制造、能源化工、地产建安、生活服务等多个行业。中嘉和信为客户提供数据中心规划建设、数据中心托管运营、公有云、私有云、混合云、DCI全球组网、云网融合、信创集成服务、安全集成服务等定制化解决方案,依托经验丰富的专业技术服务团队和先进的运维服务管理体系,持续为各行业客户提供一站式数字化业务连续性保障服务,陪伴客户共同成长,助力客户实现梦想。如有业务需求请拨打010-51265666进行咨询,欢迎预约参观机房!
文章来源:互联网,如有侵权联系删除!