数据中心运行中会面临很多的风险,绝大多数风险是可以预知的,为了避免风险的发生,需要对风险进行科学的管理,统一认识、协同合作,将运行风险降到最低。

一、风险管理的定义

数据中心的风险管理是通过合理、有效的管理手段,降低风险发生的可能性,并将可能发生的风险所造成的影响降到最低,使数据中心能够快速地恢复运行,恢复所提供的服务水平。

二、风险管理的目的

对可预知的风险进行梳理,对不可预知的风险通过构建场景进行预判,通过科学方法创造风险管理手段,对风险进行控制,减少风险发生时的损失。

三、风险管理的范围

风险管理涉及人员、设备、操作、安全、制度、合规等多个方面,考虑到公司运营等因素还涉及财务、人力资源、职业健康等领域。

延伸阅读链接::
1、数据中心基础设施运维风险管理浅述
2、数据中心机房运行风险分析及应对
3、数据中心配电系统突发故障引发的风险分析
4、数据中心精细化运维风险管理思路简析

四、风险管理的主要内容

1. 风险意识管理

风险管理是数据中心运行中非常重要的组成部分,是一个以最小投入来减少损失的工作。在日常管理中,通过培训、演练等手段,应让全部运维人员具备风险知识,提高风险防范意识,将风险管理融入日常工作。

2. 风险评估

    1)在运行工作中,时刻都面临着风险,运行工作开始之初,就应对数据中心进行一次完整的风险评估工作,根据最佳实践经验,系统与设备特点,周边环境情况等各个方面的研究,评估风险可能出现的地方,并出台有效的管理措施。
    2)风险评估工作属于常态化工作,定期进行内部风险评估工作,考虑到某些监管需求,必要时可请第三方机构进行更加全面、彻底的风险评估工作。
    3)当发生风险事件,并处理完成后,应有针对性地进行一次风险评估工作。

    4)风险评估也是前期风险识别的重要组成部分。

3.风险预防

绝大部分风险是可以预估的,可以通过风险评估、隐患排查等手段,有效地预防风险的发生,应将风险预防工作安排在日常工作中,及时地发现风险隐患,出台相应的预防措施,及时更新管理手册。

4.体系建立与维护

    风险管理是要有体系支撑的,主要包括:
    1) 风险评估手册。
    2) 风险处置手册。
    3) 各主要设备发生风险时的应急操作手册。
    4)应急演练手册。

    需要注意的是,风险发生的场景、风险的来源等理论上是可以穷举的,运维人员在编手册时应将风险分类,定期梳理,将不同类别风险设置不同的处置措施。

5.风险来源识别

    主要包括:
    1) 人为因素。
    2) 设备因素。
    3) 内部风险,如管理缺陷、管理制度缺失或不完善等。
    4) 外部风险,如人员入侵、恐怖袭击、战争或附近的危险源等
    5) 自然灾害,如洪水、地震等。

    6) 重大传染疾病或重大公共安全事件

6.风险等级管理

风险本身也有等级划分,可通过成熟的管理体系、自身运行特点、可借鉴的经验等划分出风险等级。定义出各个等级的风险指标,作为数据中心风险管理事件的决策指导依据。

7.风险处置演练

演练可以验证风险处置措施的及时性、可靠性、合理性等,同时也可锻炼运维人员的处置动作,做到遇险不乱。演练可分为桌面演练和实际演练两种。

延伸阅读链接

☞ 免费领取数据中心基础设施运维资料
☞ 数据中心基础设施运维资料集锦
☞ 数据中心相关标准及规范汇编(附下载方法)
☞ 数据中心建设流程与建设标准(附下载方法)
☞ 数据中心基础设施工程前介验收检查表-Excel表格
☞《数据中心基础设施运维工程师培训教材》
☞ 电气计算EXCEL表格汇总
☞ 《数据中心基础设施规划设计视频教程
☞ 数据中心规范标准分类汇总整理
☞ 数据中心基础设施必备知识汇总
☞ 数据中心基础设施运维工程师培训汇总

五、风险处置

风险处置是根据风险评估结果制定并实施的风险计划,以期达到降低风险发生的可能性及在风险发生时减少风险带来的危害结果。一般遵循几个主要的原则。

根据风险发生的频次、危害程度、事件场景等评价原则,将风险按照高低、先后等顺序进行分级管理,制定风险列表,进一步制定风险计划,进而选择控制措施,常见的处置有四种,即回避风险、减少风险、转移风险和接受风险。风险处置要合规,即要求符合国家的法律法规、相关政策,现行国家标准以及可参考的国际标准,上级管理单位规章制度,自身安全需求等。

1)回避风险,对已知的风险或一些可能带来较大危害的风险无法直接处理,但有可替代执行方案的活动,采取回避措施,主动放弃或拒绝实施。

2)减少风险,通过选择控制措施来降低风险级别,使风险能够在评估时达到可接受级别,如从高风险降低到低风险或者可以接受的风险。

3)转移风险,依据风险评价将风险转移到其他可承担风险的另一方,但需要与相关方共同承担风险。转移风险后可能产生新的风险,因此必要时需要引入新的额外的风险处置措施。

4)接受风险,是指在进行较全面的预判和评估后,充分了解风险发生的可能性以及带来的危害,通过必要的处置措施处理,认为可以接受的风险。在风险处置中接受风险应较为谨慎。转载本文禁止删减、修改文中内容及链接​。

-END-


 

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注