数据中心运行中会面临很多的风险,绝大多数风险是可以预知的,为了避免风险的发生,需要对风险进行科学的管理,统一认识、协同合作,将运行风险降到最低。
一、风险管理的定义
数据中心的风险管理是通过合理、有效的管理手段,降低风险发生的可能性,并将可能发生的风险所造成的影响降到最低,使数据中心能够快速地恢复运行,恢复所提供的服务水平。
二、风险管理的目的
对可预知的风险进行梳理,对不可预知的风险通过构建场景进行预判,通过科学方法创造风险管理手段,对风险进行控制,减少风险发生时的损失。
三、风险管理的范围
风险管理涉及人员、设备、操作、安全、制度、合规等多个方面,考虑到公司运营等因素还涉及财务、人力资源、职业健康等领域。
四、风险管理的主要内容
1. 风险意识管理
风险管理是数据中心运行中非常重要的组成部分,是一个以最小投入来减少损失的工作。在日常管理中,通过培训、演练等手段,应让全部运维人员具备风险知识,提高风险防范意识,将风险管理融入日常工作。
2. 风险评估
4)风险评估也是前期风险识别的重要组成部分。
3.风险预防
绝大部分风险是可以预估的,可以通过风险评估、隐患排查等手段,有效地预防风险的发生,应将风险预防工作安排在日常工作中,及时地发现风险隐患,出台相应的预防措施,及时更新管理手册。
4.体系建立与维护
需要注意的是,风险发生的场景、风险的来源等理论上是可以穷举的,运维人员在编手册时应将风险分类,定期梳理,将不同类别风险设置不同的处置措施。
5.风险来源识别
6) 重大传染疾病或重大公共安全事件
6.风险等级管理
风险本身也有等级划分,可通过成熟的管理体系、自身运行特点、可借鉴的经验等划分出风险等级。定义出各个等级的风险指标,作为数据中心风险管理事件的决策指导依据。
7.风险处置演练
演练可以验证风险处置措施的及时性、可靠性、合理性等,同时也可锻炼运维人员的处置动作,做到遇险不乱。演练可分为桌面演练和实际演练两种。
五、风险处置
风险处置是根据风险评估结果制定并实施的风险计划,以期达到降低风险发生的可能性及在风险发生时减少风险带来的危害结果。一般遵循几个主要的原则。
根据风险发生的频次、危害程度、事件场景等评价原则,将风险按照高低、先后等顺序进行分级管理,制定风险列表,进一步制定风险计划,进而选择控制措施,常见的处置有四种,即回避风险、减少风险、转移风险和接受风险。风险处置要合规,即要求符合国家的法律法规、相关政策,现行国家标准以及可参考的国际标准,上级管理单位规章制度,自身安全需求等。
1)回避风险,对已知的风险或一些可能带来较大危害的风险无法直接处理,但有可替代执行方案的活动,采取回避措施,主动放弃或拒绝实施。
2)减少风险,通过选择控制措施来降低风险级别,使风险能够在评估时达到可接受级别,如从高风险降低到低风险或者可以接受的风险。
3)转移风险,依据风险评价将风险转移到其他可承担风险的另一方,但需要与相关方共同承担风险。转移风险后可能产生新的风险,因此必要时需要引入新的额外的风险处置措施。
4)接受风险,是指在进行较全面的预判和评估后,充分了解风险发生的可能性以及带来的危害,通过必要的处置措施处理,认为可以接受的风险。在风险处置中接受风险应较为谨慎。转载本文禁止删减、修改文中内容及链接。