《应急处理方案.docx》由会员分享,可在线阅读,更多相关《应急处理方案.docx(5页珍藏版)》请在第一文库网上搜索。
1、1.1. 应急处理方案驻场人员负责应急管理,为有效防范和应对信息系统突发事件采取的系列措施,包括但不限于确定重要业务及其恢复目标,制定业务连续性计划,配备必要的资源,编制应急预案、积极开展应急演练,处置应急事件等(一)信息技术故障:信息系统技术故障、配套设施故障;(二)外部服务中断:第三方无法合作或提供服务等;(三)人为破坏:黑客攻击、恐怖袭击等;(四)自然灾害:火灾、雷击、海啸、地震、重大疫情等。1.1.1. 应急准备应急准备包括应急预案、物资与人员、通知报告程序、后勤保障等方面的准备工作。各级组织明确应急组织体系组成人员,并设立7X24小时应急联系电话。应急预案包括总体应急预案和专项应急预
2、案。(一)总体应急预案是应对运营中断事件的总体方案,包括总体组织架构、各层级预案定位和衔接关系及对运营中断事件预警、报告、分析、决策、处理、恢复等处置程序。总体预案通常用于处置导致大范围业务运营中断的事件。(二)专项应急预案应当注重灾难场景的设计,明确在不同场景下的应急流程和措施。业务条线的专项应急预案,应当注重调动内部资源、采取业务应急手段尽快恢复业务,并和信息科技部门、保障部门的应急预案有效衔接。专项应急预案主要内容应包括:1 .应急组织架构及各部门、人员在预案中的角色、权限、职责分工;2 .信息传递路径和方式;3 .运营中断事件处置程序,包括预警、报告、决策、指挥、响应、回退等;4 .运
3、营中断事件处置过程中的风险控制措施;5 .运营中断事件的危机处理机制;6 .运营中断事件的内部沟通机制和联系方式;7 .运营中断事件的外部沟通机制和联系方式;8 .应急完成后的还原机制;9 .明确信息系统和基础设施的恢复优先次序、明确恢复时间目标(RTo)和恢复点目标(RP0)。10 .建立和完善第三方技术支持和应急响应服务机制:(1)快贷应制定切实可行的总体应急预案和专项应急预案。(2)定期审议、评估、更新、完善应急预案,确保其有效性。关键应急所需软硬件资源建设。(一)重点加强快贷关键资源的建设,实现信息系统的高可用性,保障信息系统的持续运行并减少信息系统中断后的恢复时间。(二)快贷关键硬件
4、设备建立备份机制,应急执行小组确保备份设备可用。(三)应急执行小组应制作数据、版本、配置、技术资料、应急预案等副本,配备业务操作和办公所需资源,并确保其能够迅速启用。应急人员:(一)明确关键岗位的备份人员及其备份方式,并确保备份人员可用;关键岗位须建立双人备份(A、B角)制度。(二)定期组织培训,培训内容包括应急预案和应急组织体系。1.1.2. 应急(突发)事件的分级应急事件分级。根据实际情况,快贷突发事件分为三级:一级事件(特别重大突发事件)、二级事件(重大突发事件)、三级事件(较大突发事件)。(一)一级事件(特别重大突发事件)快贷由于服务中断或重要数据损毁、丢失、泄露,造成经济秩序混乱或重
5、大经济损失、影响金融稳定的或对公众利益、社会秩序、国家安全造成特别严重损害的突发事件。(二)二级事件(重大突发事件)快贷由于服务中断或重要数据损毁、丢失、泄露,对平台或客户利益造成严重损害的突发事件。(三)三级事件(较大突发事件)快贷由于服务中断或重要数据损毁、丢失、泄露,对平台或客户利益造成较大损害的突发事件。1 .发现问题初步判断是否影响业务办理,不影响业务的一般故障报送技术人员处理;2 .影响业务上报行方;3 .应急执行小组人员赶赴现场分析故隙、制定解决方案、确定应急级别、制定故障重大事项(突发事件)报告;4 .应急保障小组建立外包联系,做好寻求外部支持的准备,寻求外部支援恢复业务系统运
6、行,编写总结分析报告。1.1.3. 应急启动和应急处理发生影响系统连续运行的生产事件,应在30分钟内报告应急指挥小组,应急指挥小组应在30分钟内决策是否启动应急处理应急执行小组应严格按照应急预案或决策方案实施应急处理,尽快恢复系统运行。无法在约定时间内恢复系统运行时,应急指挥小组应按照规定及时通知相关业务部门启动业务应急预案。应急处理过程基本要求:(一)应急指挥小组成员现场指挥;(二)参与应急的各单位人员须服从应急指挥小组的统一安排;(三)应急执行小组须对应急处理过程进行记录。需要外部公司技术支持时,应急保障小组应协调联系服务供应商提供支持。应急处理过程中出现异常或应急预案、决策方案失效,应急
7、指挥小组应即时上报应急指挥小组,由应急执行小组进行现场分析并提供决策依据。1.1.4. 系统恢复和重建应急执行小组按照应急预案或决策方案,依据业务系统服务级别逐一恢复各系统。系统恢复过程中,应急指挥小组应确定系统重入或重建策略;应急执行小组应对故障部件进行修复,重入或重建应急前状态,以确保信息系统的持续安全。1.1.5. 应急状态终止系统恢复后,应急指挥小组应即时组织恢复运行环境,并进行全面检查验证,同时向应急指挥小组书面报告检查情况。系统恢复提供正常服务级别后,应急指挥小组应按照预定的通知报告流程告知受影响单位和业务部门终止应急状态。1.1.6. 应急事件分析总结应急状态结束后,应急指挥小组
8、应组织召开分析会,并形成分析报告。应急执行小组组织编写应急过程分析报告,分析总结问题原因、过程及经验教训,形成应急总结报告。1.1.7. 应急方案的完善应急执行小组应根据应急过程分析报告和评价指标,制定应急方案的改进计划和整改意见。根据改进计划和整改意见,应急执行小组制定改进计划,修订完善应急预案。1.1.8. 风险防范(一)为有效防范、应对突发事件,风险防范应遵行以下要求:(二)对基础类设施实施厂商加强抗风险能力要求,如电源、主机及硬件、系统架构、网络等。(三)快贷系统上线、系统升级、网络改造、设备更新时,应对风险因素进行提前分析评估,制定切实可行的应急预案,事后应密切关注系统运行状况。(四
9、)利用好数据中台的应用日志审计及系统监测工具,做到对故障及时发现、及时报告,特别应注意重大业务活动、重大社会活动、信息系统重大变更时等关键时点。(五)应急处理过程中,如属于重发情况,应参照以往的处理办法或相关操作手册进行处理;情况不明的,参加处理人员应密切配合,对故除原因仔细分析,研究处理方案。(六)应急处理过程中,应妥善保护日志信息。(七)应急处理过程中引入预授权制,某一层级的人员缺位时,可以越级汇报情况、下达指令。(八)发生重大信息系统突发事件,应急执行小组应在事发后1小时内电话报告、2小时内书面报告应急指挥小组;应急之后小组应在事件发生后2小时内电话报告、8小时内书面报告管理部门。(九)重大信息系统突发事件处理结束后,运营公司应对处理情况进行全面总结,包括事件发生原因、处理过程、剩余风险评估及解决办法等。1.1.9. 持续改进每年开展一次对突发事件风险防范措施的全面评估和审计活动,包括评估风险识别,分析和控制措施的有效性、应急预案的完备性、应急演练的全面性和及时性,检验防范措施的有效性等,并及时改进风险控制措施,完善应急预案。每年开展一次对应急响应工作的全面评估与审计活动,评估范围包括应急响应的有效性、投入资源的充分性、突发事件报告的及时性等。将应急管理纳入全面风险管理体系,建立应急管理长效机制,保证应急管理工作的持续性和有效性。