概述
NIST 特别报告书 800-34,《信息技术(IT)系统应急计划指南》为政府IT应急计划提供指导、建议和需要考虑的事项。应急计划涉及到在紧急情况或系统中断后为恢复IT服务所采取的过渡手段。过渡手段可以包括将系统和操作重新安排到备用站点、使用备用设备恢复IT功能、或使用人工方法代替IT功能的运行。
IT系统容易受到各种伤害而导致中断,这些伤害的程度从轻微(如短时电源中断、磁盘驱动器故障)到非常严重(设备毁坏、火灾),这些伤害来自多方面从自然灾害到恐怖主义行动。虽然很多伤害可以通过机构风险管理工作中技术的、管理的和操作的方法予以消减,但事实上无法完全消除风险。在许多情况下,关键资源可能不在机构的控制范围之内(如电力和电信),而且机构也无法保证它们的可用性。于是有效的应急计划、以及其执行和测试对于消减系统风险与服务的不可用性就显得非常重要了。因此,为了保证应急计划的成功部门管理者必须确保达到以下要求:
1. 理解IT应急计划过程及其在整个运行连续性计划和业务连续性计划过程中的地位。
2. 制定或复查其应急策略及计划过程并运用计划周期要素,包括预备计划、业务影响分析、备用站点选择和恢复策略。
3. 制定和复查其IT应急计划策略,重点在于计划的维护、培训和对应急计划的演练。
本文涉及到针对七种IT平台 类型的应急计划建议并提供对所有系统都通用的策略和技术:
- 桌面计算机和便携式系统
- 服务器
- Web站点
- 局域网
- 广域网
- 分布式系统
- 大型机系统
本文还定义了机构在制定和维护其IT系统可行的应急计划项目时可以遵循的以下七步应急过程。这七个渐进的步骤被设计用来集成到系统开发生命周期的每一个阶段。
1. 制定应急计划策略条款。为制定有效的应急计划而制定的关于所需职权和指导方针的部门或机构正式的策略。
2. 进行业务影响分析 (BIA)。BIA协助对关键的IT系统和部件进行识别并确定优先次序。进行BIA的模板也可以对用户提供协助。
3. 确定防御性控制。为减小系统中断的影响以便提高系统的可用性和减少应急计划生命周期费用所采取的措施。
4. 制定恢复策略。通过恢复策略确保系统可以在中断后快速和有效的恢复。
5. 制定IT应急计划。应急计划应该包含恢复受损系统所需的详细的指导方针和规程。
6. 计划测试、培训和演练。计划的测试识别计划的缺陷,同时培训为计划的启动准备恢复人员;两项活动都提高了计划的有效性和整个机构的准备状态。
7. 计划维护。计划应该是活动的文档,有规律地更新以适应系统的扩展。
本文为制定IT应急计划提供了一个范本。范本定义了管理系统中断后所采取行动的三个步骤。通告/启动阶段描述了通知恢复人员和进行损害评估的步骤。恢复阶段讨论恢复团队和人员在备用站点或使用应急能力恢复IT操作时所建议采取的行动过程。最后阶段是重建,概述了将系统返回到正常运行条件下可以采取的行动。
|