一剂现实

如果你真的想测试你的灾难恢复计划,你必须从办公桌后面走出来,走进现实世界。因为在现实世界中,备份站点丢失了你的磁带,你的紧急电话号码已经过时,你还忘了为在异地数据中心24小时工作的人们点中餐。

“除非经过测试,否则它只是一个文档,”德克萨斯州普莱诺的it外包和服务提供商Electronic Data Systems Corp.负责业务连续性服务的产品经理Joyce Repsher说。

你应该多久测试一次?一些专家建议至少每年对组织最关键的系统进行一次实际测试。Repsher说,在9.11事件之后,随着新的法规要求高管们负责保护公司数据的安全,企业正在进行比10年前更多的测试。Computerworld对224名IT经理进行的独家在线调查支持了这一说法,表明71%的人在过去一年中测试过他们的灾难恢复计划。

桌面灾难恢复测试包括检查一个清单,上面列出了在发生灾难时谁应该做什么。这样的走查是必要的第一步,可以帮助您捕获更改,例如将触发计划中其他更改的应用程序的新版本。Repsher说,他们还可以识别最重要的应用程序,“然后再进行更实际的恢复测试。”

公司在不同的时间间隔进行桌面测试。负责俄亥俄州费尔纳德市政府核设施清理工作的福陆费尔纳德公司(Fluor Fernald Inc.)每三年对其灾难应对计划进行一次桌面和物理测试,“或者在我们的硬件配置发生重大变化的任何时候,”简阿内特说,工程巨头福陆公司系统和行政部经理。

什么是关键?

确定哪些系统需要进行现场测试也很关键。福陆Fernald计划只对25个最关键的应用程序进行实时测试,然后只测试一台运行这些应用程序代表性样本的服务器,Arnett说他说:“我们觉得,如果我们能启动一台服务器,我们就可以启动10台服务器,特别是因为该公司使用基于英特尔的标准服务器和网络设备。

位于达拉斯的IT服务提供商CompuCom系统公司(CompuCom Systems Inc.)的存储联盟国家主管Todd Pekats说,最常见的实时测试形式是并行测试。并行测试在灾难恢复站点上恢复一组独立的关键应用程序,而不中断常规业务流。最现实的测试是在工作时间将关键系统完全切换到备用设备,这一测试成本高昂,而且很少进行,Pekats说,这只适用于最关键的应用。

EDS安全和隐私服务执行董事Al-Decker说,快速增长或变化的企业应该更频繁地测试其灾难恢复计划。他引用了一家公司的例子,该公司自1999年灾难计划要求在24小时内恢复关键系统以来,已增长了八倍。他说,如今,仅仅安装这些系统所需的磁带就需要4到10天的时间。

Repsher说,决定测试的现实性“是在你想要的保护量和金钱、人员时间和中断成本之间的平衡”。达拉斯风险咨询公司protivitiinc.高级经理丹•贝利(danbailey)补充说,随着一个组织灾难恢复计划的成熟,对其恢复计划的测试应该会变得更具挑战性。他说,虽然更现实的演习提供了更多关于哪些方面需要改进的教训,但一个刚开始制定初步计划的组织可能无法处理一个非常具有挑战性的演习。

不要以为一切都会按计划进行。这包括从恢复点有足够的食物或办公桌到有最新的联系电话。纳什维尔范德比尔特大学医疗中心(Vanderbilt University Medical Center)的灾难恢复管理员凯文•切诺维思(Kevin Chenoweth)说,通信问题很常见,但只要让每个工作人员给联系人名单上的每个人打一个测试电话,就很容易避免通信问题。

另外,千万不要假定备份磁带上的数据是最新的,也不要假定恢复硬件可以处理生产数据库。阿内特发现替换服务器上的驱动程序和网络配置卡存在细微差别,这迫使他加载较旧版本的Oracle数据库软件来恢复数据。

Chenoweth或他的员工与受影响的业务部门一起审查每个测试,并制定解决问题的具体计划(有时间表)。

最后,切诺维思说,感谢所有人的帮助,特别是如果测试让他们远离家他说,如果你有一个良好的关系,他们更有可能对公司的灾难恢复需求做出反应。

谢尔是马萨诸塞州博伊尔斯顿的一位电脑世界撰稿人。他的电话号码是rscheier@charter.net。米奇·贝茨的补充报道。

测量快照

上次测试贵公司的灾难恢复计划是什么时候?

不到一个月前

6%

一到三个月前

24%

四到六个月前

18%

六个多月前

16%

一年前

7%

一年多以前

10%

我不知道

19%

基础:对224名有灾难恢复计划的组织的IT专业人员进行的在线调查

做最坏的打算

本报告中的故事: