5.6 分布式系统
分布式系统被部署在客户和用户都很分散的环境中。这些系统依靠LAN和WAN的资源为用户提供访问,组成分布式系统的要素需要进行同步和协调以防止出现中断和处理错误。分布式系统的一种常见形式是支持用于机构跨多个地理区域业务处理的大型数据库管理系统(DBMS)。这种应用中,在每个地点的服务器之间进行数据复制,用户从他们的本地服务器访问系统。
5.6.1 应急考虑
分布式系统的应急考虑利用了前面所述平台的概念。因为分布式系统更依赖于局域和广域网的连接性,分布式系统的应急措施和前面讨论过的LAN和WAN很相似。
应该在分布式系统设计和实施时建立应急方案。例如,建立分布式系统时,将所有数据放置在一个地点(如机构总部)并被复制到本地站点。本地站点的变化可以被复制到总部。如果数据以只读方式被复制到本地站点,就等于在每个本地站点对分布系统的数据进行了备份。这意味着如果总部服务器发生故障,还可以通过WAN访问本地站点的数据。相反的,如果每小时将数据从本地站点上载到总部站点,那么总部站点也就成为本地服务器的备份了。
正如上面举的例子那样,典型的分布式系统本身就有冗余可以被结合到应急策略中。例如一个分布于机构总部和办公分部的重要处理系统。假设数据被复制到两个站点,那么就可以在这两个站点之间建立互惠协议做为一种经济有效的恢复策略。根据这一协议,在一个办公地点发生中断时,主要人员可以被重新安排到另一个办公地点继续系统的处理。这种策略因为不用采购和装备备用站点所以可以节省大量的应急费用。