Symantec数据中心容灾备份建设规划.pdf
《Symantec数据中心容灾备份建设规划.pdf》由会员分享,可在线阅读,更多相关《Symantec数据中心容灾备份建设规划.pdf(50页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、数据中心容灾及备份系统建设规划赛门铁克软件(北京)有限公司2010 年 5 月Your Infrastructure.Your Information.Your Interactions.Only Symantec Protects Them All.目录第 1 章容灾系统技术规范.41.1容灾系统建设总体规划.41.1.1容灾关键技术定义及指标说明.41.1.1.1灾难.51.1.1.2灾难恢复.51.1.1.3灾难恢复计划(DRP).51.1.1.4业务影响分析(BIA).51.1.1.5恢复时间目标及恢复点目标(RPO/RTO).51.1.2国家容灾标准 GB/T 20988-2007.
2、61.1.2.1第 1 级 基本支持.61.1.2.2第 2 级 备用场地支持.71.1.2.3第 3 级 电子传输和部分设备支持.81.1.2.4第 4 级 电子传输及完整设备支持.91.1.2.5第 5 级 实时数据传输及完整设备支持.101.1.2.6第 6 级 数据零丢失和远程集群支持.111.1.3界定数据容灾系统的适用范围.121.1.4界定数据容灾系统建设的目标.121.1.5界定容灾系统的总体架构.13第 2 章主流容灾技术说明.142.1数据备份.142.2实时数据保护.142.2.1数据镜像(Mirroring).142.2.2数据复制(Replication).152.2
3、.3软件复制(卷复制).172.3应用级容灾切换.172.4数据恢复测试.18第 3 章容灾系统规划设计.203.1容灾系统设计原则.203.1.1安全性.203.1.1.1不影响生产系统.203.1.1.2保证数据的一致性.213.1.2先进性.213.1.3创新性.213.1.4高可用性.213.1.4.1稳定安全.213.1.4.2负载高效.223.1.4.3冗余容错.223.1.5可扩展性.223.1.6可管理性.223.2容灾系统体系规划设计.233.3第一步,灾难恢复需求分析.243.4第二步,确定灾难恢复资源获取方式.243.5第三步,深化数据备份系统.243.5.1常规备份与恢
4、复.243.5.2操作系统数据备份 .293.5.3备份数据异地保存 .303.5.4备份数据异地恢复及验证.313.6第四步,存储整合.323.6.1集中存储及虚拟化管理设计.323.6.2集中存储及虚拟化管理所达到的特点及好处.333.6.2.1提高存储系统的可靠性.333.6.2.2提高存储系统的性能.333.6.2.3动态分级存储 .343.6.2.4通过快照功能,实现快速恢复.343.6.2.5简化存储管理的复杂性.353.7第五步,本地服务器整合.353.8第六步,实现远程实时数据保护.363.8.1远程镜像.363.8.2Symantec远程镜像数据容灾原理.373.8.3磁盘阵
5、列同步复制原理及局限性 .393.8.4操作系统镜像命令作用解释.413.8.5当生产中心数据系统故障.413.8.6灾备中心数据系统故障以及生产中心和灾备中心SAN 链路故障.423.8.7故障修复后的恢复(远程镜像快速恢复).433.8.8远程复制.493.9第七步,实现远程集群容灾切换.513.10第八步,建立数据恢复消防演习机制.52第 1 章 容灾系统技术规范随着数据中心的建立和完善,计算机信息系统需要在数据层面、应用层面集中后,对数据的安全和关键应用的可用性作为风险控制的焦点。很多系统准备或正在进行数据备份系统的规划和建设实施,数据备份系统建设的目标是要保证数据安全、可用,使计算机
6、信息系统和数据能够最大限度地防范和解决各种意外和故障所带来的数据丢失。然而,与大多数工程一样,数据备份/恢复及容灾系统建设本身在总体规划、方案选择和投产实施后的管理运行,以及真正面对数据恢复时的实际操作等方面也存在着潜在的风险。可以说,数据备份容灾系统本身也可能存在风险点,需要小心应对。备份/恢复及容灾系统建设中所涉及的潜在风险大致可分为技术风险、管理风险和投资风险,其中尤以技术选择风险最大,技术方案选择优越,可以规避一定的管理风险和投资风险。而这三者也存在内在的相互关联,不同规模的数据备份/恢复及容灾方案对应的建设投资规模、所采用的技术以及实施和管理的复杂度也不同,应考虑保护计算机系统的原有
7、投资并提高数据备份/恢复及容灾系统建设投资的利用率。1.1 容灾系统建设总体规划数据备份的目的是为了恢复!在数据备份的世界里,是有等级观念的,规模不同,数据备份/恢复和容灾系统所采用的技术和达到的功能是不同的,在系统建设资金投入方面的差距也很巨大。所以,对于数据中心来说,明确数据备份/恢复及容灾系统建设的总体规划十分必要。1.1.1 容灾关键技术定义及指标说明1.1.1.1灾 难由于人为或自然的原因,造成信息系统运行严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定的时间的突发性事件,通常导致信息系统需要切换到备用场地运行。1.1.1.2灾 难 恢 复将信息系统从灾难造成
8、的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态而设计的活动和流程。1.1.1.3灾 难 恢 复 计 划(DRP)为了减少灾难带来的损失和实现灾难恢复所做的事前计划和安排。1.1.1.4业 务 影 响 分 析(BIA)分析业务功能及其相关信息系统资源、评估特定灾难对各种业务功能的影响的过程。1.1.1.5恢 复 时 间 目 标 及 恢 复 点 目 标(RPO/RTO)衡量数据备份/恢复技术的技术指标叫RPO、RTO。RPO(Recovery Point Objective):以数据为出发点,主要指的是业务系统所能容忍的数据丢失量。在发生数据丢失时
9、,数据备份/恢复系统实现数据恢复时,恢复的数据与原始生产数据不一至的数据量。RPO 是反映数据恢复完整性的指标,在在线数据保护方式下,RPO 等于数据同步时间;在离线数据保护方式下,RPO 为相临两次数据备份的时间间隔。RTO(Recovery Time Objective):即数据恢复时间目标,主要指的是所能容忍的实现数据恢复的时间,也就是从系统故障发生,数据不能访问到业务数据恢复,数据能够备份访问所需要的最短时间。是反映数据恢复及时性的指标,RTO 值越小,代表数据恢复能力越强。不同规模的数据备份/恢复及容灾方案,RTO定义是不同的。1.1.2 国家容灾标准 GB/T 20988-2007
10、 国务院信息办信息系统灾难恢复规范将关键系统灾难恢复分为七个等级,并对每个等级的灾难恢复目标进行了具体的定义。比如第一级灾难恢复等级只是在异地保存备份数据,并不需要在灾备中心部署业务主机,当灾难发生需要恢复业务时,将从其他地方调配资源,进行业务恢复。标准中根据灾难恢复等级划分标准,将支持灾难恢复各个等级所需的资源(以下简称“灾难恢复资源”)分为以下7 个要素:1)数据备份系统 2)备用数据处理系统 3)备用网络系统 4)备用基础设施 5)技术支持能力 6)运行维护管理能力 7)灾难恢复预案并按照灾难恢复资源的成本与风险可能造成的损失之间取得平衡的原则(以下简称“成本风险平衡原则”)确定每项业务
11、功能的灾难恢复策略,不同的业务功能可采用不同的灾难恢复策略。按照灾难恢复等级共分为六个级别。1.1.2.1第 1 级基 本 支 持第 1 级被定义为没有备用数据处理系统需求,没有建立备份网络系统的需求,也没有技术支持的需求,但能够备份所需要的信息并将它存储在异地,然后根据数据恢复的具体需求,有选择地建立备份数据恢复平台,但事先并不提供处理备份数据恢复的硬件平台。这种方式是最为低成本的数据备份/恢复解决方案,随着技术的发展,目前的数据备份/恢复方案,已经不仅仅包括文件系统数据、数据库数据、邮件系统数据,同时也包括了操作系统数据、设备驱动程序,相关补丁和系统配置信息。第 1 级灾难恢复应具的有技术
12、和管理:要素要求数据备份系统a)完全数据备份至少每周一次;b)备份介质场外存放。备用数据处理系统备用网络系统备用基础设施a)有符合介质存放条件的场地。技术支持运行维护支持a)有介质存取、验证和转储管理制度;b)按介质特性对备份数据进行定期的有效性验证。灾难恢复预案a)有相应的经过完整测试和演练的灾难恢复预案这是一种用于许多数据中心数据备份的标准方式,数据在完成写操作之后,将会被送到远离本地的地方,同时具备有数据恢复的程序。在需要实现数据恢复时,一整套系统和应用安装动作需要在一台未启动的计算机上重新完成恢复。系统和数据将被恢复并重新与网络相连。这种备份方案相对来说成本较低(仅仅需要传输工具的消耗
13、以及存储设备的消耗)。一旦系统可以工作,标准的做法是首先恢复关键应用数据,其余的应用数据根据需要恢复,但需要一定的时间,同时依赖于什么时候硬件平台能够被提供准备好。1.1.2.2第 2 级备 用 场 地 支 持第 2 级相当于是第 1 级再加上具有热备份能力的数据备份中心。热备份中心拥有足够的硬件和网络设备去支持关键应用的安装需求。对于十分关键的数据,在数据不能在原数据中心中实现恢复时,必须在异地有正运行着的硬件平台提供恢复支持。这种数据备份中心的方式依赖于用备份投递的方法去将日常数据放在备份数据中心存储,虽然移动数据到一个热备份中心增加了成本,但却明显降低了数据恢复的时间。第 2 级灾难恢复
14、的技术和管理支持:要素要求数据备份系统a)完全数据备份至少每周一次;b)备份介质场外存放。备用数据处理系统a)灾难发生时能在预定时间内调配所需的数据处理设备到场。备用网络系统a)灾难发生时能在预定时间内调配所需的通信线路和网络设备到位备用基础设施a)有符合介质存放条件的场地;b)有满足信息系统和关键业务功能恢复运作要求的备用场地。技术支持运行维护支持a)有介质存取、验证和转储管理制度;b)按介质特性对备份数据进行定期的有效性验证;c)有备用场地管理制度;d)与相关厂商有符合灾难恢复时间要求的紧急供货协议;e)与相关运营商有符合灾难恢复时间要求的备用通信线路协议。灾难恢复预案有相应的经过完整测试
15、和演练的灾难恢复预案1.1.2.3第 3 级电 子 传 输 和 部 分 设备 支 持第 3 级灾难恢复应具有技术和管理支持:要素要求数据备份系统a)完全数据备份至少每天一次;b)备份介质场外存放;c)每天多次利用通信网络将关键数据定时批量传送至备用场地。备用数据处理系统a)配备灾难恢复所需的部分数据处理设备。备用网络系统a)配备部分通信线路和相应的网络设备。备用基础设施a)有符合介质存放条件的场地;b)有满足信息系统和关键业务功能恢复运作要求的场地。技术支持a)在备用场地有专职的计算机机房运行管理人员。运行维护支持a)按介质特性对备份数据进行定期的有效性验证;b)有介质存取、验证和转储管理制度
16、;c)有备用计算机机房管理制度;d)有备用数据处理设备硬件维护管理制度;e)有电子传输数据备份系统运行管理制度。灾难恢复预案有相应的经过完整测试和演练的灾难恢复预案第 3 级是在第 2 级的基础上用电子链路取代了车辆进行数据传送的数据备份。接收方的硬件平台必须与生产中心物理地相分离,在故障发生后,存储的数据用于数据恢复。由于热备份中心要保持持续运行并配备了灾难恢复所需的数据处理的软硬件部分,因此增加了成本。但确实是消除了运送工具的需要,提高了数据恢复的速度。1.1.2.4第 4 级电 子 传 输 及 完 整 设备 支 持第 4 级灾难恢复应具有技术和管理支持:要素要求数据备份系统a)完全数据备
17、份至少每天一次;b)备份介质场外存放;c)每天多次利用通信网络将关键数据定时批量传送至备用场地。备用数据处理系统a)配备灾难恢复所需的全部数据处理设备,并处于就绪状态或运行状态。备用网络系统a)配备灾难恢复所需的通信线路;b)配备灾难恢复所需的网络设备,并处于就绪状态。备用基础设施a)有符合介质存放条件的备用场地;b)有符合备用数据处理系统和备用网络设备运行要求的场地;c)有满足关键业务功能恢复运作要求的场地;d)以上场地应保持 7 x 24 运作。技术支持在备用场地有:a)7 x 24 专职计算机机房管理人员;b)专职数据备份技术支持人员;c)专职硬件、网络技术支持人员。运行维护支持a)有介
18、质存取、验证和转储管理制度;b)按介质特性对备份数据进行定期的有效性验证;c)有备用计算机机房运行管理制度;d)有硬件和网络运行管理制度;e)有电子传输数据备份系统运行管理制度。灾难恢复预案有相应的经过完整测试和演练的灾难恢复预案第 4 级 这种数据备份要求两个中心相关的主机同时处于活动状态并管理彼此的备份数据,实现数据的在线备份。备份中心硬件平台必须保证与生产中心方平台物理地相分离,在两个中心之间,在线关键数据的拷贝多次向备份中心传送着。在故障发生时,备份中心具备关键业务灾难恢复所需的全部数据处理设备,并处于就绪状态或运行状态,以及灾难恢复所需的网络设备并处于就绪状态,保证需要恢复的关键数据
19、通过可迅速恢复。1.1.2.5第 5 级实 时 数 据 传 输 及 完整 设 备 支 持第五级灾难恢复应具有技术和管理支持:要素要求数据备份系统a)完全数据备份至少每天一次;b)备份介质场外存放;c)采用远程数据复制技术,并利用通信网络将关键数据实时复制到备份场地。备用数据处理系统a)配备灾难恢复所需的部分数据处理设备。a)配备灾难恢复所需的全部数据处理设备,并处于就绪状态或运行状态。备用网络系统a)配备灾难恢复所需的通信线路;b)配备灾难恢复所需的网络设备,并处于就绪状态。c)具备通信网络自动或集中切换能力。备用基础设施a)有符合介质存放条件的备用场地;b)有符合备用数据处理系统和备用网络设
20、备运行要求的场地;c)有满足关键业务功能恢复运作要求的场地;d)以上场地应保持 7 x 24 运作。技术支持在备用场地有:a)7 x 24 专职计算机机房管理人员;b)7 x 24 专职数据备份技术支持人员;c)7 x 24 专职硬件、网络技术支持人员运行维护支持a)有介质存取、验证和转储管理制度;b)按介质特性对备份数据进行定期的有效性验证;c)有备用计算机机房运行管理制度;d)有硬件和网络运行管理制度;e)有实时数据备份系统运行管理制度。灾难恢复预案有相应的经过完整测试和演练的灾难恢复预案第 5 级是考虑生产中心和备份中心相距离隔较远,(根据单一提交更新范围,在本地和远程数据库中同时更新着
21、数据),也就是说,在更新请求被认为是满意之前,第 5 级需要生产中心与备份中心的数据都被更新。我们可以想象这样一种情景,数据在两个中心之间相互映像,由远程两个阶段提交过程来同步,因为关键应用使用了双重在线存储,所以在故障发生时,仅仅传送中的数据被丢失,恢复的时间被降低到了小时级。1.1.2.6第 6 级数 据 零 丢 失 和 远 程集 群 支 持第六级灾难恢复应具有技术和管理支持:要素要求数据备份系统a)完全数据备份至少每天一次;b)备份介质场外存放;c)远程实时备份,实现数据零丢失。备用数据处理系统a)备用数据处理系统具备与生产数据处理系统一致的处理能力并完全兼容;b)应用软件是“集群的”,
22、可实时无缝切换;c)具备远程集群系统的实时监控和自动切换能力。备用网络系统a)配备与生产系统相同等级的通信线路和网络设备;b)备用网络处于运行状态;c)最终用户可通过网络同时接入主、备中心。备用基础设施a)有符合介质存放条件的备用场地;b)有符合备用数据处理系统和备用网络设备运行要求的场地;c)有满足关键业务功能恢复运作要求的场地;d)以上场地应保持 7 x 24 运作。技术支持在备用场地有:a)7 x 24 专职计算机机房管理人员;b)7 x 24 专职数据备份技术支持人员;c)7 x 24 专职硬件、网络技术支持人员;d)7 x 24 专职操作系统、数据库和应用软件技术支持人员。运行维护支
23、持a)有介质存取、验证和转储管理制度;b)按介质特性对备份数据进行定期的有效性验证;c)有备用计算机机房运行管理制度;d)有硬件和网络运行管理制度;e)有电子传输数据备份系统运行管理制度。e)有实时数据备份系统运行管理制度。f)有操作系统、数据库和应用软件运行管理制度。灾难恢复预案有相应的经过完整测试和演练的灾难恢复预案第 6 级在第 5 级的基础上,除了可以实现零数据丢失率,同时保证数据立即自动地被传输到备份中心,第 6 级被认为是数据备份的最高的级别,在本地和远程的所有数据被更新的同时,利用了双重在线存储的能力,第 6 级容灾中最昂贵的方式,也是速度最快的恢复方式。此外第 6 级容灾方式通
24、过扩展常规的本地集群,所有关键应用软件除了在本地采用集群技术保护,而且在本地集群和容灾集群之间建立相互监控关系,这样由于在生产中心和容灾数据中心都存在集群,在生产集群和容灾集群之间,必须具有某种通讯能力,当生产中心某个集群或整个生产中心出现灾难时,能并能被集群监控软件实时监控,并估计预先设计好的切换策略,对不同类型的故障作出正确的响应,考虑到底层的数据已经建立在第5 级基础上实现了生产中心和备份中心的可靠同步,因此在系统、应用软件或本地硬件出现故障时,就能自动实时的切换到备用中心系统,实现最高级别的应用高可用。因此,需要根据各个计算机处理系统中数据的重要性,以及需要恢复数据的速度和程度,来进行
25、数据备份/恢复及容灾系统的总体规划。1.1.3 界定数据容灾系统的适用范围分析不同的应用系统,确定数据备份/恢复及容灾系统是一个覆盖整个计算机系统的工程,根据业务的重要性,对不同的系统采用不同级别的数据备份/恢复及容灾方案,如针对关键的业务应用子系统,实施高级别的数据备份/恢复及容灾工程;对低级别的业务系统,实施低级别的数据备份/恢复及容灾工程。总之要建立一个综合性的整体数据备份/恢复及容灾建设工程。1.1.4 界定数据容灾系统建设的目标生产系统在单位时间内的数据处理能力或IO 流量确定的情况下,RPO 实际上成为一个反映数据备份过程中的数据丢失量的指标。而RTO 则是指实现数据恢复指标,这不
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Symantec 数据中心 备份 建设 规划
限制150内