关于备份那点系统知识, NetVault Backup

为什么要备份

计算机系统数据极其重要。因而,如何保护好计算机系统里存储的数据,保证系统稳定可靠地运行,并为业务系统提供快捷可靠的访问,是系统建设中最重要的问题之一。而要保证系统稳定可靠地运行,除了要利用高可用的在线数据解决方案,另外一个关键的要素是要保护计算机所存储的信息,也就是存储在计算机内的数据。

虽然,计算机技术的发展给人们的日常生活提供了很多便利,然而,人为的操作错误,系统软件或应用软件的缺陷、硬件的损毁、电脑病毒、黑客攻击、自然灾难等等诸多因素都有可能造成计算机中数据的丢失,从而给企业造成无可估量的损失。为了保护业务系统的关键业务数据,我们必须对这些数据进行有效的备份,并支持快速恢复。

数据备份的原则

对数据进行备份是为了保证数据的一致性和完整性,消除系统使用者和操作者的后顾之忧。不同的应用环境要求不同的解决方案来适应,一般来说,一个完善的备份系统,需要满足以下原则:

稳定性

备份产品的主要作用是为系统提供一个数据保护的方法,于是该产品本身的稳定性和可靠性就变成了最重要的一个方面。首先,备份软件一定要与操作系统100%的兼容,其次,当事故发生时,能够快速有效地恢复数据。

全面性

在复杂的计算机网络环境中,可能会包括了各种操作平台,如各种厂家的UNIX、NetWare、Windows、Linux、NCR等,并安装了各种应用系统,如数据库、群集系统等。选用的备份软件,要支持各种操作系统、数据库和典型应用。

自动化

很多系统由于工作性质,对何时备份、用多长时间备份都有一定的限制。在非工作时间系统负荷较轻,适于备份。可是这会增加系统管理员的负担,由于精力状态等原因,还会给备份安全带来潜在的隐患。因此,备份方案应能提供定时的自动备份,并利用自动磁带库等技术进行自动更换磁带。在自动备份过程中,还要有日志记录功能,并在出现异常情况时自动报警。

高性能

随着业务的不断发展,数据越来越多,更新越来越快,在休息时间来不及备份如此多的内容,在工作时间备份又会影响系统性能。这就要求在设计备份时,尽量考虑到提高数据备份的速度,利用多种技术加快对数据的备份,充分利用通道的带宽和性能。

维持业务系统的有效性

实时备份对业务系统的性能将会产生一定的影响,有时会很大。如何采取有效的技术手段避免备份对服务器系统、数据库系统、网络系统的影响,将是非常重要的。例如使用先进的SAN LAN-Free或着SnapMirror to Tape等技术。

操作简单

数据备份应用于不同领域,进行数据备份的操作管理人员也处于不同的层次。这就需要一个直观的、操作简单的在任何操作系统平台下都统一的图形化用户界面,缩短操作人员的学习时间,减轻操作人员的工作压力,使备份工作得以轻松地设置和完成。

实时性

部分关键性的业务是需要24小时不间断运行的,在备份的时候,有一些文件可能仍然处于打开的状态。那么在进行备份的时候,要采取措施,实时地查看文件大小、进行事务跟踪,以保证正确地备份系统中的所有文件。

容灾考虑

将本地的数据远程的复制一份,存放在远离数据中心的地方,以防数据中心发生不可预测的灾难。自动实现异地容灾备份管理。

备份系统组成

能否安全有效的备份取决于以下三个因素:

执行备份的磁带库

磁带库的质量与性能在整个备份过程中是至关重要的,它是能否进行高速高质量备份的关键所在。

存储备份数据的介质

介质是数据的负载物,它的质量一定要有保证,使用质量不过关的介质无疑是拿自己的数据冒险。

控制备份的软件

优秀备份软件包括加速备份、自动操作、灾难恢复等特殊功能,对于安全有效的数据备份是非常重要的。

建立完整的自动化备份解决方案

制定一个完善的网络备份自动化解决方案,主要需要考虑以下几个方面:

A. 自动化备份设备

自动化备份设备包括目前流行的自动加载磁带机(AutoLoader)、磁带库(Tape Library)和磁盘库。

自动加载磁带机是存储自动化的一种基本形式。如其名所示,它自动将一些数量的磁带顺序加载入一台单机,而不具备磁带库所具有的磁带随机访问性。虽然自动磁带加载机没有磁带库的智能机械臂,但确实能提供无人值守备份并减少人员成本。同时,由于其扩展性能非常有限,如驱动器通常只能有一个、磁带槽位一般为8到16个,所以该种备份能设备常用在备份数据量不大,对可靠性及备份性能要求不高的应用系统中。

磁带库是指在一个封闭的机柜中,集成有一台至N台磁带机并包括若干盘磁带,由一个机械手臂实现自动装填磁带的功能。它的操作是自动完成和无需人为干涉的。磁带库提供真正的自动“无人”存储管理,叠加的单机是无法具备的。磁带库将整个数据管理程序自动化。自动化磁带库具备:

  • 1. 无需人为干涉的自动数据存储功能(载带和卸带)
  • 2. 出现故障,自动感应,识别并恢复
  • 3. 对磁带进行盘存,任何时候都可以知道磁带位置
  • 4. 对磁带库自动进行日常维护并清洗磁头
  • 5. 支持先进的数据管理软件,功能从备份、恢复到多级存储管理(HSM)。

磁盘库是以磁盘阵列为基础的备份设备,因为磁盘是随机读写设备,而磁带是顺序读写设备,虽然目前磁带机的读写性能比以前几代有了显著提高,但其顺序读写的固有特性仍限制了其在某些应用系统中的表现,不能满足某些应用系统数据量大而备份恢复窗口小的需求。磁盘库的出现主要是为了克服以磁带作为存储介质的磁带库上述弊端,同时目前的磁盘库多数以SATA磁盘作为存储介质,在采购成本上接近了磁带库。所以,磁盘库会在近线存储领域逐渐占主流位置。磁盘库的使用方式目前分为两种:

一种是盘阵本身集成了虚拟软件,可将磁盘库模拟成各种磁带库,从使用者的角度来看,它就是一台磁带库,但由于该种方式在传统盘阵管理软件的基础上,集成了虚拟化软件,而备份软件也需对盘阵的虚拟容量收取采购成本,从而增高了用户的采购成本;

另外一种是盘阵本身还是传统的盘阵,由备份软件将磁盘阵列虚拟成磁带库,该虚拟化技术是基于裸设备级的,避免了磁盘阵列上创建文件系统带来的性能影响,从而降低了采购成本。Quest NetVault备份软件采用这种虚拟化技术,大幅降低了用户的投资成本。

自动化备份设备的质量与性能在整个备份过程中是至关重要的,它是能否进行高速高质量备份的关键所在。

B. 所需磁带介质数量

介质是数据的负载物,它的质量一定要有保证,使用质量不过关的介质无疑是拿自己的数据冒险。

根据实际使用中的经验,备份磁带库中后备存储容量应为实际数据容量的2到3倍。

备份过程中要用到大量的存储介质,备份介质的保留时间的长短将决定所需购置和维护的介质量。目前的备份策略都是基于多磁带轮换制,即保存有过时数据的介质可重新覆盖使用,轮换频率可根据备份类型和备份的窗口来确定。

备份系统所需的介质数量可根据下述流程确定:

6. 确定介质容量

7. 计算每个服务器上的数据做全备份所需的介质数量

8. 计算每个服务器上的数据做增量备份所需的介质数量

9. 根据每种介质的保留时间或轮换频率即可计算出所需的介质数目

C. 备份窗口和带机数量的确定

备份窗口的确定方法——所谓备份窗口,是指完成一次备份所需的时间,对于基于SAN架构的LAN-Free备份方式,这主要取决于每次备份的数据量和磁带机备份的速度。理论上,备份的间隔越短越好,但每次备份总需一定的时间,而且备份总会或多或少地影响系统的正常处理性能。因而,对一些关键数据,可预先定义备份窗口大小,再根据备份数据量计算所需的备份速度,若备份速度不能满足要求,则可考虑使用更快速的带库或增加带库上的驱动器数据。

磁带机是影响备份速度的关键设备,目前性价比最好的磁带驱动器是LTO4驱动器,单个LTO4带机备份的非压缩理论速率为120MB/S。初期由于数据量较小,而且考虑业务需求,即对于做一次全备份的时间并没有很严格的规定,备份窗口可以较大,可以先配置较少数量的带机,随着备份数据量的增大,可逐步增加磁带机的数量,从而提高备份速度,缩小备份窗口。备份系统所需的备份窗口与磁带机数量间的关系可根据下述流程确定:

10. 确定备份数据量及数据压缩比

11. 根据控制器类型推算出单驱动器的备份速度

12. 确定必需的备份窗口

13. 计算出单驱动器所需备份时间

14. 确定所需的驱动器数目

D. 备份类型和选择

备份类型主要有三种:

全备份

每次备份定义的所有数据,优点是恢复快,缺点是备份数据量大,数据多时可能做一次全备份需很长时间

增量备份

备份自上一次备份以来更新的所有数据,其优点是每次备份的数据量少,缺点是恢复时需要全备份及多份增量备份

差分备份

备份自上一次全备份以来更新的所有数据,其优缺点介于上两者之间.

针对以上的备份类型选择时,一般的规则是:

15. 对于操作系统和应用程序代码,可在每次系统更新或安装新软件时做一次全备份

16. 对于一些日常数据更新量大,但总体数据量不是非常大的关键应用数据,可每天在用户使用量较小的时候安排全备份

17. 对于日常更新量相对于总体数据量较小,而总体数据量非常大的关键应用数据,可每隔一个月或一周安排一次全备份,再此基础上,每隔一个较短的时间间隔做增量备份

E. 优秀的备份软件

优秀的备份软件便于用户灵活指定备份策略,快速恢复备份数据,支持各种操作系统平台及数据库系统。同时包括加速备份、自动操作、灾难恢复等特殊功能,对于安全有效的数据备份是非常重要的。

备份系统的架构方式

A. 传统数据备份方式­-LAN备份

传统的备份方式系统管理员将磁带机/库连接在本地备份服务器上,只对本地网络内的数据进行系统备份。在这种方案中,磁带机/库只由本地服务器进行备份操作,欲备份的数据全部通过网络传输到备份服务器,再经由备份服务器备份到磁带机/库中,随着欲每台主机上数据量的不断增大,备份数据在网络上的传输势必给网络造成很大压力,影响正常的业务应用系统在网络上的传输。通过调整备份窗口,可解决部分问题,但随着备份主机数量不断增多,备份窗口的调整经常发生重叠,最终导致数据备份时间与正常的业务应用处理时间重叠,从而备份数据占用网络带宽,严重影响业务应用系统的响应时间。数据备份流程如下图所示:

B. 基于SAN架构的LAN-Free备份

SAN存储区域网基于高速光纤通道(Fibre Channel)SCSI 技术,在服务器之间以及服务器和存储设备之间建立了高速的数据传输链路。在SAN内进行大量数据的传输、复制、备份时不再占用宝贵的LAN 资源,使得LAN 的带宽得到极大的释放,服务器能以更高的效率为前端网络客户机提供服务。

SAN技术在保证高速数据传输的同时,又不占用LAN资源,极大增强了传统的TCP/IP 网络带宽使用效率,可谓一举两得。

LANfree Backup数据备份主要指快速随机存储设备(磁盘阵列或服务器硬盘)向备份存储设备(磁带库,磁带机)的数据复制,SAN技术中的LANfree 功能用在数据备份上就是所谓的LANfree Backup。

SAN 的结构决定了备份数据的源设备和目的设备都存在于一个高速SAN网中,并可被所有SAN内的服务器共享。与传统的主机备份或网络备份方式相比,LANfree Backup 在速度、可靠性、备份效率、LAN带宽释放等方面显示了无可比拟的优势。备份架构示意图如下所示:

LANfree Backup 全面支持文件级的数据备份和数据库级的全程或增量备份,这种备份服务可由服务器直接发起,也可由客户机通过服务器发起。在多服务器,多存储设备,大容量数据频繁备份的应用需求环境中,SAN 的LANfree Backup更显示出其强大的功能。

LANfree Backup的技术关键在于备份设备(如磁带库)如何能够被SAN中的多个服务器共享。具体地说就是磁带库机械手的共享管理与备份作业的控制策略。基于SAN 技术实现LANFree Backup 时, 也同传统的网络数据备份一样需要有备份服务器,但SAN 中的备份服务器的主要工作已经不再是简单地通过网络(LAN)得到数据, 直接完成备份作业, 而是管理SAN 中被共享的备份设备,接受其它服务器或客户机的备份请求, 按优先级将所有的备份作业进行排队管理, 控制备份数据在SAN 中传输。因此,根据不同的服务器平台,选择合适的SAN备份软件并进行合理配置,确定高效安全的备份管理机制,对于更好的进行数据备份具有重要的实际意义。