监控安装 ERP

系统集成论坛

 找回密码
 注册通行证

QQ登录

只需一步,快速开始

路由器交换机防火墙系统集成商城 优质产品采购平台
查看: 2021|回复: 4
打印 上一主题 下一主题

数据备份和恢复基础知识

[复制链接]

0

主题

8

帖子

32

积分

实习生

QQ
跳转到指定楼层
1
发表于 2009-8-28 13:40:46 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
华为金牌代理
个机械手的存储设备。机械手负责将磁带槽中的磁带送到磁带机中,或反之;磁带机将要备份的数据写到磁带上,或从磁带上读数据恢复到应用计算机上;磁带槽保存含有关键数据的拷贝。生产磁带库的厂家很多如:HP、IBM、EXBYTE、Quantum等。
虽然磁盘备份开始流行起来,但是大多数用户仍然选用磁带库。
4. 备份类型(或备份模式)
在图书馆的例子中我们说每周备份一次所有的数据,在实际当中是否可行?如果周五的时候发生了问题,数据被破坏,磁盘上的数据不能使用了,那么我们采用计算机上的Backup Exec将数据的拷贝从磁带上重新恢复到磁盘中。但是那是上周六的数据,周一至周五发生的变更全部丢失了。我们能否推荐每天都备份呢?如果数据量小,还可以。如果数据量大,就太花时间,也占有太多的磁带容量。
为了解决上述问题,提出了全备份与增量备份的概念。
全备份是指将所有的数据都备份一遍。
增量备份是指只备份相对于前一天改变过的数据。
还有一种增量备份叫累积增量备份,指备份那些相对于上一次全备份以来改变过的数据。
在图书馆的例子中,我们可以每周六做全备份,周日至周五做增量备份或累积增量备份。这样一来,当周五出问题时,可以恢复上周六的全备份,及周一至周四的增量备份(或周四的累积增量备份),数据丢失从五天减到几小时。而磁带容量增加的并不多。
5. 备份窗口
在建立一个备份系统时,有一个重要因素要考虑,那就是每次数据备份允许在多长时间内完成。数据备份的过程是将数据从在线磁盘上取出来,然后传送到离线设备上。在这个过程中,运行应用的计算机需要花CPU资源、内存资源、及I/O带宽来处理备份,肯定会影响应用程序的正常运行效率。一般只允许在业务不繁忙的时间段内来完成备份,以减轻影响。这个时间段就叫备份窗口。备份窗口是指允许完成备份的时间长度。
例如我们个人笔记本电脑上可能安装了备份软件,每次备份软件运行时,机器慢的我们几乎不能进行日常工作。我们的工作时间是早9:00至晚6:00, 但常常会加班至晚12:00. 因此为了不影响工作,我们要求管理员只能在0:00-9:00这9个小时内为我们做备份。这就是我们笔记本的备份窗口,长度为9小时。
显然备份窗口的长短直接影响投资成本。例如需要备份的数据600G,备份窗口为4小时,如果采用LTO磁带库,那么我们需要 600*1024/(4*3600*30)=1.4个磁带机,即至少两个。(这里没有考虑磁盘I/O是否可以支持,实际当中需要考虑)
6. 备份介质
在备份与恢复系统中备份介质往往指磁带。介质服务器指的是连接磁带库、且运行备份软件的计算机,它通常负责将它自身或其它计算机上的数据拷贝传送给磁带机,由磁带机写到磁带中。
一般在备份系统中将磁带库中的介质分成介质池(media pool),以便将不同应用(或计算机)的数据存放到不同的磁带组中,便于分类。
备份介质既可以保存在与备份服务器连接的磁带库中,也可以取出来异地保存,取决于你的备份策略
7. 备份策略
在上面图书馆的例子中,我们提到备份软件按照计算机管理员设定的规则,将在线数据备份到备份设备上。这里提到的规则就是指备份策略。备份策略通常指将哪些计算机上的什么类型的数据在什么时间按照什么备份类型备份到哪个备份设备上。下面是一个备份策略的例子:
备份服务器        备份客户端        数据类型        数据量        备份窗口        备份模式        备份设备        保存周期        保存地点
Dell-server        SQL-app        系统状态        300MB        每月1日10pm-06am        全备份        磁带机 t1        2个月        异地
Dell-server        SQL-app        C盘(操作系统和应用软件)        10GB        每月1日 10pm-06am        全备份        磁带机t1        2个月        异地
Dell-server        SQL-app        SQL 数据库        100MB        每周六10pm-06am        全备份        磁带机t1        2星期        机房

备份策略存储在备份软件自身的数据库中,备份软件会定时发起备份进程完成指定的工作。
备份策略的好坏直接影响备份系统的投资成本、效率、安全性等。
8. 备份系统的逻辑结构和部署
在上面图书馆的例子中如果网络中有三台计算机均运行业务软件且产生数据,我们是否需要为每台计算机买一台备份设备呢?答案是视情况而定的。一般的备份软件(例如Backup Exec)逻辑结构如下《数据备份与恢复系统结构图》所示:
备份软件由三种模块组成:管理模块、备份模块、及客户端模块(也叫集中管理服务器、备份服务器、及远程客户端)。管理服务器相当于整个备份系统的大脑,负责策略制定、指挥备份服务器工作,唤醒客户端传送数据。备份服务器根据指令将客户端送来的数据保存到它所连接的备份设备中,或从备份设备中读出数据传送给客户端恢复。同时每个备份服务器还保存着自身所管理范围的所有备份信息。客户端定期将需要备份的数据从本机在线磁盘上读出,通过网络或共享内存传送给备份服务器,或在管理员干预下发出指令给备份服务器,需要恢复数据。这三种模块可以安装在同一台计算机上,或者安装在多台计算机上,视需求而定。如果只有一个备份服务器,就不需要安装中央管理器了。备份服务器模块包含客户端模块。
         

现在,如果图书馆有三台计算机上的数据需要备份,那么我们可以将磁带机连接到一台服务器上,其它机器通过网络来使用这台磁带机(如下图:网络数据备份与恢复系统)。
        连接磁带机的计算机serv1上安装备份软件的备份服务器模块,另两台计算机serv2和serv3上安装备份软件的客户端模块。集中管理模块可以安装在任意计算机上。由于serv1上运行数据库sql server, 所以还应该安装相应的database agent. Serv1上的数据由备份服务器直接保存到它连接的磁带机上,需要时,可以直接从磁带机上恢复。Serv2和Serv3上的数据由备份软件客户端通过网络传送给serv1上的备份服务器,再由备份服务器保存到磁带上。
        当serv2和serv3上的数据量都很大时,问题就出现了:备份占用太大的网络带宽,而且有可能在规定的窗口内完不成备份!传统上,需要购买新的磁带机连接到这些数据量大的机器上。
         
自从上世纪末期出现了存储局域网SAN,很快被数据备份与恢复系统所采用。 备份系统可以充分发挥SAN的资源共享优势,以节省成本,在多个备份服务器之间共享备份设备。通过合理备份策略规划,一台备份设备可以服务与多个备份服务器。例如在SAN架构中,上面图书馆的备份系统可以设计如下:
         
Serv1、Serv2、及Serv3全部安装备份软件的备份服务器模块,因此所有的备份数据直接通过SAN传送到磁带机中去备份,不再通过上层的LAN传送,因此这种备份架构叫LanFree备份。集中管理服务器可以安装在任何一个机器上。
这种共享的架构中需要协调磁带机在多台服务器之间的共享。即一台机器使用时,其它机器必须排队等待;当这台机器使用完并释放时,需要确认等待队列中哪个机器优先使用磁带机。备份软件提供一个叫做SSO的软件模块负责这个协调工作。
9. 备份代理(agent)
从上述部署图可以看出,当一个计算机上不安装备份软件的备份模块,而又需要备份数据时,我们需要为它安装备份软件的客户端软件,这个客户端软件负责将需要备份的数据从磁盘上取出来,与备份服务器上的备份模块建立TCP/IP级的通道,并将数据通过这个通道传送到备份服务器上,由备份服务器再保存到磁带上。这个客户端软件一般叫远程备份代理(remote agent).
需要备份的数据一般有三类,即普通的文件系统文件、数据库数据、及裸设备数据。普通的remote agent只能备份文件数据和裸设备数据,而对于不同的数据库数据,需要不同的agent. 数据库软件在运行(一般叫online)时, 数据库的数据在内存缓冲里修改,并不是马上存放到磁盘上,而且数据之间的逻辑关系和数据本身不在一起,因此此时磁盘上的数据库数据是不一致的,我们采用普通的agent去制作的拷贝,将来是不能恢复的。当然最简单的办法是将数据库软件关掉(offline), 但是很多应用是不能关的,即使是大学图书馆管理软件,可能支持一些网上查询、网上预借等功能,也需要一天24小时运行。再者,数据库offline时只能制做全备份,如果数据库很大,总做全备份既费时又浪费存储。
10. 恢复操作系统
数据丢掉是致命的,但是有时候快速恢复也是必须的。生产系统的恢复包括整个操作系统、软件、及数据的恢复过程。传统的,当一个计算机因为病毒、人为误操作或其它原因造成瘫痪后,恢复的过程是:安装操作系统、打patch、安装数据库及软件、最后恢复数据。前面的三步至少需要花上半天时间。今天的备份软件将这个流程全部自动化,即不仅备份数据,还备份操作系统及运行环境。恢复时从操作系统到数据全部自动化,减少人工干预,从而缩短恢复时间。这种恢复操作系统的功能模块通常叫IDR(Intelligent Disaster Recovery).
11. 总结
数据备份与恢复系统就是在你的数据中心建立一套自动化的、安全可靠的系统,将你的数据拷贝周期性地保存到备份设备上。在你需要恢复时,可以利用这套系统快速地从备份设备上找到数据拷贝,并将其恢复到指定的位置。
数据备份和恢复系统是企业数据保护的基本手段。

37

主题

361

帖子

901

积分

版主

2
发表于 2009-8-31 10:33:07 | 只看该作者
华为金牌代理
貌似不完整啊
做人要厚道,看贴要回帖!

9

主题

175

帖子

278

积分

正式员工

3
发表于 2009-9-23 22:17:10 | 只看该作者
华为金牌代理
就是啊,不完整啊
不要说我帅!

0

主题

6

帖子

6

积分

实习生

4
发表于 2009-10-14 10:49:26 | 只看该作者
楼主,请你贴个完整的,多谢了!

0

主题

17

帖子

17

积分

实习生

5
发表于 2009-12-25 16:45:45 | 只看该作者
无论完整与否,都表示感谢!
您需要登录后才可以回帖 登录 | 注册通行证

本版积分规则

联系我们| 手机版|系统集成论坛 ( 京ICP备11008917号 )

GMT+8, 2024-5-22 11:02 , Processed in 0.104561 second(s), 24 queries .

系统集成论坛

BBS.XTJC.COM

快速回复 返回顶部 返回列表