监控安装 ERP

系统集成论坛

 找回密码
 注册通行证

QQ登录

只需一步,快速开始

路由器交换机防火墙系统集成商城 优质产品采购平台
查看: 2841|回复: 2
打印 上一主题 下一主题

技术锦囊:金融行业容灾最佳实践

[复制链接]

1

主题

2

帖子

9

积分

实习生

跳转到指定楼层
1
发表于 2016-2-23 15:25:29 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
华为金牌代理
本文转自:http://www.wavetop.com.cn/topic/qitazhuanti/619.html

数据越来越突出地成为社会正常运作的核心。对于一个企业来讲,数据更是影晌其生存和发展的关键,各行业的用户和企业对网络应用和数据信息的依赖日益强烈,使得突发性灾难如火灾,洪水,地震或者恐怖事件对整个企业的数据和业务生产会造成重大影响,所以如何保证在灾难发生时,企业数据不丢失,保证系统服务尽快恢复运行成为人们关注的话题,容灾技术日益成为各个行业关注的焦点。

  随着信息化建设的不断发展,人们已经越来越意识到数据的重要性。数据的价值体现有两个前提,既数据的安全和可用,这就要求数据信息系统具有高可用性。基于这种认识,各种存储技术被快速发展起来,保证数据的安全性有专业存储系统和备份解决方案。

  灾难备份是今天的一个重要的课题,如何保证数据中心在经历一定级别的故障和灾难后能够尽快恢复运营,对干此务连续性较为敏感的企业是至关重要的。

  一、基本概念

  容灾,就是在灾难发生时,在保证生产系统的数据尽量少丢失的情况下,保持生存系统的业务不间断运行。

  1、容灾的评价指标

  现在工业界都以数据丢失量和系统恢复时间作为标准,对某个容灾系统进行评价,公认的评价标准是RPO和RTO。

  RPO(RecoveryPointObjective):恢复点目标,以时间为单位,即在灾难发生时,系统和数据必须恢复到的时间点要求。RPO标志系统能够容忍的最大数据丢失量,系统容忍丢失的数据量越小,RPO的值越小。

  RTO(RecoveryTimeObjective):恢复时间目标,以时间为单位,即在灾难发生后,信息系统或业务功能从停止到必须恢复的时间要求。RTO标志系统能够容忍的服务停止的最长时间。系统服务的紧迫性要求越高,RTO的值越小。

  RPO针对的是数据丢失,RTO针对的是服务丢失,两者没有必然的联系,并且两者的确必须在进行风险分析和业务影响分析之后根据业务的需求来确定。

  2、容灾的分类

  由于容灾包含的内容比较广泛,对容灾的分类也可以从多个方面进行。总的来讲,可以从容灾的范围和容灾的内容来区分。

  从容灾的范围讲,容灾可以分成本地容灾,近距离容灾和远距离容灾。这三种容灾能容忍的灾难是不相同的,采用的容灾技术也是不同的。

  从容灾的层次讲,容灾又可以分成数据容灾和应用容灾,本质上讲,这两种容灾是密不可分的。数据容灾是应用容灾的基础,没有数据的一致性,就没有应用的连续性,应用容灾也是无法保证的。数据容灾是指建立一个备用的数据系统,该备用系统对生产系统的关键数据进行备份。
  应用容灾则是在数据容灾之上,建立一套与生产系统相当的备份应用系统。在灾难发生后,将应用迅速切换到备用系统,备份系统承担生产系统的业务运行。

  二、容灾技术选择

  容灾系统的建设需要多种技术相互配合,选择容灾技术的原则和策略是容灾系统建设的关键。

  1、容灾技术选择要素

  容灾技术的选择,是一个以业务容灾需求为核心,多种因素综合权衡的过程。容灾技术选择所需考虑的因素如图1:

  1)业务分析结果

  容灾系统建设应根据业务分析结果选择合适的容灾技术并确定具体的实现策略,以满足业务恢复时相应的RTO、RPO指标。

  2)业务关联程度

  在进行容灾技术选择时,需要考虑到核心业务系统各种业务之间的关联关系。业务关联紧密,数据的藕合程度高,可能会造成所有关联的业务都要采用同一种容灾技术,业务关联松散,数据的藕合程度低,可能会针对不同的业务要求进行区分,分别采用不同的容灾技术。

  3)系统现状

  核心业务系统容灾技术必须充分考虑与现有系统的配合。现有核心业务系统的应用分布、应用的实现方式、硬件设备平台的种类、存储数据量的大小、IO吞吐量的大小等,都会对容灾技术的选择产生影响。

  4)技术成熟度

  容灾系统必须采用成熟可靠的技术,保证系统特续,稳定的运行。该技术应具有类似于电信业务运营支撑系统容灾建设的成功案例,不能由于技术手段的不成熟或不稳定而增加核心业务系统新的风险。

  5)容灾系统环境

  核心业务系统容灾技术必须考虑生产中心与容灾中心之间的距离,网络环境等因素,不同的技术对距离,网络带宽的要求会有所不同。

  6)管理维护难度

  不同的容灾技术对管理维护的要求各不相同,在同等条件下,应采用易于管理和维护的容灾技术。

  7)成本分析

  不同的容灾技术对软硬件投资,实施维护成本的要求各不相同,在同等条件下,应采用总体成本最小的容灾技术。
  2、容灾技术选择策略

  同一技术领域内存在多种技术可供选择,对这些技术进行综合评估是方案设计阶段最重要的工作之一。

  判断容灾技术的可行性,须根据现有应用环境,采用理论和实践相结合的方式,对可能采用的多种技术手段逐一进行评估。容灾技术的选择流程如图2。

  1)现有系统的梳理

  容灾系统与生产系统有着紧密的关系。对任何一种容灾技术适用性的评估,必须基于企业的叮系统现状。因此,企业应首先对现有系统的各种信息进行统计和收集。

  对现有系统梳理要收集和统计的信息包括,主机信息收集:网络信息收集,存储设备信息:应用软件的功能、种类、与其它系统的接口等信息;外围接口信息;系统监控信息;组织人员管理。

  对以上的信息进行收集和梳理,可以起到很好的作用;了解现有系统的硬件平台资源情况,为容灾规模决策提供依据;了解现有系统的应用情况,为容灾范围和容灾的运营方式决策提供依据;了解现有系统的外围接口情况,为容灾接口规划提供决策依据;了解现有系统的监控手段,为容灾技术的选择提供参考;了解现有的人员和管理现状,为容灾技术的选择提供参考。

  2)系统结构抽象

  从灾难对客户满意度的影响,对企业直接的影响和对企业间接的影响几个角度去分析,核心业务系统中的业务功能有着不同的容灾要求。对于需要实施容灾的业务功能,必须明确支持这一业务的IT系统结构,绘制系统结构图。IT系统结构包括IT基础设施结构和业务数据流程结构。系统结构抽象的过程是一个IT系统映射的过程。

  IT基础设施结构包括:服务器、存储器、网络及其他相关设备的配置情况;服务器与服务器、服务器与存储器之间的连接;业务数据存储的逻辑位置;该IT系统和外部系统的接口;核心业务系统应用的分布情况:针对各种应用,在核心业务系统IT基础设施中的分布情况,使用的主机、存储设备、网络资源情况、以及在网络结构中的位置;核心业务系统各个业务间的关联关系,业务间彼此的影响和依赖程度。

  通过丁基础设施结构抽象可以明确不同的业务功能与硬件资源的映射关系,可以梳理出不同业务问的关联以及对硬件设备的相互影响情况,以及不同的业务与外部系统接口的情况。IT基础设施结构抽象的过程,有助于在选择容灾技术时明确该技术所涉及的硬件平台、业务种类、业务关联关系以及外围系统接口的要求。

  3)运行情况数据获取

  为了获得对系统完整的描述,除了系统结构抽象外,还应收集正常业务状态、业务高峰状态,当前运行状态和历史运行状态数据,同时根据业务发展趋势以及历史状态数据推测系统今后的运行状态特性。根据需评估的不同技术,需要采集如下的一些系统运行状况:
  1.存储关键业务数据的数据库,文件系统及相应的服务器,存储设备的平均写入容量、写入高峰值、数据块大小,整体IO值,工作负载高峰值;

  2.网络连接之间的LAN/WAN/SAN当前的容量和使用率,数据传输的延迟;

  3.服务器系统的CPU的平均/高峰使用率,内存的平均/高峰使用率,IO通道的平均/高峰使用率;

  4.软件功能模块的批处理任务的吞吐能力、在线交易的响应时间。

  4)容灾技术理论分析

  容灾技术验证中的一项重要工作是对容灾技术进行理论分析。根据不同容灾技术的技术参数、推导方法、实现原则和相关要求对容灾技术进行可行性分析。

  根据对现有系统的梳理,结合这些技术参数和推导方法,对该技术进行理论上的可行性分析,判断:该技术是否能满足业务需求提出的RPO、RTO指标、该技术实现数据保护的方式、能否确保数据的安全、是否需要其它的辅助手段、共同完成核心业务系统容灾功能,该技术所适应的业务容灾范围和运营方式,该技术能够满足的容灾规模,该技术实施时对网络带宽,存储容量的要求,该技术在实施过程中是否会对生产系统造成不可接受的影响,该技术在投入运行后是否会对生产系统造成不可接受的影晌,该技术在投入实际运行后对管理维护方面的影晌和要求,该技术实施的总体成本。
  5)容灾技术案例考察

  通过考察该技术在类似应用环境下的真实表现也可对技术进行评估。环境越相近,可借鉴的程度越高。考察技术案例时要着重关注的要点包括:系统的规模、系统的体系结构;容灾系统的功能,以及相应功能的技术实现方式;容灾技术对网络资源的要求;容灾技术的使用对生产系统的影晌;容灾技术的可管理性和可维护性。

  6)实际测试

  为了保证容灾系统真正发挥为核心业务系统提供风险预防机制和抵御灾难手段的能力;对于采用理论分析方法难以确定的技术,或者十分关键的新技术;应当结合实际测试进行判断。测试环境应尽可能模拟现有生产系统;实际测试需要从功能和负载两方面进行。

  ①功能测试

  在进行容灾技术功能测试时需制定功能测试计划,功能测试计划应包括数据故障切换,数据故障恢复,应用故障切换和应用故障恢复以及网络故障切换和网络故障恢复等。功能测试部分还包括确定该技术和其他技术的集成能力。

  ②负载测试

  测试环境可以通过采用部分现有系统中的数据进行,包括对现有环境实际运行状况的模拟,通过调整系统负载,观察技术在不同负载下的表现,以评估该技术的处理能力,同时对测试过程中的网络带宽,IO资源消耗、对生产系统的影响等性能指标进行评估。

  除了功能和负载考察外,还应对技术实施情况和遗留问题等进行了解。

  7)模拟运行

  对于通过测试验证的容灾技术,应当结合实际测试的情况进行模拟试运行,根据试运行的结果确定该技术的可用性,尤其需要考虑该技术对生产系统的实际运行所产生的影响情况,以及该技术所需的系统资源。http://rongzaiwang.com/  

  8)方案确定

  最终根据实际测试的结果和模拟运行的结果,确定适用于核心业务系统的容灾技术。


1

主题

2

帖子

9

积分

实习生

2
 楼主| 发表于 2016-2-23 15:26:19 | 只看该作者
华为金牌代理
自己顶个

0

主题

8

帖子

5

积分

实习生

3
发表于 2016-4-18 12:50:15 | 只看该作者
华为金牌代理
有方案共享一下了
您需要登录后才可以回帖 登录 | 注册通行证

本版积分规则

联系我们| 手机版|系统集成论坛 ( 京ICP备11008917号 )

GMT+8, 2024-5-3 10:59 , Processed in 0.082988 second(s), 22 queries .

系统集成论坛

BBS.XTJC.COM

快速回复 返回顶部 返回列表