监控安装 ERP

系统集成论坛

 找回密码
 注册通行证

QQ登录

只需一步,快速开始

路由器交换机防火墙系统集成商城 优质产品采购平台
查看: 2910|回复: 0
打印 上一主题 下一主题

数据中心可靠性的几个概念

[复制链接]

10

主题

10

帖子

26

积分

实习生

跳转到指定楼层
1
发表于 2016-4-26 14:59:02 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
华为金牌代理
北京中测信通科技发展有限公司是由原国内知名通信公司运营维护团队组成,是一家立足国内、整合数据中心资源的高科技专业服务公司,专注于数据中心第三方验证测试服务。

    数据中心机房工程是一个多专业建设综合体,现代数据中心机房整体解决方案设计包括数据中心的全生命周期:项目建议书、可行性研究、立项策划;系统规划、设计咨询;项目施工管理顾问;综合测试验证实施;运维管理保障。每个阶段相互关联,各专业相互依联,数据中心全过程的整体解决方案设计是确保数据中心安全运行的基点。迄今为止,我们已经为多个大型数据中心提供专业服务。

    一直以来,中测信通致力于为客户创造数据中心服务的专业价值,是现代数据中心机房工程整体解决方案设计创新、行业领导团队专家。

    雄厚的技术研发力量-- 自主研发的集中式负载及机房用的机架式负载,可为数据中心提供专业验证测试服务,提出维护解决方案

    专业的测试团队--- 有效整合专业机房测试团队,专家、测试工程师结构完成,覆盖数据中心各个领域人才。 多年的项目实施经验---公司长期与通信、石油、矿业、银行等单位保持密切的合作,为他们提供可靠的数据中心验证检测解决案,解决了企事业单位用电隐患。

中测信通zcecs——您身边的数据中心服务专家。

轻松玩转数据中心可靠性的几个概念

数据中心的重要性在于支持企业应用不间断运行。但近年来,世界各地的数据中心频频爆发安全故障事件,在一次次冲击着企业用户的心理防线。这也让我们产生一些思考,究竟该如何客观评判一个数据中心的优劣?
国内外数据中心的规范标准按照机房的性质和重要性将数据中心划分为以下不同的级别:
  
GB50174
          TIA-942        性能要求        系统配置        年平均故障时间
C级        Tier I        场地设置按基本需求配置        N
  
单系统没有冗余        28.8小时
        Tier  II        场地设施按冗余要求配置        N+X
  
单系统冗余配置        22小时
B级        Tier  III        并行维护        (N+1)+1
  
“双系统” 一用一备        1.6小时
A级        Tier  IV        场地设置按照容错系统配置        2N,2(N+1)
  
双系统同时运行        0.4小时
注:GB50174和TIA942并没有完全对应关系,本表仅为不同级别数据中心的对比。
这种级别的划分归根结底还是在可靠性和可用性上的划分,等级越高要求其可靠性和可用性就越高,其年平均故障时间就越短。因此我们评判数据中心优劣的标准可归结为:可靠性和可用性。
可靠性(Reliability)是一个概率值,指某个设备或系统在一个指定的时间内能够无故障的持续稳定运行的可能性。人们通常用MTBF(Mean Time Between Failure,平均无故障时间)这一指标来量化它。MTBF反映了产品的时间质量。可靠性是一个随时间变化的函数,时间越长,可靠性越低。其计算公式为:R(t)=e-λt,其中,λ为故障率,λ=1/MTBF。

可见,可靠性是一个与时间相关的标准,时间越长,可靠性越低。但是如果初始系统设计的较优秀,系统在更长时间内正常运行的概率就越高。由于数据中心中包含有各种各样的仪器和设备,不同的设备MTBF不尽相同,甚至是相同功能的设备MTBF也有所不同,所以对于数据中心的MTBF应该取所有设备MTBF的最小值。一些数据中心充分考虑了设备的业务备份,从而很大程度上避免了因设备故障造成业务中断的情况,所以MTBF的数值越高,就可以证明这个数据中心越好。对于MTBF不高的数据中心,依然可以通过其它数据备份、容错的方式提高其可靠性指标。其中容错是高可靠性的重要体现,当灾害或错误发生时,能够有自动修复和还原的作用,减少数据中心系统宕机率,确保系统的不间断运行。
可维护性(Serviceability)是指系统在规定环境条件下和规定的时间内,完成规定功能的能力,以及完成维护的容易程度。可维护性用MTTR指标来量化。MTTR(MeanTime To Repair,平均故障维修时间)是随机变量恢复时间的期望值,它包括确认失效发生所必需的时间以及维护所需要的时间。MTTR数值越小,说明数据中心故障恢复处理能力越强。数据中心出现各种故障是难免的,而MTTR数值越小的数据中心恢复业务的用时就越短,带来的损失也越小。
可用性(Availability)是指系统在使用过程中可以正常使用的时间与总时间之比,它是一个比率指标,其计算公式是A=MTBF/(MTBF+MTTR)。可用性可以用来表示某一运行中的可修复设备或系统在这段时间内能按其功能稳定运行的能力。例如:一个数据中心的MTBF是10年,MTTR是1小时,那么可用性指标A=10*365*24/(10*365*24+1)=0.9999772=99.9989%。在数据中心行业里,通过可用性指标的9数字的多少来表示数据中心可用性的高低。但可用性并不会特指故障发生的频率,对于相同的可用性,有以下数据:
  
可靠性
          每年故障停机数        故障停机时长        MTBF  (年)
0.99999        315        1  second        0.0032
0.99999        1        5.3  minutes        0.189
0.99999        0.05        1.75  hours        20
通过可靠性和可用性这两个指标基本可以对一个数据中心有个整体综合评价,通过两个指标的对比也可以分出数据中心的好与差,是评价一个数据中心的根本。这使得数据中心基础设施的设计有了可量化的依据,也使得评估有了可量化的依据。
您需要登录后才可以回帖 登录 | 注册通行证

本版积分规则

联系我们| 手机版|系统集成论坛 ( 京ICP备11008917号 )

GMT+8, 2024-5-18 01:50 , Processed in 0.059520 second(s), 23 queries .

系统集成论坛

BBS.XTJC.COM

快速回复 返回顶部 返回列表