监控安装 ERP

系统集成论坛

 找回密码
 注册通行证

QQ登录

只需一步,快速开始

路由器交换机防火墙系统集成商城 优质产品采购平台
查看: 4090|回复: 0
打印 上一主题 下一主题

分享携程事件后迅速三步实现公司的自动化运维

[复制链接]

68

主题

68

帖子

174

积分

实习生

跳转到指定楼层
1
发表于 2015-6-9 10:44:58 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
华为金牌代理
上个月IT界发生了非常多的大事件,有光纤“绊倒”的巨头支付宝,有携程被程序员删了服务器运行代码,然后瘫了,知乎客户端出现短暂故障,Uber叫一次三辆车,相信只有携程惹的事最大,从中午11点多到晚上11点才恢复核心业务,5月28日的股市震荡没让太多人整夜不眠,而让携程整座大楼彻夜灯火通明。在现代企业,数据丢失不是任何一个公司所能承担的风险,这是举世所知的真理,数据丢失造成的损失远远大于保持数据不丢失所花的成本。当然,这些事件,不能全部让IT运维背黑锅,这也是由于长期运维人员用血肉之躯来到处救火的不堪重负,也由于运维部门长期边缘化,被认为是成本中心的价值观,企业只知道维持运维的白屋业务,不知道躲在黑屋中发酵的隐患,IT 和运维是完全不同的两个概念。一个不错的运维经理应该可以管理好企业IT,但是一个传统的 IT工程师很难有能力处理互联网运维任务,那么如何从网管、网工走向运维经理,如何又从单纯的维护到运维呢。
这从三步说起:
一、        当一个企业有了一定的业务支撑的IT基地设施架构之后,针对这些IT设备与IT方面的应用进行运维层面的监控,实现对运维的数据收集,如网络的拓扑形状、网络流量采集、系统事件日志、端口状态、连接状态信息、空间缓存内存值,命令返回值等一些综合数据与关键信息。这些实际类似WeADMIN ITOSS中的NNM网络设备管理、SAM服务器与服务器应用管理模块中的部分初级功能就是实现这些数据采集存储备份到共享的CMDB数据库中,也为运维人员把企业的整个IT系统需要掌握的状态,时时刻刻都给你整理出来了,立要立现立展示。
二、        对初级数据采集后,再向上一步就进行筛选、分析、处理、应用,如对关键数值进行分析,达到故障问题状态,立即向运维人员发出告警指示,并在原始数据上进行应用,如IP与MAC的绑定,IT设备的三维精确定位,资产管理,数据报表,运行状态趋势分析等等,运维人员快速定位故障,迅速解决,对企业IT系统运维的每一个细节都了如指掌,心如明灯,这在WeADMIN ITOSS的NNM、SAM与ALM资产管理模块中得到体现,实现了对原始数据的分析再应用,以及利用经验库进行主动式的网络管理,起到自动修复故障功能。运维人员从此可以安心地对IT操控自如了。
三、        三对这些应用上升到ITIL的标准化,以及对运维人员的有效合理配置,应用中的事件流程进行标准操作,对相关应用专业运维人员进行指导,如LINUX运维师,数据库管理员,系统管理员等有非常高的促进意义,促进相互交流沟通协同处理事务,对用户服务为标准,这在ITOSS中的ITSM IT服务管理模块中实现了企业IT运维的高级应用与标准化。运维管理人员就可以很好的运维一个企业的IT,肩负重担,却可以轻松应对,并且做到有效管理。
您需要登录后才可以回帖 登录 | 注册通行证

本版积分规则

联系我们| 手机版|系统集成论坛 ( 京ICP备11008917号 )

GMT+8, 2024-11-30 00:19 , Processed in 0.100077 second(s), 24 queries .

系统集成论坛

BBS.XTJC.COM

快速回复 返回顶部 返回列表