分享一个超强的智能IT故障告警精确分析系统
运维工程师们在大数据时代,下面对大量网络安全事件,若没有有效工具是无法完成分析工作,他们往往面对更多的挑战, 1) 每天出现巨大数量的安全报警,管理员很难对这些报警做出响应。 2) 误报严重,管理员无法准确判断故障。 3) 大量重复、零散而没有规律的报警,黑客的一次攻击行动,会在不同阶段触发不同安全设备的告警,这样导致报警数据之间在时间和空间上存在大量重复数据,如果不实现安全事件的关联处理,就无法有效的提高告警质量。当出现这些问题的部分原因是企业缺乏事件监控和诊断等运维工具,因为如果没有高效的管理工具支持,就很难让故障事件得到主动、快速处理。市面上有很多运维监控工具,例如商业版的Cisco Works 2000,在开源领域有Cacti、Zabbix、Zenoss、OpenNMS等。这些开源工具做了一个简单的比较:由于它们彼此之间没有联系,即便是你部署了这些工具,很多运维人员并没有从中真正解脱出来,原因在于目前的技术虽然能够获取计算机设备、服务器、网络流量,甚至数据库的警告信息,但成千上万条警告信息堆积在一起,让人根本没办法判断问题的根源在哪里,缺乏对信息进行筛选、数据挖掘的能力,其实我们并不缺少工具,商业的也好,开源的也罢,一抓一大把,为什么还是用不好?真正缺少的是分析数据的智能化。 WeADMIN ITOSS相比上面那些商业与开源的就智能化多了,也是国产软件中依据国人习惯而应用的IT管理平台,它在报警上支持颜色、声音、邮件、短信、微信的方式预警与告警,并且非常的精确:
WeADMIN ITOSS告警的可以进行报警依赖上一层级的错误告警信息,这样就可以智能分析这个报警是否发送,也可以寻根溯源追踪问题的根本,不会出现一个根故障,引发海量报警,对查找问题的根源也可以做精确的定位与分析。 WeADMIN ITOSS的报警的智能之处还可发现问题的故障除了可以向指定相关运维人员发出报警生成工单,工单可按事务处理的标准流程流转处理,直接到恢复报告,用户满意度环节。报警可以持续跟踪报警相关责任人。 WeADMIN ITOSS告警还可以统一时段的巡检,发现故障可以智能化地发给巡检当值人员处理等等,所以说在IT故障的告警不仅只是一个动作,更多是数据的分析,问题的依存关系,跟踪记录定位,考核监督等等,把报警做到极致,才实用,才是好工具。
|