效率决定一切,如何拥有"智能"IT运维管理"知识库"

  互联网思维的本质到底是什么?是快捷,是效率!然而,当人们的思维已经改变,许多组织中IT运维部门却感到无所适从,为了提高客户服务中心的效率和客户满意度水平等,他们都在积极寻求最佳的知识库技术,但却往往都面临着同样的问题:建立、维护和效率。

  知识库曾经辉煌

  知识库的建立是一个很艰巨的任务,需要耗费大量的人力物力,需要对事件管理和问题管理平台中出现的每一个事件问题进行归类整理,对出现的各个事件按部门、类型、处理难易度、解决时间等进行化类区分,并存入知识库。另外,还需要将网络拓扑图、网络架构、网络配置、网络运行标准规范等等内容加入到知识库中,并且第一时间得到维护。这样的好处就是一旦有其他非网络运维人员碰到网络问题时,可首先参考知识库的文档,并改善各个部门各扫门前雪的不好习惯。

  前几年,通过强大的内部知识库,企业可以迅速使信息部门将一个新人从服务台一线到二线、三线向后培养,建立一个有效的人才培养路径。而网络上也有不少励志的故事,例如某个管理员通过学习厂商的知识库,成为业内专家。

  对于操作系统、数据库和应用程序开发来说,知识库是一个众人拾柴火焰高的过程,比如Microsoft的KB知识库就非常出名,全球所有的微软支持人员就会将自己工作中碰到的问题、解决的问题、个人经验共享到知识库中,因此你可以在微软的知识库中找到各种你需要的东西。而这一目标在个性化和相对封闭化的企业内部就很难运转起来,根源来自于数据中心系统的复杂性、故障的隐蔽性、业务的关联性。当然,这也与国内IT技术人员仍不OPEN的思维方式有关。

  时代变迁,通过调查,记者发现许多已经实施了知识库的企业,应用效果很一般。单一的配置管理和知识库维护成本正在增加,一旦遇到棘手的IT故障,IT人员多数还会去外部的知识库寻找问题的答案,百度、谷歌成为了知识库的入口。而这些知识并没有被流程控制,知识库无法得到有效更新,故障排除的效率并没有提升。

  智能化的IT运维旨在提升效率

  作为国内领先的IT运维管理专家,北塔软件在ITIL项目咨询和长期实践过程中,经历了知识库这些年来的"辉煌"与"没落"。

  北塔软件表示:在早期的"半自动化"IT运维阶段,企业内部的基础架构单一、业务系统关联性不强。而通过知识库的记录,使信息部门所涉及到的基础设施、应用系统等都能够得到记录,为IT部门打造了一个铁打的营盘,不再害怕高级人员的流失和变动。然而,这些系统故障诊断为核心的静态知识库管理,在基础设施更加复杂的云和大数据时代正在失去作用。在面向业务管理的运维体系进化下,出现了各种"建、管、用"的难题。

  对于知识库的发展方向,北塔软件认为:在以业务为核心的运维阶段,各种基础设施之间的关系交叉程度非常紧密,专家知识库的架构必须升级,支持业务系统的关联性分析。完全智能化的知识库产品,或是具有自我智能修复的系统还未产生,所以,采取人机结合的方式,利用IF-THEN判别规则集,由管理员选择故障现象,运维产品提示下一步检测点,这样可以辅助系统管理员快速定位故障的原因。

  在倡导智能知识库的同时,北塔软件正积极投入到基于传感器信息与专家知识库对接,系统模糊判断和人工智能方面的研究,并在其推出的北塔BTIM运维平台上努力提升着IT运维的"效率"。

  在北塔BTIM系统的内部,所有管理组件都不是互相独立的,这种基于企业IT运维管理规律的关联性,体现在客户可以根据故障原因,一层一层的去抽丝剥茧的分析解决问题。一旦故障发生,运维人员业务视图递归到物理拓扑、机柜拓扑、设备面板图,或是虚拟机的工作状态。网管员根据告警和机房物理设备地址的关联关系,迅速确定告警设备的机房位置,并且运用关联性,通过右键入口进入故障端点。

  在需要与时俱进的IT运维工作中,"关联"能够将企业的IT资源纳入到一个统一平台进行管理,在此基础上对于采集而来的底层数据进行关联分析,从而得出重要的运维结论。同时,基于业务系统的相关IT架构也应该能够关联,对构成业务系统的客户端、数据交换平台、硬件支撑平台、支撑软件平台、应用系统等进行实时的监控管理,从而准确掌握业务系统的运行情况,当业务系统发生故障时,能迅速定位到具体环节。只有这样,才能真正做到对IT资源掌控于心,运维无忧。

 

上一篇:智能无惧挑战 山石网科轰动RSA2015

下一篇:精确检测SANDWORM(沙虫)APT攻击