上期我們提到了某知名物流企業的服務運維故事,本期我們將就企業的IT故障問題展開討論。對于突對于突出故障,李總同樣存在著類似的困擾。上次業務部趙總的郵件事情就是其中一例,由于郵件發不出去,趙總的電話打到值班員小丁這里。趙總說道,上午網絡部的小陳和應用部的小張看過了,可還是沒徹底解決,小丁只好答道,趙總,您先別急,我馬上再派人給您處理。掛下電話,小丁非常沮喪,郵件時好時壞,到底怎么回事啊。這時,李總最需要的就是規范化、科學化的流程,將故障處理的更加徹底。
我們所熟悉的ITIL運維管理工具通過梯隊化的故障處理、尋根揪底的問題管理能解決李總所面臨的迫切問題。根據物流企業的組織架構和服務級別,ITIL運維管理工具將故障劃分為不同的類型和等級,通過全面的人員職責安排,形成梯隊化的故障處理流程,并充分利用現有解決方案和知識積累,做到快速響應、快速解決。這里涉及到兩個流程,一個屬于快速解決故障,恢復業務的事件管理,一個是尋找故障根源,制定方案避免故障再次發生的故障管理。
所謂的事件管理就是解決李總所遇到的一切IT故障,而且是以最短時間排除故障,確保企業業務系統的正常運轉為宗旨的。在ITIL工具化管理平臺Broadview COSS的幫助下,李總在日常的IT運維管理中會制定一些應急、容災方案,一旦有緊急故障影響到整個信息系統的運行時,就啟動備案進行解決。減少了物流企業的損失,同時也為IT部門的尋根究底提供了較充裕的時間。簡單來說,李總關系到客戶訂單能否實時反饋到企業的業務數據系統,而當關系其中某一環節的設備出現故障時,信息部門會采取快速排障的措施,能修復設備就最快速度修復,若時間過長影響到訂單的派發,立即啟用新的設備或者備份系統,如此一來,確保了訂單的雙方向流通,為保障公司業務的起到了定心石的作用。Broadview COSS事件管理減輕了李總的不少工作壓力,也提供了信息部門的IT服務質量。
信息部門的故障解決并不是以單純的故障處理完畢為終結的,李總更加注意整體IT運維水平的提高。因此,Broadview COSS的故障管理功能也就成為管理人員的得力助手。李總對信息部門員工有著明確的要求,解決緊急故障后必然弄清楚故障發生的原因,然后借助整個信息部門的力量來減少緊急故障發生的幾率。當有需要徹底解決的故障請求提出后,服務臺會先創建問題,然后將問題分發給信息中心各部門,通過各部門的評估,提交各自的解決方案,進行討論審核確定最終方案,此問題管理處理就算結束。可以看出,其主要優勢就是能減輕信息中心的重復性勞動,避免類似故障的再次發生。為從根本上解決上故障頻繁發生,而管理員忙于救火的局面。
通過事件管理和故障管理的結合運用,李總的信息部門能輕松處理好企業發生的各種IT故障,當然故障發生率已經大幅度降低了。最近,業務部門的滿意度提高了許多,小丁接到的郵件電話少多了,再也不用為這些重復的問題煩惱了。