針對各種懸在頭頂的難題,我總結出了網絡管理七大實戰(zhàn)兵法,希望可以給您一些啟發(fā)。
第一計:重中之重--關鍵業(yè)務流程
需要監(jiān)測的關鍵業(yè)務流程包括:1、單位內部的關鍵業(yè)務流程。如項目管理信息系統(tǒng)、生產管理信息系統(tǒng)等。2、網絡吞吐量大的業(yè)務流程。主要是一些復雜和交互式的業(yè)務流程,資金集中管理系統(tǒng)、公文流轉系統(tǒng)等。3、對系統(tǒng)造成大的壓力,頻繁使用數據庫的業(yè)務流程。4、同其它系統(tǒng)集成的業(yè)務流程,這些集成會提高應用失敗的風險。
這些業(yè)務系統(tǒng)龐大而牽涉面眾多,需要一個綜合業(yè)務管理平臺進行整體的監(jiān)測整合。好的解決方案是引進網管系統(tǒng),對業(yè)務系統(tǒng)是否正常運行、各項具體參數指標是否超標等進行精確掌控,避免或降低業(yè)務系統(tǒng)故障的發(fā)生率。
第二計:用戶體驗同系統(tǒng)性能指標相關聯
在制定監(jiān)控策略時,應該考慮將網絡中的所有網絡基礎架構都進行集中監(jiān)測,包括對數據庫服務器、應用服務器、路由器、交換機、防火墻的監(jiān)控,從而判斷哪里出了問題導致公司網絡暢通運行。信息服務管理網的網管工程師通過使用SiteView網管工具收集網絡運行信息,將性能數據同單位內部用戶的體驗相結合來分析網絡的性能狀況,診斷系統(tǒng)瓶頸。
第三計:建立網絡運行基準指標并觀察趨勢
長期監(jiān)測并建立基準指標對于保持網絡和性能的正常性能水平是非常必要的。通過對網絡運行的觀察,運維工程師可以知道網絡性能的變化和流量等指標的運行趨勢;及時發(fā)現網絡偏離系統(tǒng)基準模型時的異常狀況,分析是單一故障,還是嚴重問題的前兆,達到預警的目的,防止更嚴重問題的發(fā)生。
第四計:設計報警策略,避免警報泛濫
報警是管理網絡和業(yè)務系統(tǒng)最重要的功能之一,配置報警的依據是根據信息服務管理網的網絡運維目標,報警設置的原則:1、對影響網絡和業(yè)務的重要指標設置報警;2、消除誤報和重復報警;3、報警應該以多種方式及時發(fā)送給相應的運維工程師。
第五計:創(chuàng)建自動化、規(guī)范化事件處理程序
信息服務管理網運維工程師人員少,日常處理事務較多,他們需要在網絡、鏈路和系統(tǒng)運行出現問題時能夠有自動化、規(guī)范化的處理問題程序,快速處理各種潛在故障并且分配他們到合適的管理工程師,幫助他們提高工作效率。建立規(guī)范事件處理程序的另一個好處,是將工程師長期積累的知識和工作經驗系統(tǒng)化和固化,達到快速定位故障的目的。
第六計:網絡服務質量SLA的量化管理
提高服務質量的第一步是設立量化指標,將其作為整個網絡運維管理團隊的整體目標。信息服務管理網網絡性能管理的總體目標包括網絡和設備、業(yè)務的可用性、網絡的吞吐量、帶寬使用百分比、網絡延時、CPU和MEMORY的負載,對于不同的網絡指標還要根據網絡的上下級連接關系分解到每一個子指標,作為對網絡故障診斷和性能管理的依據。
第七計:制定網絡的升級和改進策略
網絡的升級和改進應該以對現有網絡和系統(tǒng)性能數據的測量為前提,以對網絡整體運行的現狀及趨勢分析為依據。通過對單一網絡系統(tǒng)和整體網絡系統(tǒng)性能數據的比較、單一網絡組件和其它網絡組件的數據比較、系統(tǒng)負載量最大時的性能數據和一般負載時的性能數據的比較等,判斷是否需要對系統(tǒng)的局部或者整體進行升級,發(fā)現網絡系統(tǒng)性能的瓶頸,提出網絡系統(tǒng)改進的方法。