國華電力早在許久之前就曾經使用北塔網絡監控產品,但由于當前國華電力信息中心的網絡管理系統呈分散狀態,其范圍也非常有限,致使無法全面了解國華電力客戶信息網中計算機及網絡系統的實時運行狀況,對網絡資源配置及網絡流量分布也無法進行有效監控,關鍵在于無法實現運維流程與事故報警的聯動。國華電力客戶的各項業務系統對計算機網絡和IT基礎平臺的依賴性越來越高,對系統與網絡的可用性、可靠性和穩定性也提出了更高的要求。因此,對全局的計算機及網絡系統進行高效、統一、集中的監控和管理是保證國華電力客戶及各項業務系統正常運行的重要條件。
之前國華電力客戶的IT管理主要面臨以下問題:
1、網絡管理的覆蓋范圍不足
2、缺乏統一的運維管理平臺
作為網絡管理員,必須有效地了解網絡中數據傳輸是否正常、服務器以及網絡設備是否過載運行、局域網內部以及局域網與互聯網的連接是否正常、局域網是否受到非法者的攻擊、用戶之間的數據傳輸是否正常等等,同時,在遇到網絡時斷時續、網絡內部用戶不能正常上網等網絡故障時,必須能快速定位故障點并將其排除。由于網絡之間的數據傳輸的不透明性,沒有統一的網絡管理平臺,管理手段落后,網絡管理人員很難及時準確完成上述要求。
3、網絡性能得不到充分發揮。
由于沒有網絡性能方面的管理工具,網管人員不能對網絡進行有效的調整和優化。
對于國華電力這個集生產業務網絡和電子政務外網混合組網的網絡系統來講,如果沒有一個有效而集中的工具進行管理和分析網絡的運行趨勢,找到隱藏的性能瓶頸,為網絡系統管理的長期規劃提供數字依據。將難以保證網絡及各項業務應用的順利運行。
從業務視角管理IT
國華電力的業務系統通常由以下幾個組件組成:
1、網絡
2、主機
3、應用
4、用戶
當某個組件出現問題,問題就會反映在業務服務儀表盤上,用戶(包括業務部門)只關心提供給他們所使用的業務服務的狀態與性能,而不關心技術細節。

通過服務儀表盤,國華電力信息管理部門可以隨時了解到:
1、業務服務運行狀態
2、KPI指標(平均無故障時間MTBF、平均恢復時間MTTR)
3、各服務組件之間的依賴關系
4、故障對于服務的影響
以用戶的身份感受IT服務
國華電力信息化建設為遍布全國的二十多個電廠業務支撐體系提供了大量的業務系統,從用戶體驗的角度出發,嚴格審查業務系統的可用成都,通過模擬用戶行為,對業務支撐系統的業務流程進行監測,從應用的層面監控業務支撐系統的可用性。

三步走式的故障分析策略
國華電力目前針對全國二十個電廠提供的業務支撐系統復雜度相對較高,在出現異常情況時往往在初步的故障分析中就浪費了大量的時間,為此,國華電力信息管理中心提出了“三步走”式的監控機制,當出現故障時通過圖形化的展示界面即可快速定位到故障點。

第一步:排除周邊影響因素。即當故障時首先通過自動監控機制判斷該業務系統主機的網絡連接情況、業務系統首頁打開情況、Web訪問的端口情況等,將網絡、主機、業務表現三個因素綜合進行初步故障分析。
第二步:查清平臺級影響因素。即在周邊條件均正常時,通過自動監控機制提供各個應用平臺級底層指標的性能負載及資源消耗情況,主要體現在對一些中間件、數據庫、J2EE應用平臺等IT資源中,實現業務應用平臺級的故障分析。
第三步:由于在國華電力業務支撐體系中存在大量自行開發的應用程序,對這些程序的執行效率監控就形成了故障分析的法寶,通過自動化的日志監控機制將程序執行過程中的異常拋出按照關鍵字以及日志級別等方式進行過濾,使運維人員不在因錯失日志而無法解決問題。
基于業務,關注事故自動處理機制的摩卡軟件為國華電力帶來實惠
正如細節決定一切,摩卡軟件推出的摩卡業務服務管理(Mocha BSM)4+1產品套裝,希望通過每個細節,幫助國華電力進入一個有序的統籌安排的階段,控制整個企業的風險,不斷幫助企業實現業務的可持續性發展。