神華國華(北京)燃氣熱電有限公司(以下簡稱“燃氣熱電”)服務器網絡設備為響應國華電力公司統一運維的指導思想,科學構建統一運維體系,全面提升單位信息化服務的支持與保障能力,實現從粗放運維到精細運維,從職能的管理到流程的管理,從被動服務至主動服務的轉變,公司需要一套完善的綜合運維管理平臺來保證統一運維服務體系的正常運轉。
項目必要性
燃氣熱電作為國華公司建設的智能電站示范工程,信息化投入多,公司網絡建設已達到一定規模:網絡設備達到100余臺,服務器30多臺,虛擬機、數據庫、中間件幾十個,所采用的網絡設備和網絡應用呈現更廣更深的發展趨勢,企業網絡業務應用也變得日益復雜。
在集團大力支持下,信息化建設已經具有一定規模,建立了龐大的網絡平臺和各種應用系統,擁有大量的網絡設備、服務器、數據庫、各種系統軟件等資源,在這些IT資源為公司的業務發展和工作開展提供強有力幫助的同時,也帶來了大量運行維護工作和難題。
目前公司的運維人員只能被動響應解決IT故障,無法及時掌握網絡運行狀況和設備的運行狀況,無法做到對網絡運行信息的收集、整理、統計和分析,不能及時發現潛在的隱患,只能依靠人工巡檢或在故障已發生后才發現問題,基本處于被動式的“救火”狀態。這種被動式運維工作,無法對網絡、業務中產生的問題做到準確、及時的解決和處理,很可能由一個小故障而影響到整個網絡或應用系統的正常運行。
各類規模大小不等、設備種類、數量不同的網絡設備及機房廣泛分布于公司各分支機構所在地域,很難被有效預見、防范和避免。因此,建立一個集中的運行管理監控系統,對集團現有業務環境中的各類資源進行實時監控,是目前迫切的需要。
基于業務服務的必要性
業務系統的建設和發展為集團的日常工作開展帶來了很大的幫助,但是,在業務應用的過程中缺少一套實時、有效的監控管理系統,讓業務系統本身的維護成為一個難題,一旦某個業務運行緩慢甚至中斷時,無法及時判斷是業務系統本身出了問題,還是和支撐業務系統的其他設備或系統出問題導致的,如服務器宕機,交換機、路由性能低下或者網絡鏈路出現故障,不能及時判斷故障所在,就不能及時解決問題,恢復業務的正常運行,嚴重時,甚至可能導致業務中斷數小時。同時,由于沒有形成一套完整的業務監控系統,運維人員不能對業務及業務相關聯的資源進行總體監控和掌握,只能分割地管理各個部分,不能形成有效的、統一的運行維護管理。
因此,公司需要一套運維管理系統,能夠從業務角度切入,以業務為導向,通過對整個業務系統的關注,落實業務系統的各個環節,從而來達到保障業務系統穩定運行和透明化管理的目的。
目標系統需求
- 本次項目實施要完成機房內的所有網絡設備、服務器設備及其上軟件的監控,包括操作系統、數據庫、中間件、應用系統、服務器、網絡設備、存儲設備等,使網絡上授權的用戶隨時可以了解現場運行情況。
- 構建一套一體化的運行監控和運維管理平臺,集中展示業務系統的運行狀況,更好地實現對設備設施運行情況的監控和運維人員的管理,包括人員的工作情況、設備運轉、應用支持情況等,方便地了解系統資源的使用情況,定制各類統計、分析報表,實現預測系統資源的支持能力,能夠預先發現問題,進行主動的IT運維管理。
公司層面:
站在公司全域管理的高度,集中掌握各子域和各類管理應用的總體運行信息,以全局的視角審視總體管理狀況,做到“事前可知,事中可控,事后可查”.
1、全域IT運維整體狀況統計
- 全域整體健康狀況評估
- 全域網絡運行負載狀況查看
- 全域機房運行狀況查看
- 全域在線資產狀況查看
- 全域重大告警狀況查看
2、全域運行管理功能
- 網絡運行狀態統計
- 全域告警管理功能
- 全域重大告警事件統計
- 全域告警總體處理狀況統計
- 全域網絡告警狀況統計
3、全域巡檢管理功能
要求能夠站在全局的角度展現全域的巡檢統計信息,包括各個地域的巡檢率、巡檢正常率以及巡檢指標數的統計信息,并可以進一步查看各種類型巡檢的統計信息。統計時間范圍分為:最近1天、最近30天、最近12個月。
4、全域報表管理功能
界面直觀展現運行管理信息的同時,也要求能通過鉆取到明細報表的方式來追溯問題,提供各類運行統計分析報表,為全域IT運維管理提供決策支持。報表樣張內容涵蓋:全域總體運行分析、子域間同業對標、并覆蓋全域IT運維各類決策范圍。
5、個性化展現功能
- 支持首頁定制功能
- 支持默認主頁定制功能
- 支持手工更換各視圖中的地圖
- 支持其它頁面定制功能
- 支持快速接入方式
- 建立領導駕駛艙,集中展示系統中各類視圖
解決方案
在基于神華國華(北京)燃氣熱電有限公司的整體項目需求上,北塔軟件合了客戶的實際情況以及相關行業的解決方案分析,給出了全面完整的解決方案。
采用了北塔智能運維平臺BTSO,運用智能化策略,智慧化管理,有效的解決了當前客戶所面臨的網絡問題。
一、實現公司信息中心各項資源的集中管理和統一監控
運用先進的智能管理策略對各類信息資源執行了全天候、全方位的集中管理和實時監控。保證第一時間準確掌握設備和系統的運行和使用狀況,提早發現、主動預防、快速處理、最大化地減少故障,確保公司信息資源處于最佳運行狀態,有效提升燃氣熱電信息網運行的可靠性、可用性和連續提供服務的能力。
二、完善公司信息化基礎工作
BTSO在安裝部署后實現了客戶資源資產的集中管理、設備狀態的實時監控、異常狀態和及時預警、故障快速定位、運行趨勢的預測分析。以智能的流程、量化的數據統計和分析為依據,通過優化的組織結構、合理的角色分工、規范的管理流程、適合的監測方式,實現了整體信息化系統監控的智能化、操作的可視化和管理流程的自動化。從而建立起一套完整的、成熟的信息業務工作管理體系。完善了客戶的信息業務管理工作信息化。
BTSO巡檢效果圖
BTSO主機一體化展現效果圖
方案優勢
1) 該方案基于智維理念,采用數據集中設計,系統層次化和模塊化清晰,具有良好的擴展性和兼容性,能夠快速實現與其他系統數據層集成;
2) 該方案具有完善的資源信息庫,包含了配置信息、狀態、性能和故障信息,無需二次開發,支持可視化建模和持續擴展,為其他系統的數據接入提供快速通道,為運維提供了統一的、可伸縮的數據層支撐;
3) 能夠基于高度性能優化的資源庫,提供監控實時數據、歷史匯總數據、業務數據的分區管理,有效的保障運維平臺的數據的處理效率,能夠保障系統長期、高效的穩定運行;
4) 提供的統一事件處理平臺具有企業級的事件分析能力,為在海量事件信息中尋找有價值的根源問題信息,以提高監控和運維自動化的銜接;
5) 能夠基于WEB2.0 Flex/Flash等具有強大交互和動態展現的技術,為實時數據直觀展現、快速大屏預警、規范化業務處理,提供技術保障;
6) 能夠保持IT運維綜合管理平臺的可靠性和可用性,保證系統24小時不間斷為集團運行管理工作提供可靠服務;
7)通過運維系統建設,建立IT運維管理體系,包括系統/網絡管理,運行維護流程管理等,從而最大限度的屏蔽IT技術的復雜性,實現自動管理,降低對人的依賴;
用戶評價
在完整部署基于北塔BTSO的整個方案后,不僅實現了用戶對于網絡管理的要求,而且提高了網絡管理的高效化,智能化。得到了客戶信息化部門的一致好評:
- 讓運維人員更全面地了解到現在運行的設備情況。
- 讓領導層更快、更清晰地了解到現在信息化整體的運行狀況。
- 讓信息化建設有了更充分的數據依據。
- 讓運維不再是難題,用智能幫助運維,用智慧改變運維。