亚洲成精品动漫久久精久,九九在线精品视频播放,黄色成人免费观看,三级成人影院,久碰久,四虎成人欧美精品在永久在线

掃一掃
關注微信公眾號

網絡故障管理預警先行
2010-06-01   網絡

  對最終用戶而言,網絡的概念似乎并不復雜,他們關心的僅僅是Web服務器是否能訪問,打印機是否正常工作等。在大多數情況下,對網絡管理員也是如此:如果網絡運行良好,網絡管理員就不必去接觸它;如果發生了故障,就要去恢復。但如果經常發生故障,就要考慮建立一套冗余或容錯的系統去消除,至少是減少發生故障的機會。

  我們希望在集線器、交換機、路由器、服務器及其他系統設備上開發出新的功能,使它們能在遇到局部故障時,仍然能夠發送SNMP信息,或對面向使用現狀的查詢做出響應。這樣有利于網絡管理員進行預防性的維護。事實上,服務器制造廠商在某些方面已經提供了這種服務,它們針對緊急磁盤故障向網絡管理員發出警告。我們希望對可能出現的小故障或操作狀態中的變化向網絡管理員發出警告,例如,交換機風扇速度緩慢,路由器內部溫度升高,或者服務器網卡正在發送錯誤的信息包等。當然這些都不會引起重大故障,主要是因為現在的網絡協議和網絡設備在設計時都考慮了容錯和靈活性。但如果許多這樣的小問題長時間積累起來,也許就是網絡中某個部件將要發生故障的前兆。同樣,當把某個設備當前使用狀態及其他參數與歷史數據相比較后,一些異常變化就說明實際的故障可能就在眼前。

  很多系統可以幫助網絡管理員分析SNMP數據,它們不僅可以提供網絡實際狀態的詳細情況,還可以幫助預測網絡部件的故障。Entuity公司的暴風之眼(Eye of the Storm,簡稱EotS)和Concord公司的電子健康組件(eHealth Suite)便是其中的代表。EotS主要是保證網絡在物理上的暢通,通過實時監視每個管理端口的SNMP事件,幫助網絡管理員分析,識別處于故障邊緣的部件。而eHealth Suite則著重于使用和運行狀態,它建立了一個包括網絡中每一個基礎設備元素使用狀況的基線數據庫,然后觀察異常情況。如果發生變化,它就可以與數據庫中的歷史數據通過特定的規則去匹配,一旦這種變化超越了預定界限,就發出報警。


  EotS實現實時監視


  EotS是基于Windows NT或Solaris的應用程序。定位在超過1萬個管理端口的大型網絡上,主要目的是幫助局域網管理員預先發現問題。其核心是服務器端應用程序,它能發現網絡設備、監視調查SNMP消息、管理并維護數據庫中的事件。在客戶端,EotS提供了一個部件觀察器,上面有包括網絡上所有管理端口的選單、公告板和報告中心。


  EotS作為預警工具有兩個原因:首先,不論是現在還是原來的設備故障,利用公告板都能實時收集并分析,而報告中心還可以做更深層次的分析,由于MySQL數據庫容量大,而且始終是開放的,所以在時間上相隔很遠的事件都能得到并可以分析;其次,公告板報警系統緊密地集成到離散部件的觀察器及其數據庫中,當某個設備開始脫離SNMP事件的影響時,部件觀察器就檢測那個設備及其端口以確定其他哪個端口是與它相關的。

  因為EotS映射VLAN,可以對VLAN進行重新配置,使用戶離開受影響的端口,這樣提供給管理員改組用戶的機會。EotS有一個十分方便的特性,就是部件觀察器能建立與JAVA接口設備的遠程TELNET連接?;蛘哒f,管理員可以從物理上改變用戶連接,使有故障的設備或端口從系統中獨立出來。同樣地,如果用戶總是抱怨連接斷斷續續的問題,部件觀察器就幫助跟蹤他們這些連接,最終發現問題。

  當SNMP事件發生時,程序的響應很快,但是能看到事件的唯一地方就是公告板控制臺,因為此系統沒有電子郵件、電話報警等內置功能,甚至也沒有發生錯誤時通常顯示的彈出選單。由于EotS能搜尋到的故障類型都很細微,不易察覺,從小問題到大范圍的系統故障,需要花幾個小時或幾天去檢測,所以需要配備專職的網絡管理員。

  EotS擅長分析能影響網絡基礎設備的細微問題,但它沒有自身預警的能力,也不能管理網絡中的最終節點。


  eHealth阻止超越極限


  與EotS搜尋物理設備的故障不同,eHealth主要強調SNMP管理設備的操作參數,例如某服務器已經持續運行在預設的CPU參數的極限值之上時,eHealth就能指出潛在的問題,在這點上EotS是捕捉不到的。而EotS指出的緊急硬件故障,eHealth的圖表是顯示不出來的。

  eHealth是由四部分組成的客戶/服務器模式系統。它的基礎是Live Health,主要負責收集設備的參數信息。它提供了一個Web接口,用以生成基于Adobe Acrobat圖像程序的報告,非常直觀,響應速度也很快,還能與外部管理程序(例如HP OpenView)對話。Live Health安裝過程不僅安裝Concord的程序,也增加了CERN Web服務、SCO的XVision PCX 等其他服務系統。另外三個軟件包分別是:Network Health,主要是監視集線器、交換機、路由器和其他網絡基礎設備;System Health,用以監視服務器和它們各自的服務和后臺程序;Application Health,對類似 Microsoft Exchange的應用程序和Web服務器進行端到端的監視。

  Network Health能安裝在HP-UNIX、Solaris或Windows NT服務器上。程序運行時,當提供給系統IP地址范圍后,就開始搜尋過程,系統能夠迅速識別出所有網絡上的SNMP管理設備。正常情況下,軟件每天在午夜執行一次用于發現問題的程序,大多數eHealth的參數都是用戶自定義的,幾乎每一個參數都有可選項。所有的配置都是在服務器控制臺上執行的。搜尋過程啟動后,程序就開始定期調查每一個管理設備(缺省設置是每隔5分鐘)。Live Health根據MIB對500多個SNMP管理設備的定義進行了預編程處理,所以它可以發現很多相關的信息。通常,所有收集的數據都存儲在數據庫中六個星期。這個過程完成后,程序可以持續運行幾天,這樣可以使系統更趨于正常,并由此建立一個基線。Live Health投入正常使用后,就可以通過Web界面進行管理。Live Health的一個重要用途就是實時異常情況監控。利用一套復雜的規則,系統可以顯示出異常情況。例如,一個平時很忙的端口突然顯示出沒有任何通信量;一個CPU超過它正常的使用范圍,或收發電子郵件的速度比預想的要慢了許多等。


  Concord公司的eHealth組件

  Live Health的規則非常復雜,例如,路由器的廣域端口使用是否超出了正常的參數范圍,每周或每天的使用狀況是否超出了歷史峰值等,以至于雖然規則設置得非常明確,但是大多數管理員還是希望讓系統根據數據庫的歷史記錄和規則去決定什么樣的組成是異常的。一旦發生了異常情況,就會出現在Live Health屏幕上,由此,管理員可以告訴系統起用快速模式開始監視那個設備。與EotS一樣,Live Health不提供任何外部預警功能,例如電子郵件,但是通過和第三方程序的連接可以提供這種特性。通過跟蹤異常情況,再利用數據庫去分析研究,為管理員判斷網絡可能或正在發生的故障提供強有力的依據,同時還能預測以后的趨勢和狀態。Live Health的另外一個主要部分就是它強大的擴展報告能力,有些報告甚至是可編程的,這些報告可以從Web上獲得,讓管理員可以從時間、組織或多種方式去分析設備。Live Health把報告生成非常直觀的Adobe Acrobat文件,可以為更高級的管理做準備。

  實際上,Live Health監視的不僅是基礎設備和服務器,還有上述新增模塊和端到端的應用程序。擴展報告和著重于運行等特點,使Live Health成為確實是一個與眾不同的解決方案。

熱詞搜索:

上一篇:網絡故障管理探析
下一篇:大規模網絡配置管理系統的設計思想及實現

分享到: 收藏