亚洲成精品动漫久久精久,九九在线精品视频播放,黄色成人免费观看,三级成人影院,久碰久,四虎成人欧美精品在永久在线

掃一掃
關注微信公眾號

網絡管理超出狹義概念 管理應化繁就簡
2008-07-10   

隨著網絡系統在整個企業業務流程中的地位明顯提高,很多企事業單位都重新定義了網絡管理的職責,MIS(Manager Information System,信息系統管理)部門孕育而生。信息系統管理中的"管"已經拓展到多個方面,其中最主要的包括:網絡設備管理(NDM)、網絡系統管理(NSM)、應用性能管理(APM)、桌面管理(DMI)、員工行為管理(EAM)、安全管理(SM)和數據庫管理(DBM)七大方面。

在網絡管理中,如果上述七個方面中的任何一個環節出現了問題,某個網絡設備或者應用系統的物理或邏輯故障都可能造成整個業務流程受到阻礙,不能順利執行。監控管理到每個環節、甚至到每個設備的某個運行進程都是十分有必要的。但在網絡中如何發現故障,并且第一時間通知你出現了故障呢?這就需要預警機制。

"一只蝴蝶在紐約中央公園的小黃花上舞動了一下翅膀,很短時間過后東京就掀起一場大風暴,電閃雷鳴!"拓撲學中將這種看似無關聯的事情稱作--"蝴蝶效應",其理論基礎來源于"混沌理論"。在"混沌理論"中,人們主要關心"對初始條件的敏感性",這與網絡管理中關注故障點的做法非常接近。我們可以將網絡中的故障誘發點看成是那只舞動翅膀的蝴蝶,捕捉到網絡中的蝴蝶,記錄下每次翅膀舞動的節奏,這就是網絡監控的核心所在。

請人幫忙還是自己動手

有經驗的網管員都清楚,運維一個網絡要比組建一個網絡更加困難。一個重大的網絡故障發生之前,都會產生前兆。分析故障的前兆,這對于負責實施和支持企業網絡的任何管理人員來講,都將是你的終極挑戰!

如果我們制定了嚴密的管理方法,故障就不會出現了嗎?如果你有這樣的想法就大錯特錯了。不出現故障的網絡是不存在的,有人鼓吹說自己優化了網絡,因此就說網絡是安全穩定的,堅如磐石的,多長時間沒出現過故障!這是忽悠你的大話,這句話本身就是矛盾的,網絡之所以需要優化,就是某些系統和設備沒有運行在一個穩定的狀態,可能出現故障,優化是針對可能出現的故障的優化,是因為害怕出現問題而做的優化。

一些中小企業為了避免故障的發生,都會請專家來幫助分析,幫助調理優化網絡,在付費的同時還欠下了一筆"人情債"。智能化的網管軟件可以幫你省去這筆人情債,這是因為:智能網管能夠自動獲得網絡中各種設備的技術參數,進而智能分析、診斷,預警。將整個網絡中存在的隱患查找排出,遇到故障后第一時間知曉,加速恢復,支撐企業信息系統的RPO(恢復點目標)和RTO(恢復時間目標)。

迅速確定蝴蝶的位置

Broadview與眾多一線運維工程師保持著密切的合作關系,這種密切的合作不是一種泛泛而談的合作。深入網絡管理一線,傾聽網絡管理人員的心聲,從實踐中改善我們的產品,這才是我們的合作初衷。我們之間交流的形式是多種多樣的,很多工程師的BLOG紀錄了他們的心聲,其中一篇"網志"說明了預警機制的重要性:

成為MIS部小頭目有一段時間了,壓力太大,而且消費指數明顯上升。上午的幾個同事早上到40多公里外的機房進行新服務器的上架和調試工作。上架和調試的過程非常順利,中午之前,所有人員都回到了公司總部。但大家的午飯卻沒有吃成,這是因為另外一套應用系統出現了故障。在老板發火之前,我們已經嘗試了各種遠程維護的嘗試,唉!沒有辦法,只好返回了異地的機房。

故障解決的很快,因為服務器無法訪問的原因是由于物理層故障導致的,即:網線脫落!經過事后分析,我得出了這樣的結果:由于機房建設較早,而且部分信息插座存在老化現象,網線脫落很有可能是上午調試新服務器的時候不小心碰落的。再次返回總部的路上,大家由于找不到埋怨的對象(是誰碰落的網線無法得知),我成為了出氣筒:"如果碰落網線的同時,就會得到報警提示,我們就不用一天跑兩趟了!午飯還沒吃,你請吧!" 其實,請頓午飯沒有什么,不過我們公司缺少了這樣的故障及時報警機制到真的是個大問題。下一次的午飯不知道還是不是我請呀?

網絡管理軟件的首要功能就是報警機制。在上述案例中,如果在故障剛剛產生時,工程師就接了值班人員的電話,或者直接由網絡管理軟件發送出短信通知工程師,這種異地徒勞奔波就可以減少很多。

捕捉蝴蝶的工具選擇

網絡規模的急劇膨脹以及網絡結構的復雜程度不斷增加,產生了許多傳統網絡管理中不曾遇到的問題。網絡設備、服務器、客戶端三者之間的不均衡發展,在設備智能化管理的發展道路上呈現出了不同的指標曲線。諸多因素的共存,使得我們在實現對大量網絡設備的監控道路上辛苦地走著。在今天的網絡管理中,客戶端、服務器和網絡設備的維護成本比例越來越大,完全可以與企業IT硬件的前期投入相提并論。

在傳統的網絡管理工作中,如果要捉住一只"蝴蝶",我們只能使用"竹竿+網罩"的方式,這是一項非常消耗體力的工作。當系統發生故障后,網絡管理員往往根據經驗一步一步地檢查故障,如ping一下路由器、檢查一下系統CPU使用率、內存使用率等。網絡管理隨意性強、沒有規范,很容易漏掉一些關鍵點。這種查找故障的方法效率很低,我們常常一邊思考、一邊檢查,耗時長,而網絡癱瘓時間越長,企業的損失就越大。

Broadview NCC 網絡監控中心的目標就是為了達到快速有效的捕捉蝴蝶,化繁就簡。如果一款網絡管理工具的使用比去解決實際網絡問題還要復雜耗時,那么也就失去了它使用的意義,因為管理工具就是要能夠快速投入使用,幫助網絡管理員解決實際問題。比如說,網絡中某臺設備發生了故障,向外不停地廣播,嚴重影響了網絡速度,這時候就需要能快速定位故障所在處,方便后期處理,而不是動用復雜的分析軟件或專用的設備來處理。

分析蝴蝶的行為

現實生活中,我們要拍攝一只蝴蝶的翅膀舞動可以利用高速攝影機,而網絡中的蝴蝶是無形的,那么我們的高速攝影機在哪里呢?這就是SNMP(Simple Network Management Protocol)簡單網絡管理協議。它被廣泛接受并成為現今網管軟件基礎架構的鼻祖,經過三次的版本演化,很多管理員甚至將SNMP視為發現和解決一切故障的法寶,但隨著網絡和系統管理任務的增多,手工管理SNMP日志幾乎成了網絡管理中的累贅。

我們都清楚蝴蝶每次翅膀的煽動是不一樣的,但總是有規律可循的。這就和網絡管理中新生成的事件一樣,如果可以自動識別當前事件與前面事件的關系就可以找到規律。Broadview NCC使用SNMP,但不局限于日志的收集,而是將日志分析放在首位。記錄下網絡管理中的每次觸發事件,自動將觸發情況立即記錄到相關角色、設備、線路、流程、資源的歷史記錄中,同時將此信息記錄到事件報告中。每次觸發事件系統都自動生成事件報告,可以由集中維護人員根據需求對各類事件的類型的制定和分類。例如:根據事件的來源、類型、報警級別等,實現對事件控制臺智能化管理,自動區分和抑制重復事件,減少系統負載。

圖:SNMP記錄網絡管理中每次觸發事件

結束語:目前,企業級的網絡基礎建設在許多地區已經基本完成,對網絡管理的要求日益迫切,而且對網絡管理的功能定義實際已經超出了狹義的網絡管理,而轉為廣義的網絡管理即網絡架構管理。從上圖中我們可以看到,網絡管理的四個發展階段,但我相信絕大多數人仍然站在第一個階段,或者開始站在第二個階段的起跑線上。"應對型"的網絡管理模式已經不再適合我們了,捕蝶人的角色勢必也將改變。


熱詞搜索:

上一篇:WSDOM教育行業應用流量管理解決方案
下一篇:ITIL v2到ITIL v3的傳承與延續

分享到:   收藏