盡管在數(shù)據(jù)中心和廣域網(wǎng)的設計過程中都有網(wǎng)絡災難恢復方面的考慮,但是網(wǎng)絡管理員還需要對本地網(wǎng)絡災難恢復有相應的準備措施,以防萬一。
提到“災難恢復 ”就會讓人想起大型災難造成的破壞,但是實際上,常見的管道泄漏或者是功率振蕩波動都會對企業(yè)LAN造成一場不大不小的災難。所以說如果企業(yè)LAN在設計和運行過程中沒有相應的網(wǎng)絡災難恢復計劃,就算是一個網(wǎng)絡交換機引起的故障都很可能迅速成為企業(yè)中曠日持久、意義非常的重要災難。
LAN災難恢復計劃的基本要素
在網(wǎng)絡管理員想要啟動網(wǎng)絡災難恢復計劃之前,需要對企業(yè)中實際運行的網(wǎng)絡類型、運轉(zhuǎn)狀況以及軟硬件庫存等有非常清晰的了解。這里所說的庫存數(shù)量就包括了交換機、WLAN 控制器、無線接入點、以及其他各種相關(guān)的網(wǎng)絡設備。
在掃描LAN以及鑒別和分類各種連接設備時,選擇范圍是非常廣泛的。網(wǎng)絡管理員可以以此為基線鑒別本地物理設備。比如識別哪些設備的使用率比較低等。
對存貨清單的精確掌握對網(wǎng)絡管理員的采購來說非常重要,了解具體的交換機線路卡或電力供應情況后,對系統(tǒng)硬件故障或小型、本地事件,比如說當發(fā)生雷擊或線路中斷等各種災難預防來說是舉足輕重的。如果實際預算允許,網(wǎng)絡管理員可以預存一些系統(tǒng)備件、備用交換機或其他重要的系統(tǒng)設備,當這些設備出現(xiàn)故障時,就可以及時替換。
有了庫存清單,接下來,網(wǎng)絡管理員就需要獲得這些設備的配置數(shù)據(jù)。不管這些數(shù)據(jù)是以太網(wǎng)交換機設置QoS和 VLAN 的配置數(shù)據(jù),還是設置企業(yè)無線網(wǎng)絡的配置數(shù)據(jù),企業(yè)想要建立良好的網(wǎng)絡災難恢復計劃,掌握網(wǎng)絡最新的配置數(shù)據(jù)和資料文件是至關(guān)重要的。所以網(wǎng)絡管理員需要在災難恢復計劃中記錄每一個配置的變化數(shù)據(jù)。網(wǎng)絡變更及配置管理 (NCCM) 工具就可以自動處理這一流程,但是網(wǎng)絡管理員需要在NCCM中備份所有的數(shù)據(jù),確保一旦發(fā)生災難等事件時,可以從NCCM中訪問并調(diào)用這些數(shù)據(jù)。
融合局域網(wǎng)中的災難恢復計劃
為了有效地實現(xiàn)企業(yè)的災難恢復計劃,網(wǎng)絡管理員需要利用服務器、臺式機以及數(shù)據(jù)中心支持團隊來確定網(wǎng)絡中每個庫存設備實際造成的損失。當有大規(guī)模的災難發(fā)生時,迅速確定最先發(fā)生故障的部分對確定災難恢復時間、設定網(wǎng)絡設備重新上線的順序來說非常重要。
企業(yè)需要考慮的方面還包括恢復網(wǎng)絡災難時耗費的人力物力,所需的成本,權(quán)衡恢復網(wǎng)絡設備發(fā)生災難時的各種利弊。比如說,如果企業(yè)只對游客開放無線網(wǎng)絡,那么就無需在無線LAN中設置冗余。
在網(wǎng)絡災難恢復計劃中的最小化單點錯誤
作為一個網(wǎng)絡管理員,其必須確保災難發(fā)生時企業(yè)LAN足夠靈活足夠有彈性,能夠把對系統(tǒng)的影響最小化。
傳統(tǒng)的企業(yè)LAN有許多不足之處,如果有必要,網(wǎng)絡管理員可以作出相應的調(diào)整。一個聯(lián)合了所有邊緣和布線機柜中的網(wǎng)絡交換機或一個非備份冗余的無線LAN控制器聚合交換機就可能導致大規(guī)模的系統(tǒng)宕機。
如果條件允許,網(wǎng)絡管理員應該在識別出每個重要的單點錯誤時就引入冗余設備。雖然這對總損耗的影響不大,但是冗余網(wǎng)絡連接、電力供應,又或次級無線控制器應該可以最小化小規(guī)模災難事件造成的影響。
LAN網(wǎng)絡災難恢復計劃中的簡易融合
一個有效地網(wǎng)絡災難恢復計劃的啟用,至少需要在數(shù)個工作點恢復其網(wǎng)絡訪問 。而恢復這個網(wǎng)絡的人也有可能不是網(wǎng)絡管理員。有時候某些事件也有可能阻止網(wǎng)絡管理員訪問該網(wǎng)絡。而對于其他技術(shù)人員,如存儲或系統(tǒng)管理員,就可以相應地接手執(zhí)行網(wǎng)絡災難恢復計劃工作。確保企業(yè)中其他的員工能夠在災難恢復計劃中獲取他們想要的資料文件并完成日常的測試工作。在多數(shù)災難恢復測試中,為了確保網(wǎng)絡管理員獲取災難恢復計劃中所需的信息,一個企業(yè)很可能會標明“不可用”的獨立測試環(huán)境。
在企業(yè)中,網(wǎng)絡團隊在災難恢復中的職責范圍非常廣泛?;诋斍暗臑碾y恢復計劃,本地網(wǎng)絡管理員應該能夠在第三方熱點中訪問網(wǎng)絡,這樣就可以很好地恢復數(shù)據(jù)中心或臨時辦公區(qū)域發(fā)生的各種災難。
虛擬化為LAN災難恢復帶來更多的可能
服務器虛擬化改變了許多災難恢復規(guī)則。除了為服務器管理員提高恢復時間目標 (RTO) ,虛擬化還能夠為網(wǎng)絡管理員改善他們恢復網(wǎng)絡設備時的處理方法。大多數(shù)硬件設備,如負載均衡,或應用交付控制器,現(xiàn)在都有了相應的虛擬設備 。雖然大多數(shù)的這些虛擬設備無法與現(xiàn)有硬件設備的性能相提并論,但是在災難恢復解決方案中這些虛擬設備的臨時救場能力也是值得我們肯定的。從另一方面來講,為了恢復站點而運行這些虛擬設備時,成本確實會低一些,而且相比于硬件設備,虛擬設備解決方案無需考慮一些選址問題。
原文鏈接:http://network.51cto.com/art/201102/244501.htm