網絡是企業的主要基礎設施,因此構建網絡災難恢復計劃至關重要,可以在指定的時間內使關鍵任務服務恢復工作。
災難恢復計劃已經存在幾十年的應用歷史。然而,必須經過精心設計來改變和適應新的體系結構和業務用例?,F代災難恢復計劃包括云計算、遠程勞動力和軟件定義的網絡。
以下將介紹企業可以遵循的六個實際步驟,以幫助企業為其網絡構建成功的災難恢復計劃。這些步驟可用作構建適合其恢復目標的網絡災難恢復計劃類型的框架。
1.指定任務關鍵型與非關鍵型網段
在網絡中構建自動冗余性和彈性是一個昂貴、耗時且復雜的過程。而在網絡的這些部分中,可以證明創建自動故障轉移的額外成本和復雜性。通常在數據中心、廣域網連接和對云計算資源的網絡訪問中發現真正的自動恢復能力。
通常實現完全彈性的領域并不包括無線局域網和大多數終端用戶連接的訪問層。對于這些不太重要的網段,可以制定恢復計劃,使用符合指定周期的替換硬件和軟件服務級別協議(SLA)將網絡重新連接。
2.在任務關鍵型網段中建立彈性
一旦企業指定哪些網段可以完成建立彈性的關鍵任務,下一步就是設計和構建。企業正在處理的網段將確定哪種彈性技術最有效。
大多數數據中心都使用動態路由協議和虛擬覆蓋網絡技術來提供跨硬件和鏈路的實時故障轉移。而廣域網彈性通常通過軟件定義的廣域網技術來處理。
最后,云計算彈性可以通過多種方式實施,其中一些方式依賴于企業與之合作的公共云服務提供商設計和維護的快速故障轉移技術。無論如何,在選擇適合企業的選項之前,了解所有選項非常重要。
3.配置備份
隨著網絡繼續從以硬件為中心的基礎設施向以軟件為中心的基礎設施轉變,正確的網絡配置管理變得越來越必要。對于傳統網絡來說,維護配置目錄通常包括使用遠程登錄到每個網絡組件的自動備份應用程序,并將配置復制并粘貼到文本文件中。然后,在硬件或虛擬化組件丟失的情況下,可以組織、存儲、檢索這些配置文件。
或者采用更新的網絡架構從集中位置配置整個網絡。這個中心位置可以在本地或在公共云中。無論采用哪種方式,從中央位置創建和存儲備份變得更加容易。
4.冷備件、快速硬件更換——或兩者兼備
從長遠來看,創建靈活的災難恢復計劃將為企業節省大量時間。
在發生災難時更換硬件方面有兩種選擇。第一種是購買相同的硬件組件,并在發生硬件故障時進行替換。這些組件稱為冷備件,在企業需要最少的網絡停機時間進行替換,其效果非常理想,這也是成本最昂貴的選擇,因為必須購買更多的硬件。
另一種選擇是根據企業的需要與制造商簽署適當的硬件替換服務等級協議(SLA)。在某些情況下,制造商提供硬件終身保修服務。也就是說,這個選項的硬件更換時間可能需要幾周。
大多數組織選擇為網絡分購買冷備用硬件,并與硬件服務商簽定硬件更換合同。同樣,企業選擇正確的選項可歸結為硬件組件在發生中斷時的重要程度以及業務功能是否丟失。
5.設定恢復預期、責任和溝通渠道
一旦制定了處理網絡災難的計劃和流程,下一步就是記錄恢復預期、責任、溝通渠道。期望通常圍繞著網絡每個部分的服務恢復時間。職責規定了個人、部門、第三方實體的角色,以及他們負責執行的詳細職責。
最后,應該創建溝通渠道文檔,詳細說明正在解決問題的網絡技術人員和渠道之間的最佳溝通流程,以便將進展情況更好地傳達給企業的其他部門。
6.中斷的根本原因分析
如果沒有步驟來評估發生的情況、發生的原因以及如何在下一次網絡災難發生時更好地恢復,那么任何一個網絡災難恢復計劃都不是完整的。在這一點上,團隊的表現將得到詳細的評價,以確保流程得到正確的遵循。此外,如果評估確定當前流程不理想,則應使用這個根本原因分析更好地改進或更改流程的步驟。
構建靈活的網絡災難恢復計劃
在構建網絡災難恢復計劃時,最終建議是假設主要的技術和架構變更將很快發生。因此,企業必須以這樣的方式開發流程和程序,使其易于修改并與必要的利益相關者溝通,而無需從頭開始。從長遠來看,創建靈活的災難恢復計劃可以節省大量時間。