
云中斷有各種各樣的根本原因,它們可能造成嚴重的、持久的損害。首席信息官有許多防止云中斷的選項。當災(zāi)難最終發(fā)生時,制定恢復(fù)計劃是值得的。
云中斷的原因
云中斷的原因有很多。特定的惡意軟件可能使一些重要的系統(tǒng)癱瘓,或者服務(wù)器可能被DDoS攻擊所淹沒。云中斷也可能被視為網(wǎng)絡(luò)犯罪的一個子類別,這是數(shù)據(jù)中心意外中斷的常見原因。但與大多數(shù)IT系統(tǒng)一樣,電源故障是云服務(wù)中斷最典型的基于硬件的原因。這可能包括硬件故障、網(wǎng)絡(luò)故障和電力中斷等。
保護企業(yè)免受停機的影響
首席信息官可以快速評估云計算準備情況并制定轉(zhuǎn)型計劃,以防止云中斷的發(fā)生。他們還可以組建團隊來設(shè)計和執(zhí)行實施。此外,首席信息官可以采用敏捷的方法和實踐,監(jiān)督云原生服務(wù)和工具的盡職調(diào)查,并支持站點可靠性工程和DevOps。企業(yè)應(yīng)該保護其IT基礎(chǔ)設(shè)施,并確保其在運行自己的云平臺時具有故障轉(zhuǎn)移能力。
尋找和選擇合適的云合作伙伴對于防止中斷也是至關(guān)重要的。云計算供應(yīng)商中斷可能只會影響一個位置。企業(yè)必須選擇不同的云區(qū)域,以限制停機的影響。當一切運行順利時,離用戶最近的區(qū)域?qū)⑦\行得更好,但備份區(qū)域允許用戶在出現(xiàn)問題時訪問服務(wù)。
從云中斷中恢復(fù)
云中斷雖然很罕見,但確實會發(fā)生。首席信息官有許多從云中斷中安全恢復(fù)的選擇。創(chuàng)建數(shù)據(jù)備份是必不可少的第一步。應(yīng)該為重要的云原生服務(wù)和數(shù)據(jù)規(guī)劃備份、跨云備份和從云備份,以保持數(shù)據(jù)的可訪問性。自動備份和檢查這些備份的能力減少了這些情況下的壓力。
采用數(shù)據(jù)彈性策略是至關(guān)重要的。關(guān)鍵是要了解恢復(fù)時間和恢復(fù)點目標是可以滿足要求的。此外,了解平均無故障時間(MTTF)和平均修復(fù)時間(MTTR)等關(guān)鍵指標可以幫助評估團隊從事件中恢復(fù)的速度。首席信息官可以通過制定災(zāi)難恢復(fù)計劃和利用預(yù)算來幫助他們的公司從云中斷中恢復(fù)。
解決云中斷問題
事實上,任何人都可能遭遇云中斷。其原因包括人為錯誤、自然災(zāi)害、電力中斷和網(wǎng)絡(luò)攻擊。云中斷耗費了企業(yè)大量的資金和精力,甚至失去客戶的信任。采取預(yù)防措施可以幫助減少計劃外停機的可能性。構(gòu)建云計算支持團隊、實現(xiàn)敏捷方法、自動化人工流程以及選擇一流的云計算供應(yīng)商都是這些預(yù)防措施的一部分。但是,即使盡了最大的努力,仍然可能發(fā)生停機。此外,在網(wǎng)絡(luò)安全威脅日益增多的情況下,識別漏洞、保持警惕和擁有恢復(fù)策略對于云中斷的成功恢復(fù)至關(guān)重要。