
數(shù)據(jù)是企業(yè)的命脈,因此保護(hù)數(shù)據(jù)至關(guān)重要。數(shù)據(jù)庫系統(tǒng)已成為最主流的數(shù)據(jù)處理工具之一,并且是企業(yè)處理數(shù)據(jù)時工作流程的核心。中國信通院曾預(yù)計,全球數(shù)據(jù)庫市場在2025年將達(dá)到798億美元,中國數(shù)據(jù)庫市場將達(dá)到688億元人民幣,復(fù)合年增長率(CAGR)將達(dá)到23.4%。
數(shù)據(jù)庫備份是數(shù)據(jù)庫管理員(DBA)用來確保數(shù)據(jù)持續(xù)可用的方法之一。這個過程包括從數(shù)據(jù)庫中復(fù)制數(shù)據(jù)和模式,并保存在其他地方以便日后檢索。但如同其他IT流程,企業(yè)在備份數(shù)據(jù)庫時也需要考慮成本、收益和相關(guān)的風(fēng)險。
為什么備份數(shù)據(jù)庫十分重要?
備份數(shù)據(jù)在恢復(fù)數(shù)據(jù)時發(fā)揮著巨大的作用。根據(jù)IDC的報告,2021年上半年中國數(shù)據(jù)備份與恢復(fù)市場與去年同期相比增長了22.5%,市場規(guī)模達(dá)到了2.5億美元,顯示出中國在數(shù)據(jù)備份和恢復(fù)方面的旺盛需求。如果沒有備份數(shù)據(jù)庫,一旦出了問題,企業(yè)就無法恢復(fù)數(shù)據(jù),可能會導(dǎo)致?lián)p失慘重的后果。盡管無法恢復(fù)數(shù)據(jù)十分危險,這個情況卻很常見。比如我們?yōu)g覽論壇時,經(jīng)常會發(fā)現(xiàn)網(wǎng)上到處都有人在問他們的數(shù)據(jù)去了哪里,以及如何才能找回數(shù)據(jù)。如果他們最近沒有備份,那就肯定找不回數(shù)據(jù)。
備份數(shù)據(jù)庫的另一個重要原因是數(shù)據(jù)安全。假如一家企業(yè)遭受勒索軟件攻擊,就必須把攻擊前后的重要數(shù)據(jù)劃分清楚。數(shù)據(jù)恢復(fù)可以提供一份未被攻擊過的原始數(shù)據(jù),讓企業(yè)“倒轉(zhuǎn)時間”。如果勒索軟件攻擊加密了一家企業(yè)的數(shù)據(jù)并造成了系統(tǒng)癱瘓,該企業(yè)可以將備份恢復(fù)成全新的系統(tǒng)來規(guī)避攻擊。但如果沒有備份,企業(yè)就無法恢復(fù)數(shù)據(jù),也就無法維持其業(yè)務(wù)運行。
企業(yè)備份數(shù)據(jù)的成本
不同的企業(yè)對于數(shù)據(jù)庫備份的成本有著不同的考量。
例如,負(fù)責(zé)系統(tǒng)的數(shù)據(jù)庫管理員知道其公司在今年的前三周沒有進(jìn)行任何備份。那么一旦出了問題,數(shù)據(jù)庫管理員就必須向公司解釋為什么需要重新輸入這三周的交易記錄——畢竟他們只能恢復(fù)截止到12月31日的數(shù)據(jù)。如果數(shù)據(jù)庫管理員在出問題之前沒有做好備份,企業(yè)就得考慮重新輸入大量數(shù)據(jù)的成本。
這也會給數(shù)據(jù)庫管理員帶來成本。如果他們負(fù)責(zé)經(jīng)常備份數(shù)據(jù)庫,沒有備份就可能帶來不良影響。無論是面對憤怒的經(jīng)理還是丟掉工作,不備份數(shù)據(jù)庫都會給數(shù)據(jù)管理員個人帶來很高的損失成本。
另一個需要考慮的成本是數(shù)據(jù)存儲成本,即企業(yè)用于備份數(shù)據(jù)庫的媒介。無論企業(yè)購買的是異地存儲還是云存儲,都會產(chǎn)生相應(yīng)成本。另外,企業(yè)必須考慮與其恢復(fù)時間目標(biāo)(RTO)相關(guān)的成本——如果一個重要環(huán)節(jié)癱瘓了一小時,企業(yè)會遭受多少損失?在這段時間內(nèi)又會損失多少銷售額?
企業(yè)需要實現(xiàn)一種微妙的平衡:為了更好地存儲數(shù)據(jù)而支付更多的錢,并進(jìn)行更頻繁的數(shù)據(jù)庫備份,可以幫助企業(yè)減少恢復(fù)數(shù)據(jù)時可能失去的業(yè)務(wù),但這是否抵得上最初投入的成本?這是所有企業(yè)都應(yīng)該考慮的問題,尤其是在數(shù)據(jù)量不斷增加的情況下。值得慶幸的是,企業(yè)可以采取一些措施來經(jīng)濟(jì)有效地管理數(shù)據(jù)庫備份。
從備份中恢復(fù)數(shù)據(jù)庫
數(shù)據(jù)庫管理員的一項重要工作,是通過定期恢復(fù)數(shù)據(jù)庫來保證在關(guān)鍵時刻也可以及時恢復(fù)數(shù)據(jù)。如果數(shù)據(jù)庫管理員要負(fù)責(zé)成千上萬個數(shù)據(jù)庫該怎么辦?不可能每次把每個數(shù)據(jù)庫都恢復(fù)一遍,這樣做也不值得。
由于不可能每次都恢復(fù)所有的數(shù)據(jù)庫,所以數(shù)據(jù)庫管理員必須明確需要定期恢復(fù)的數(shù)據(jù)庫數(shù)量,以實現(xiàn)成本最小化,同時在出現(xiàn)問題時最大化恢復(fù)所有數(shù)據(jù)庫的概率。根據(jù)統(tǒng)計抽樣,在任意一天恢復(fù)少量隨機(jī)選擇的數(shù)據(jù)庫(也許只有幾十個),就可以讓數(shù)據(jù)庫管理員有95%的概率恢復(fù)所有備份。
另一個與此相關(guān)的成本是時間成本——需要時間來確定數(shù)據(jù)恢復(fù)的流程并定期測試這種隨機(jī)恢復(fù)。但如果數(shù)據(jù)庫管理員沒有建立這個流程,企業(yè)會付出怎樣的代價?顯而易見,一旦在沒有有效備份的情況下出錯,企業(yè)就會遭受巨大的損失。所以數(shù)據(jù)庫管理員對于數(shù)據(jù)備份的堅持不是毫無道理的,對于他們來說,最糟糕的事情就是丟失企業(yè)的所有數(shù)據(jù),同時因為沒有備份而束手無策。
常見和最佳的數(shù)據(jù)庫備份措施
一些常見的數(shù)據(jù)庫備份措施并不是最佳的。我們有時候有捷徑可走,有時候又常常不知道自己應(yīng)該如何開始。下面是一些企業(yè)在大部分(但不是全部)情況下可以采用的最佳實踐:
- 加密/密碼保護(hù)
數(shù)據(jù)庫管理員可以采用的一個最佳方案是對其數(shù)據(jù)庫備份文件進(jìn)行加密或密碼保護(hù)。但數(shù)據(jù)庫管理員一般不這么做,而大多數(shù)IT人員也只是進(jìn)行本地備份。
盡管如此,對備份數(shù)據(jù)進(jìn)行加密仍然非常重要。如果有人得到了備份的訪問權(quán)限,他們就可以拿走所有數(shù)據(jù)并在另一個系統(tǒng)中恢復(fù)。使用密碼保護(hù)文件至少有助于保證數(shù)據(jù)的安全。當(dāng)然,加密備份文件也會產(chǎn)生相應(yīng)成本。企業(yè)必須考量為了避免備份后被盜而付出這個成本是否值得。
- 平衡工作負(fù)載
另一個需要牢記的最佳方案是確保備份不干擾其他工作負(fù)載。理論上,備份不應(yīng)當(dāng)影響機(jī)器內(nèi)部發(fā)生的任何其他操作。如果備份正在被寫入一個與其他共享系統(tǒng)一起存儲的文檔,那么整個寫入過程都可能成為巨大的瓶頸。
- 避免占用帶寬流量
備份還會占用網(wǎng)絡(luò)帶寬。如果數(shù)據(jù)庫管理員每天在同一時間運行備份,就會拖慢其他人的工作。交錯備份(比如在凌晨1點備份一批服務(wù)器,在凌晨2點備份另一批,以此類推)可以幫助數(shù)據(jù)庫管理員避免占用網(wǎng)絡(luò)和給其他系統(tǒng)帶來問題。
- 了解并比較備份的收益與成本和風(fēng)險
如同其他IT流程,企業(yè)在備份數(shù)據(jù)庫時也需要考慮成本、收益和相關(guān)風(fēng)險。定期備份和恢復(fù)會有經(jīng)濟(jì)成本,而完全不備份則會影響企業(yè)的收入和聲譽(yù)。數(shù)據(jù)庫管理員最不希望在出現(xiàn)問題時,因為沒有備份而產(chǎn)生數(shù)據(jù)丟失風(fēng)險。企業(yè)必須了解數(shù)據(jù)備份解決方案的重要性,才能謹(jǐn)慎地平衡成本與風(fēng)險。