災(zāi)難恢復(fù)的價值
在談什么是災(zāi)難及災(zāi)難的種類之前,我想先談?wù)劄?zāi)難恢復(fù)的價值。作為個體,我們每個人可能都會購買這樣、那樣的保險,比如說為了車的安全,給車買保險;為了房子的安全,給房子買保險;為了自己的各方面;購買養(yǎng)老保險、安全保險等等……諸如此類都是為了讓自己在遇到突發(fā)事情(通常都不是什么好事兒)的時候能夠把自己的損失減少到最低。同理,災(zāi)難恢復(fù)就如同企業(yè)日常業(yè)務(wù)的保險;一個企業(yè)如果具有一份保險的話,那么面對突發(fā)事件將比別的企業(yè)有更強抵御風險的能力。同時,企業(yè)不僅僅只需要這份保險,還需要的是一份更加完善、更加適合自身的保險;這就是災(zāi)難恢復(fù)的價值。
什么是災(zāi)難?
災(zāi)難的定義很多種,這里只討論針對企業(yè)IT的災(zāi)難。從企業(yè)的角度來看,災(zāi)難是指對企業(yè)產(chǎn)生災(zāi)害性影響的事情,并且嚴重影響到企業(yè)日常業(yè)務(wù)的正常運營;這種事情是無法預(yù)料的、出于意外的。說的再通俗一點,就是點背兒;企業(yè)要是遇到地震、暴風雨、海嘯、火山爆發(fā),那就只能埋怨天公不作美了;如果遇到一些其他的人物事故,那就要好好反思反思了。下面將要討論的是災(zāi)難的種類。
災(zāi)難的種類
“多災(zāi)多難”這個詞語就能夠體現(xiàn)出災(zāi)難種類的繁多來,災(zāi)難有多種形式,而且危害程度不同,從地震、暴風雨這些自然災(zāi)害到不滿員工的蓄意謀害,異或是黑客的故意破壞,總之是你能想到的全有,不能想到的也可能會發(fā)生。各種危害對企業(yè)的上海程度也不盡相同。一些可能被看做是一場大災(zāi)難,而另外一些可能就是一些小麻煩了。但是通過上面所說的定義,所有災(zāi)難,無論大小,都會對企業(yè)的日常業(yè)務(wù)產(chǎn)生影響。
企業(yè)面臨的災(zāi)難主要有以下幾種:
人為事故。任何企業(yè)都可能會受到很多潛在災(zāi)難的威脅。其中有一些可能是由于直接的人為原因。企業(yè)員工使用企業(yè)的資源,獲得和操縱有價值的數(shù)據(jù),這些數(shù)據(jù)是工作中時時會用到的,因為很多人都會使用公司電腦保存文件,并且他們嘗嘗認為使用數(shù)據(jù)并保證數(shù)據(jù)隨時可用是理所當然的,那么這些數(shù)據(jù)就會受到來自那些能夠獲取它們的員工所產(chǎn)生的人為事故的威脅(無論是那些合法獲取的人還是惡意獲取的人)。一旦事故發(fā)生,將造成不可估量的后果,最典型的就是:機密郵件的泄露,郵件的外泄可能會對公司業(yè)務(wù)造成嚴重的影響。
潛在的事故包括文件和記錄級別的數(shù)據(jù)刪除、數(shù)據(jù)損壞或者數(shù)據(jù)泄露。這些損失很隱蔽,跟其他威脅相比更加難發(fā)現(xiàn),并且是相當長的時間內(nèi)不會引起注意。這種特征給災(zāi)難恢復(fù)增加了很大的難度,比如有些數(shù)據(jù)一不小心刪除的話,如果馬上請求恢復(fù),也許能夠得到妥善處理,如果這些數(shù)據(jù)長時間沒有被報告,那么將給災(zāi)難恢復(fù)帶來很大的麻煩。
設(shè)備失效。設(shè)備失效定義比較廣,應(yīng)該說所有服務(wù)于企業(yè)業(yè)務(wù)的設(shè)備都屬于這個范疇。比如說電力設(shè)備,如果電力設(shè)備突然失效,那么企業(yè)依靠計算機的那部分業(yè)務(wù)首當其沖受到影響,業(yè)務(wù)控制,ERP、數(shù)據(jù)處理等諸多問題都會受到影響,電力設(shè)備的失效對企業(yè)來說絕對是頭疼的事情。還比如說軟硬件的失效,比如說關(guān)鍵設(shè)備(服務(wù)器、存儲設(shè)備)的突然失效,那將會對企業(yè)關(guān)鍵業(yè)務(wù)造成嚴重的影響;還有員工工作的PC或者筆記本出現(xiàn)的硬件故障,也會對員工工作造成一定的影響;還有一些關(guān)鍵業(yè)務(wù)軟件也可能會遇到失效的時候;設(shè)備的失效對企業(yè)造成的影響范圍很大。
自然災(zāi)害。自然災(zāi)難應(yīng)該是最好理解的災(zāi)難了。所有大自然界對企業(yè)業(yè)務(wù)造成影響的自然現(xiàn)象都屬于這個范疇,比如說:地震、暴雨、颶風、海嘯、火山爆發(fā)等等,大自然的力量不可阻擋,當然這種災(zāi)難屬于小概率事件,但是破壞性也是驚人的。應(yīng)對這種災(zāi)難,也是需要企業(yè)在災(zāi)難恢復(fù)方面最多工作的。
蓄意破壞行為。蓄意破壞行為應(yīng)該是對企業(yè)業(yè)務(wù)破壞很大的一種行為;通常人為事故、設(shè)備失效、自然災(zāi)害可能都或多或少存在一些無意的因素。但是蓄意破壞行為則是帶有非常明確的目的性,它的目的就是為了破壞企業(yè)的關(guān)鍵業(yè)務(wù),從而讓企業(yè)的關(guān)鍵業(yè)務(wù)陷入癱瘓。比如說去年英國的銀行卡信息被盜事件。對于那些蓄意搞破壞的人來說,入侵的概率及產(chǎn)生的危害將會是永無休止的;從縱火、破壞公司各種設(shè)備到入侵企業(yè)的網(wǎng)絡(luò)系統(tǒng),通過黑客行為或者傳播病毒,讓企業(yè)業(yè)務(wù)系統(tǒng)陷入癱瘓等等。
大概羅列了災(zāi)難的一些種類,接下來該談的就是如何去預(yù)防和應(yīng)對這些災(zāi)難了,也就是該談?wù)劄?zāi)難恢復(fù)了。
什么是災(zāi)難恢復(fù)?
簡單的講災(zāi)難恢復(fù)就是為了保持業(yè)務(wù)連續(xù)性的一部分,其主要負責的是在災(zāi)難或者緊急事件發(fā)生的情況下如何保證業(yè)務(wù)的持續(xù)進行?;蛘哒f災(zāi)難恢復(fù)是指一個公司從災(zāi)難中恢復(fù)重新開始正常運營的能力。
在遭遇到一場大災(zāi)難的時候,業(yè)務(wù)恢復(fù)的首要目標就是保證機構(gòu)最低限度的服務(wù)水平。同時在盡可能短的時間內(nèi)使得公司恢復(fù)正常運營也是尤為重要的。這就意味著在災(zāi)難恢復(fù)的過程中需要采用交叉的手段:一方面對于重要的功能和流程需要及早修復(fù),同時也需要完成所有流程和功能的修復(fù)。災(zāi)難恢復(fù)計劃的制定過程需要公司內(nèi)部多個職能部門的關(guān)鍵人員共同協(xié)商挖成。(接下來的文章會談到如何制定災(zāi)難恢復(fù)計劃)
談了很多災(zāi)難和災(zāi)難恢復(fù)的概念,最后為了能夠加強各位對災(zāi)難恢復(fù)領(lǐng)域的重視,引用在備份領(lǐng)域經(jīng)常提到的墨菲定律:“墨菲定律(Murphy’s Law)緣于美國一位名叫墨菲的上尉。他認為他的某位同事是個倒霉蛋,不經(jīng)意說了句笑話:“如果一件事情有可能被弄糟,讓他去做就一定會弄糟。”這句話迅速流傳。經(jīng)過多年,這一“定律”逐漸進入習語范疇,其內(nèi)涵被賦予無窮的創(chuàng)意,出現(xiàn)了眾多的變體,“如果壞事有可能發(fā)生,不管這種可能性多么小,它總會發(fā)生,并引起最大可能的損失”、“If anything can go wrong, it will.(會出錯的,終將會出錯)”、“笑一笑,明天未必比今天好。”“東西越好,越不中用”、“別試圖教豬唱歌,這樣不但不會有結(jié)果,還會惹豬不高興!”#p#分頁標題#e#
根據(jù)“墨菲定律”:
一、任何事都沒有表面看起來那么簡單;
二、所有的事都會比你預(yù)計的時間長;
三、會出錯的事總會出錯;
四,如果你擔心某種情況發(fā)生,那么它就更有可能發(fā)生。
我們都有這樣的體會,如果在街上準備攔一輛車去赴一個時間緊迫的約會,你會發(fā)現(xiàn)街上所有的出租車不是有客就是根本不搭理你,而當你不需要租車的時候,卻發(fā)現(xiàn)有很多空車在你周圍游弋,只待你的一揚手,車隨時就停在你的面前。如果一個月前在浴室打碎鏡子,盡管仔細檢查和沖刷,也不敢光著腳走路,等過了一段時間確定沒有危險了,不幸的事還是照樣發(fā)生,你還是被碎玻璃扎了腳。如果你把一片干面包掉在你的新地毯上,它兩面都可能著地。但你把一片一面涂有果醬的面包掉在新地毯上,常常是有果醬的那面朝下。
墨菲定律告訴我們,容易犯錯誤是人類與生俱來的弱點,不論科技多發(fā)達,事故都會發(fā)生。而且我們解決問題的手段越高明,面臨的麻煩就越嚴重。所以,我們在事前應(yīng)該是盡可能想得周到、全面一些,如果真的發(fā)生不幸或者損失,就笑著應(yīng)對吧,關(guān)鍵在于總結(jié)所犯的錯誤,而不是企圖掩蓋它。
2003年美國“哥倫比亞”號航天飛機即將返回地面時,在美國得克薩斯州中部地區(qū)上空解體,機上6名美國宇航員以及首位進入太空的以色列宇航員拉蒙全部遇難。“哥倫比亞”號航天飛機失事也印證了墨菲定律。如此復(fù)雜的系統(tǒng)是一定要出事的,不是今天,就是明天,合情合理。一次事故之后,人們總是要積極尋找事故原因,以防止下一次事故,這是人的一般理性都能夠理解的,否則,或者從此放棄航天事業(yè),或者聽任下一次事故再次發(fā)生,這都不是一個國家能夠接受的結(jié)果。
人永遠也不可能成為上帝,當你妄自尊大時,“墨菲定律”會叫你知道厲害;相反,如果你承認自己的無知,“墨菲定律”會幫助你做得更嚴密些。
這其實是概率在起作用,人算不如天算,如老話說的“上的山多終遇虎”。還有“禍不單行”。如彩票,連著幾期沒大獎,最后必定滾出一個千萬大獎來,災(zāi)禍發(fā)生的概率雖然也很小,但累積到一定程度,也會從最薄弱環(huán)節(jié)爆發(fā)。所以關(guān)鍵是要平時清掃死角,消除不安全隱患,降低事故概率。
實際上,你越是怕什么,就越來什么。”
由此得出的教訓(xùn)是:如果做某項工作有多種方法,而其中有一種方法將導(dǎo)致事故,那么一定有人會按這種方法去做,而且往往將會以最壞的結(jié)果出現(xiàn)。
那么企業(yè)為什么需要災(zāi)難恢復(fù)?因為企業(yè)要做好最壞的打算,做到未雨綢繆!這樣才能在災(zāi)難面前立于不敗之地。