圖源:新華社
面對這種極端天氣,對環境要求嚴苛的數據中心必須嚴陣以待。除汛期洪水外,機房防水也要謹慎處理,此前曾有數據中心遭遇“水災”引發嚴重后果,接下來就讓我們看看這些前車之鑒:
事故一 土耳其Vodafone數據中心被洪水淹沒
2009年9月9日,土耳其伊斯坦布爾遭遇暴雨并引發了洪水。伊斯坦布爾市Ikitelli地勢較為低洼,瘋狂肆虐的洪水淹沒了Ikitelli區大部分地段,也淹沒了位于該區的Vodafone數據中心。
城市里的很多Vodafone(沃達豐)手機用戶都因該數據中心被淹而無法使用通信服務。上圖展示的是監控攝像頭拍下的畫面:數據中心的一名員工在收集自己的東西撤離數據中心。
事故二 澳大利亞Datacom網絡中心遭遇暴雨
2010年澳洲發生洪災,大暴雨將Datacom主機代管中心的天花板沖毀,使得服務器、存儲和網絡設備都遭損壞。起初該公司否認出現問題,后事故相關材料在網上被曝光。
事故三 颶風桑迪導致美國多家機房受難
2012年10月30日,颶風桑迪登陸美國,受颶風影響造成大面積停電及洪災。位于美國紐約的Datagram公司服務器機房被洪水淹沒,導致《赫芬頓郵報》和Gawker等多家媒體網站宕機。游戲巨頭動視暴雪的數據中心也不幸受到災難影響,導致《使命召喚》和《吉他英雄》系列的網絡服務大規模癱瘓。
美國颶風影響動視暴雪數據庫受損名單
《赫芬頓郵報》表示:“由于颶風桑迪引起的供電中斷,我們的網站正面臨技術故障。”除此之外,所有Gawker Media旗下網站,包括Gizmodo和Lifehacker,也都發生宕機。Gawker在一條Twitter消息中表示:“Gawker正發生臨時宕機,因為我們的服務器遭遇了洪水。將在不久后恢復。”
Datagram在網站上發布通知稱:“在紐約市中心和康涅狄格州,我們正在繼續對抗洪水和光纜故障。Verizon和這一地區的其他運營商也發生了服務器宕機。由于地下室被洪水淹沒,發電機無法提供電力。”
從以上事故可以看到,洪災對數據中心的影響之大毋庸置疑。數據中心在汛期如何提前預防,此外日常運營中面臨哪些水災隱患需要如何應對?
01機房選址最重要
以上遭遇洪災的數據中心,大都是位于地勢低洼、鄰近河道或海邊。地理位置導致這些數據中心在汛期容易被淹。因此數據中心選址時,除考慮經濟環境、政策環境、交通便利、配套設施等因素外,地理條件同樣需要認真考量。需盡量選擇地勢較高、排水良好的位置,避免水淹。
02 制定災備計劃
一家優秀的IDC服務商,應當在發生諸如地震、水災、雷擊、火災、機器故障這些突發事故時,盡可能保證業務不會被中斷。因此數據中心應針對汛期和洪災等緊急狀況,建立完善的數據中心災備計劃,才能有備無患。
災備計劃其實應該包括軟硬件層面。軟件層面包括人為的風險評估、定期審查、軟件系統的相互依存和備份。硬件層面包括硬件冗余、UPS、數據備份、異地災備等等。
03 機房建筑
IDC主機房間地面和空調室應建立100mm高的防水壩,并在防水壩的范圍內做防水處理。在整個防水壩的范圍內安裝漏水報警系統,并與空調上水進水電磁閥聯動,這樣一旦發生漏水則可及時切斷水源。由于機房外采用水消防,故可以在機房氣體保護區分界墻體安裝400mm高的防水壩以隔斷可能產生的水患。同時,除了地面上要注意防水之外,也要注意屋頂的修建,屋頂應有足夠的機械強度以及防水性能,位于機房上方的各種管路也應該妥善安裝、定期檢查,以確保水不會從機房的上方漏下來。
04 虛擬化技術
很多明智的企業都轉向虛擬化,從而大大降低成本。在緊急情況下,這也是快速恢復IT活力的一種方式。利用虛擬化技術,可以將操作系統、應用軟件和數據打包裝入到基于操作系統之上的應用軟件中。封裝的應用程序可以很容易的傳輸到場外——作為數據的一種傳輸方式,并為遠程計算機用戶提供訪問。虛擬化技術可以大幅減少停機時間,將宕機時間從數天減少到數小時。