在愛數(shù)的一體化容災(zāi)方案中,“數(shù)據(jù)不丟失、應(yīng)用不間斷”是方案的核心價值所在。對于應(yīng)用容災(zāi)而言,還有一個重要的因素,就是接管后容災(zāi)服務(wù)器所能達(dá)到的效果。如果說“數(shù)據(jù)不丟失”和“應(yīng)用不間斷”對應(yīng)的分別是 RPO(恢復(fù)點目標(biāo)) 和 RTO(恢復(fù)時間目標(biāo)),那么對于接管效果而言,一直沒有一個很好的衡量標(biāo)準(zhǔn)。為了更好地說明接管效果和容災(zāi)方案的關(guān)系,我們引入一個新的指標(biāo):DRO(容災(zāi)接管指標(biāo)),DRO以百分比為單位,表示容災(zāi)服務(wù)器與生產(chǎn)服務(wù)器的服務(wù)可用性比例。也就是容災(zāi)服務(wù)器在接管后,服務(wù)器能力達(dá)到原生產(chǎn)機的百分比。在以往的方案選擇中,這個指標(biāo)并沒有得到人們的關(guān)注,那么這個指標(biāo)的選擇對方案而言有什么意義呢?
一、 明確 DRO,提升 ROI
我們先來分析單個的應(yīng)用系統(tǒng),應(yīng)用服務(wù)器的服務(wù)能力主要取決于下面的幾個方面:CPU 的計算能力、內(nèi)存大小、磁盤 IO、網(wǎng)絡(luò)并發(fā)處理能力、數(shù)據(jù)量等。在應(yīng)用環(huán)境中,我們一般會根據(jù)業(yè)務(wù)處理能力的峰值來確定生產(chǎn)機的配置,以確保應(yīng)用系統(tǒng)持續(xù)穩(wěn)定地對外提供服務(wù)。那么在搭建容災(zāi)環(huán)境時,我們是不是也需要按照同樣的標(biāo)準(zhǔn)來安配置災(zāi)服務(wù)器呢?我們知道,傳統(tǒng)的應(yīng)用容災(zāi)方案基本上都要求容災(zāi)服務(wù)器和生產(chǎn)服務(wù)器在性能上的盡可能地對等。但實際上,容災(zāi)服務(wù)器在 90% 以上的情況下都處于待命狀態(tài),如果配置和生產(chǎn)服務(wù)器對等,不但硬件本身的效能無法很好地發(fā)揮出來,還要為其考慮諸如網(wǎng)絡(luò)環(huán)境、服務(wù)器運行所需的電費、降溫費等維護(hù)費用的額外成本。一旦發(fā)生災(zāi)難,生成系統(tǒng)會在盡可能短的時間內(nèi)恢復(fù),容災(zāi)服務(wù)器的計算資源也無法發(fā)揮其最大效用。因此,在容災(zāi)方案設(shè)計的時候,如果考慮到投資回報率(ROI)的問題,DRO 就變得非常重要。
二、 用科學(xué)的方法制定合理的 DRO
愛數(shù)的虛擬化容災(zāi)可以說是對 DRO 的一次最佳實踐,我們分析了很多實際的應(yīng)用環(huán)境,發(fā)現(xiàn)多數(shù)的應(yīng)用服務(wù)器只要采用虛擬化環(huán)境搭建容災(zāi)服務(wù)器就已經(jīng)能夠滿足日常的接管需求了,無需搭建的與生產(chǎn)服務(wù)器相當(dāng)?shù)姆?wù)器。這樣一來,用戶只要使用一臺設(shè)備就能滿足從數(shù)據(jù)保護(hù)到應(yīng)用容災(zāi)的需求。當(dāng)然,我們知道,由于虛擬化技術(shù)本身存在的局限性和虛擬機平臺的性能問題,對于一些高網(wǎng)絡(luò)并發(fā)、高 CPU 負(fù)載、高內(nèi)存使用率的關(guān)鍵應(yīng)用,虛擬化環(huán)境的服務(wù)器能力就捉襟見肘了。那么,究竟怎樣才能制定出科學(xué)、合理的 DRO 指標(biāo)呢?在設(shè)計方案的時候,接管效果永遠(yuǎn)都是第一位的,不能為了降低成本而犧牲真正重要接管效果。愛數(shù)有一套完整的體系和流程來為用戶的每一個系統(tǒng)來打造合理的 DRO 指標(biāo)。所以在方案設(shè)計之初,我們的專業(yè)技術(shù)人員首先對會對生產(chǎn)環(huán)境的對應(yīng)用系統(tǒng)的數(shù)據(jù)量、并發(fā)量、系統(tǒng)負(fù)載等參數(shù)進(jìn)行持續(xù)地、詳細(xì)地采集,最后經(jīng)過專業(yè)分析模型,得出系統(tǒng)實際的性能參數(shù),最后再拿這些參數(shù)與用戶進(jìn)行溝通,根據(jù)實際的需求,最終確定一個即不影響接管效果,又能節(jié)約成本的 DRO 指標(biāo)。
三、 最優(yōu)DRO組合,一體化容災(zāi)顯神威
隨著 IT 建設(shè)的深入,政府機關(guān)、企事業(yè)單位等各種機構(gòu)的從 IT 基礎(chǔ)設(shè)施建設(shè)階段步入了 IT 有效性建設(shè)階段。這個階段中,各機構(gòu)對于應(yīng)用服務(wù)器和應(yīng)用所搭載的數(shù)據(jù)的依賴性逐步增強,同時越來越多的應(yīng)用系統(tǒng)進(jìn)入我們的機房當(dāng)中,所以在實際的環(huán)境中,要進(jìn)行應(yīng)用容災(zāi)的服務(wù)器往往不止一個,而且它們的關(guān)鍵程度、容災(zāi)要求也會有所不同,如果都做生產(chǎn)服務(wù)器和容災(zāi)服務(wù)器能力對等的容災(zāi)(如雙擊熱備、存儲鏡像等),成本上的壓力可見一斑,無形當(dāng)中增加了災(zāi)難發(fā)生時的機會成本。正如前兩期我們講到的,愛數(shù)的一體化容災(zāi),除了為用戶提供了多種 RTO、PRO 的選擇之外,還提供了多種 DRO 方案的組合,為用戶找到了一種平衡初始成本與容災(zāi)效果的有效方法。首先,對于一些
關(guān)鍵的應(yīng)用服務(wù)器,由于經(jīng)常處于高負(fù)載的運行狀態(tài),我們推薦 DRO在 90% 以上的,與生產(chǎn)服務(wù)器對等的物理容災(zāi)服務(wù)器,這樣可以保證最好的容災(zāi)效果;其次,對相對比較次要或者負(fù)載較低的應(yīng)用系統(tǒng),推薦 DRO在 70% 左右的低配置物理服務(wù)器;再次,根據(jù)事先收集的信息,DRO 在50% 以下的應(yīng)用系統(tǒng),我們推薦虛擬化容災(zāi)服務(wù)器(愛數(shù)備份存儲柜的虛擬化容災(zāi)方案或其他的虛擬化平臺)。最后,如果用戶環(huán)境中已經(jīng)有一些老舊的或者閑置的服務(wù)器,我們也會根據(jù)設(shè)計的測量結(jié)果,將這些設(shè)備直接作為某些系統(tǒng)的容災(zāi)服務(wù)器,有效地利用了用戶的遺留資產(chǎn),保護(hù)原始投資。
一個好的容災(zāi)方案的確定,需要根據(jù)用戶的環(huán)境和實際的需求進(jìn)行詳盡地考察和分析,對于每一個應(yīng)用系統(tǒng)而言,除了要根據(jù) RTO/RPO 指標(biāo)選擇合理的容災(zāi)方式之外,還要幫用戶找到容災(zāi)效果和投資成本之間的平衡點——DRO 指標(biāo),根據(jù)這三個指標(biāo)完成各個系統(tǒng)容災(zāi)方案設(shè)計之后,再將所有這些方案集成起來,形成有機地統(tǒng)一整體。這也正是愛數(shù)一體化容災(zāi)的精髓所在。