在愛數(shù)的一體化容災方案中,“數(shù)據(jù)不丟失、應用不間斷”是方案的核心價值所在。對于應用容災而言,還有一個重要的因素,就是接管后容災服務器所能達到的效果。如果說“數(shù)據(jù)不丟失”和“應用不間斷”對應的分別是 RPO(恢復點目標) 和 RTO(恢復時間目標),那么對于接管效果而言,一直沒有一個很好的衡量標準。為了更好地說明接管效果和容災方案的關系,我們引入一個新的指標:DRO(容災接管指標),DRO以百分比為單位,表示容災服務器與生產(chǎn)服務器的服務可用性比例。也就是容災服務器在接管后,服務器能力達到原生產(chǎn)機的百分比。在以往的方案選擇中,這個指標并沒有得到人們的關注,那么這個指標的選擇對方案而言有什么意義呢?
一、 明確 DRO,提升 ROI
我們先來分析單個的應用系統(tǒng),應用服務器的服務能力主要取決于下面的幾個方面:CPU 的計算能力、內(nèi)存大小、磁盤 IO、網(wǎng)絡并發(fā)處理能力、數(shù)據(jù)量等。在應用環(huán)境中,我們一般會根據(jù)業(yè)務處理能力的峰值來確定生產(chǎn)機的配置,以確保應用系統(tǒng)持續(xù)穩(wěn)定地對外提供服務。那么在搭建容災環(huán)境時,我們是不是也需要按照同樣的標準來安配置災服務器呢?我們知道,傳統(tǒng)的應用容災方案基本上都要求容災服務器和生產(chǎn)服務器在性能上的盡可能地對等。但實際上,容災服務器在 90% 以上的情況下都處于待命狀態(tài),如果配置和生產(chǎn)服務器對等,不但硬件本身的效能無法很好地發(fā)揮出來,還要為其考慮諸如網(wǎng)絡環(huán)境、服務器運行所需的電費、降溫費等維護費用的額外成本。一旦發(fā)生災難,生成系統(tǒng)會在盡可能短的時間內(nèi)恢復,容災服務器的計算資源也無法發(fā)揮其最大效用。因此,在容災方案設計的時候,如果考慮到投資回報率(ROI)的問題,DRO 就變得非常重要。
二、 用科學的方法制定合理的 DRO
愛數(shù)的虛擬化容災可以說是對 DRO 的一次最佳實踐,我們分析了很多實際的應用環(huán)境,發(fā)現(xiàn)多數(shù)的應用服務器只要采用虛擬化環(huán)境搭建容災服務器就已經(jīng)能夠滿足日常的接管需求了,無需搭建的與生產(chǎn)服務器相當?shù)姆掌鳌_@樣一來,用戶只要使用一臺設備就能滿足從數(shù)據(jù)保護到應用容災的需求。當然,我們知道,由于虛擬化技術本身存在的局限性和虛擬機平臺的性能問題,對于一些高網(wǎng)絡并發(fā)、高 CPU 負載、高內(nèi)存使用率的關鍵應用,虛擬化環(huán)境的服務器能力就捉襟見肘了。那么,究竟怎樣才能制定出科學、合理的 DRO 指標呢?在設計方案的時候,接管效果永遠都是第一位的,不能為了降低成本而犧牲真正重要接管效果。愛數(shù)有一套完整的體系和流程來為用戶的每一個系統(tǒng)來打造合理的 DRO 指標。所以在方案設計之初,我們的專業(yè)技術人員首先對會對生產(chǎn)環(huán)境的對應用系統(tǒng)的數(shù)據(jù)量、并發(fā)量、系統(tǒng)負載等參數(shù)進行持續(xù)地、詳細地采集,最后經(jīng)過專業(yè)分析模型,得出系統(tǒng)實際的性能參數(shù),最后再拿這些參數(shù)與用戶進行溝通,根據(jù)實際的需求,最終確定一個即不影響接管效果,又能節(jié)約成本的 DRO 指標。
三、 最優(yōu)DRO組合,一體化容災顯神威
隨著 IT 建設的深入,政府機關、企事業(yè)單位等各種機構的從 IT 基礎設施建設階段步入了 IT 有效性建設階段。這個階段中,各機構對于應用服務器和應用所搭載的數(shù)據(jù)的依賴性逐步增強,同時越來越多的應用系統(tǒng)進入我們的機房當中,所以在實際的環(huán)境中,要進行應用容災的服務器往往不止一個,而且它們的關鍵程度、容災要求也會有所不同,如果都做生產(chǎn)服務器和容災服務器能力對等的容災(如雙擊熱備、存儲鏡像等),成本上的壓力可見一斑,無形當中增加了災難發(fā)生時的機會成本。正如前兩期我們講到的,愛數(shù)的一體化容災,除了為用戶提供了多種 RTO、PRO 的選擇之外,還提供了多種 DRO 方案的組合,為用戶找到了一種平衡初始成本與容災效果的有效方法。首先,對于一些
關鍵的應用服務器,由于經(jīng)常處于高負載的運行狀態(tài),我們推薦 DRO在 90% 以上的,與生產(chǎn)服務器對等的物理容災服務器,這樣可以保證最好的容災效果;其次,對相對比較次要或者負載較低的應用系統(tǒng),推薦 DRO在 70% 左右的低配置物理服務器;再次,根據(jù)事先收集的信息,DRO 在50% 以下的應用系統(tǒng),我們推薦虛擬化容災服務器(愛數(shù)備份存儲柜的虛擬化容災方案或其他的虛擬化平臺)。最后,如果用戶環(huán)境中已經(jīng)有一些老舊的或者閑置的服務器,我們也會根據(jù)設計的測量結果,將這些設備直接作為某些系統(tǒng)的容災服務器,有效地利用了用戶的遺留資產(chǎn),保護原始投資。
一個好的容災方案的確定,需要根據(jù)用戶的環(huán)境和實際的需求進行詳盡地考察和分析,對于每一個應用系統(tǒng)而言,除了要根據(jù) RTO/RPO 指標選擇合理的容災方式之外,還要幫用戶找到容災效果和投資成本之間的平衡點——DRO 指標,根據(jù)這三個指標完成各個系統(tǒng)容災方案設計之后,再將所有這些方案集成起來,形成有機地統(tǒng)一整體。這也正是愛數(shù)一體化容災的精髓所在。