很長時間以來,虛擬化對于數據中心(內部和云端)是最好的方式。虛擬化的前景非常遠大,現在,這些前景所帶來的許多承諾已經觸手可得。但是,只有當為虛擬化的獨特要求而進行優化的備份方案出現在市場上時,更為廣泛的虛擬化部署才會出現。
服務器虛擬化已經跨過了那個眾所周知的門檻。不久之前,在部署新的服務器時,我們還必須去論證為什么要 使用虛擬方式而不是物理方式。現在,相反的情況已成為一個事實。對于許多機構的 IT 經理,“虛擬優先”的策略已成為一項法令,部署新的服務器時必須使用虛擬方式,除非特別要求使用物理服務器。
雖然虛擬化存在各種各樣的優點,但也帶來了許多新的存儲和數據管理問題。其中一個主要的問題是備份。物理服務器領域的備份技術也可用于虛擬機環境,但效果并不是很好。
原因何在?虛擬機備份代表著四個新的技術因素:
1. 由于服務器的使用在增加,所用的相應資源在減少。備份應用是資源消耗大戶,它們會消耗大量服務器的輸入/輸出、CPU 和內存資源。通常,我們希望這些備份應用能夠在備份范圍內相對較快地完成工作。在物理服務器階段,這些應用可能占用了 10% 的服務器資源,這不會成為一個問題。備份可以利用那些閑置的資源,不會對正在進行備份的應用程序造成嚴重的影響。
對于虛擬化,服務器的使用方式更近于容量。事實上,這是虛擬化的基本目標。虛擬化是很好的方式,但是這種服務器不再具有大量的閑置資源可供備份使用。現在,備份工作及其備份的應用程序更加消耗服務器和存儲硬件資源。
這還不是最糟糕的。在現在的服務器運行的應用程序不止一個而是多個,甚至是很多個,所以備份一個虛擬服務器所帶來的負面影響不再限于某個虛擬機,而是對所有共享同一硬件的虛擬機都會造成影響。
2. 現有的備份客戶端運行在 guest 虛擬機內部,并且除非采取特定的預防措施,這些事先預定的備份將是重疊運行的。由于服務器資源已經很少的問題,服務器管理員必須格外謹慎。如果在服務器運 行一個備份已經很糟糕,運行多個備份對于應用程序響應會是一場災難。所以,相對于物理機器,虛擬機備份計劃必須更為仔細地進行制定。
額外的備份負載這一問題被所涉及的多個 guest 虛擬機放大,另外,虛擬機負載的動態本質也使復雜性進一步加劇,虛擬機的實時遷移(有時并非由服務器管理員啟動)也會把手工備份計劃搞得一團糟。
3. 針對這些問題的解決方案是在超級管理員等級上運行協作備份,最好是主機外(off-host)的方式。資源爭奪發生在虛擬化層,運行在這一層的協作備份可最小化應用占用資源的問題。在超級管理員等級上的備份操作,如果進行準確地部署,可以成為最有效地利用資源。
最理想的情況是在獨立而又潛在專用的硬件上運行備份,這樣備份服務器的操作就不會對活動的應用程序造成影響。
4. 現有的架構,比如微軟的 VSS,是為運行“熱備份”(hot backup)而設計。這樣的架構不具備足夠的伸縮性,能夠從 guest 虛擬機內部影射虛擬盤,正如在超級管理員曾所見的那樣。在采用服務器虛擬化技術多年以前,微軟的卷影射服務(Volume Shadow Service)已經出現,并被廣泛使用。但是 VSS 是在卷上運行而不是在虛擬機上。在過去,硬盤卷和應用程序之間是靜態的 1:1 關系,這種情況下不會出現問題。但是,在虛擬服務器上,最好的方式是在單一卷上為多個虛擬機設置虛擬硬盤(在 VMware 上,是 VMDK;在 Hyper-V,是 VHD)。
激活的VSS 為整個卷創建一個影像副本,即使需要的只是備份單一虛擬機。在超級管理員等級運行當前的 VSS 架構并非最理想的情況,但是最接近。這一“解決方案”在 guest 虛擬機等級上運行備份,但這會導致上述的問題 1 和問題 2。
面對這些問題,正確的虛擬機備份方案應是什么樣的?虛擬化備份行業需要提供:
· 能夠為附屬于 guest 虛擬機的虛擬硬盤創建快速、空間高效的高性能快照。它應能夠為虛擬機關聯的所有虛擬硬盤同步建立快照,這樣就可以創建崩潰狀態一致的(crash- consistent)的備份鏡像。根據客戶的備份計劃和方案,應可以按照組(group)的管理虛擬硬盤。
· 利用可感知應用程序的備份方案,對這些快照的創建和管理進行整合。崩潰狀態一致很好,不過應用程序一致更好。
· 能夠訪問服務器上的快照而不是運行活動虛擬機的快照。對于將備份負載及其附帶的資源消耗從活動的產品應用程序中分開,這是至關重要的。正如前文所述,在虛擬服務器環境中,主機外備份是一個尤為緊迫的需求。
· 長期在線可用的快照。理想的情況是能夠擁有長期在線的快照。大多數快照具有的空間高效功能,這意味著基鏡像(base image)及其子快照中的數據塊僅保持一次。這樣就可以廉價地長期保持許多快照,使得從之前快照中快速恢復數據變得簡便。
遺憾的是,很多快照產品的設計是短期保持的。快照在線時間越長,I/O 性能降低的也越多,不僅是對于快照,也包括它們的基鏡像,這會使得創建保持在線快照變得不切實際。
· 有關增加備份的信息。虛擬機鏡像文件很大,通常數十個 GB。如果備份軟件知道上次備份之后鏡像的某些部分沒有變化,那么它的效率就可以變得更高。虛擬硬盤摘要層應為備份提供鏡像和對象等級的更改數據列表。
· 對活動虛擬機性能沒有過度的性能處罰。這是一個很明顯的要求,現金的處理方式對性能造成了很嚴重的影響。
· 獨立于存儲硬件。對于 IT 機構,所有權的限制從來都不是好事情。利用正確的軟件設計,虛擬機備份方案沒有理由將所有權限制于特定存儲子系統中。
很長時間以來,虛擬化對于數據中心(內部和云端)是最好的方式。虛擬化的前景非常遠大。現在,這些前景所帶來的許多承諾已經觸手可得。但是,只有當為虛擬化的獨特要求而進行優化的備份方案出現在市場上時,更為廣泛的虛擬化部署才會出現。