重復數據刪除的效率往往用刪除率或者減少率來表示,它代表受保護的數據的容量和實際存儲的物理容量的比率。10:1的比率表示相對于實際占用的物理空間,重復數據刪除并備份保護了10倍的數據。而20:1則表示保護了20倍的數據。考慮到數據增長、保留期限、并假設刪除率為20:1,2TB的存儲能夠至多保護40TB的數據。
這些重復數據刪除率是怎么確定的呢?這個比率是把要備份的數據的容量(即要進行重復數據檢查的數據)除以實際使用的容量(即刪除重復數據之后的數據)得到的。
現實的刪除率是多少?
但是現實中的刪除率是多少呢?ESG研究發現,接近33%的人說他們發現容量需求減少率低于10倍;48%說減少在10倍到20倍之間;18%說他們的降低率為21倍到100倍以上。一些因素會影響重復數據刪除率,包括:
數據備份策略:全備份(相對于增量備份和差異備份)的頻率越高,重復數據刪除的潛力也就越大,因為每天的數據有大量的重復。
數據保存期設置:數據在磁盤上保存的時間越長,重復數據刪除引擎發現重復數據的可能性也越大。
數據類型:一些數據天生比較容易出現重復。如果網絡里存在大量的Windows服務器,或者VMware虛擬機,就有希望得到更高的重復數據刪除率。
變化速率:數據變化的速率越低,發現重復的機會也就越高。
重復數據刪除的范圍:查看和比較的范圍越大,發現重復的可能性也就越大,本地重復數據刪除意味著只在本地數據源中尋找重復數據,而全局重復數據 刪除檢查多個源來去掉重復。例如,數據每天變化1%甚至更少,每天進行全備份并保留30個備份副本,那么每個備份的99%數據都是重復的,30天之后,重 復數據刪除比率可以達到30:1。另外假如每周備份,并保留一個月,刪除率只有4:1。
重復數據刪除率可能會令人很困惑,有些廠家只標明節省的百分比而不是比率。如果一個廠家聲稱50%的容量節省,那就等于2:1的重復數據刪除 率。而10:1的比率等同于90%的節省。這就意味著備份10TB的數據只需要1TB的實際物理空間。而20:1的比率能提高的節省百分比僅有5%(達到 95%)。
評估重復數據刪除產品
評估重復數據刪除產品的時候,重要的是要在你自己的環境中,使用你自己的數據進行測試,經過多個備份周期來觀察產品對你的備份/恢復環境的影 響。選擇產品的標準不應該僅限于考察刪除比率。ESG的調查(ESG報告《數據保護市場趨勢》2008年1月)顯示,不出所料,重復數據刪除產品的價格是 被提到最多的指標(盡管重復數據刪除所節省的存儲容量往往能抵消實施的開銷)。而且,調查數據顯示實施和使用的簡便性,以及備份/恢復的性能也是重要的考 量——超過實現的技術,比如重復數據刪除率。