選擇,實現和整合重復數據刪除的最好方法在很大程度上依賴于如何實施重復數據刪除。這里有一些通用的原則,在你實施重復數據刪除和在環境中部署重復數據刪除軟件時可以借鑒。
步驟一:評估你的數據備份環境
一個公司能實現的重復數據刪除比例主要取決于下面幾個因素:
數據類型
數據變化的比例
重復數據的數量
備份類型(完全,增量或者差異)
數據歸檔或者備份的保存時間
大多數公司面臨的挑戰是如何迅速和有效地搜集數據。來自Aptare公司,Asigra公司,Bocada公司和Kazeon系統公司的非代理數據收集和信息分類工具能協助進行這些評估,同時以代理形式進行部署時無需或者只需最少修改你的服務器。
步驟二:評價你能對備份環境做多大的改變
部署使用軟件代理的 備份軟件需要在每臺服務器或者虛擬機上安裝代理,并在安裝完成后重啟服務器。這種方法與使用重復數據刪除設備相比,通常能獲取更快的備份時間和更高的重復 數據刪除比例。但是,它需花費更多的時間而且對公司備份環境有更大的改動。使用重復數據刪除設備通常無需更改服務器,但是如果重復數據刪除設備被配置為文 件服務器或者虛擬磁帶庫,公司需要調整它的備份軟件。
步驟三:購買一個可擴展的存儲架構
一個公司最先計劃備份的數據量和它最終實際備份的數據量往往不同。公司通常在備份中使用了重復數據刪除后才發現它是如此的有效,然后快速的擴展 它的使用和部署,并超出先前的計劃,所以你需要確定重復數據刪除硬件設備能同時在性能和容量上進行擴展。你也需要確認這些硬件和軟件重復數據刪除產品能提 供全局的重復數據刪除和復制特性,從而最大化整個企業的重復特性。以及能便捷地進行技術更新和容量擴展,并有效地從遠程辦公室恢復去重的數據。
步驟四:檢查備份軟件和硬件設備的集成度
硬件設備和備份軟件的集成度高能加快備份和恢復過程(反之亦然)。例如,ExaGrid System公司,ExaGrid的設備能識別來自CA 公司ARCserve的備份數據流,相比來自它不能識別備份軟件的數據流,它能更好地去除重復數據。企業備份軟件也開始試圖更好地管理磁盤存儲系統,從而數據可以被放置在不同的磁盤存儲系統,不同的磁盤層次中。這樣短期來看數據能更快的備份和恢復,長期來看數據能更廉價的保存。
步驟五:運行第一次備份
使用基于代理的重復數據刪除軟件,可能是一個痛苦的經歷。它會在服務器上創建大量的開銷,比平時花費更長的時間來完成,因為它需要對所有數據進 行重復數據刪除。但是,一旦第一次備份完成,后續它只需要對變化的數據進行備份和重復數據刪除。使用硬件設備,這個體檢正好相反。第一次備份會很快,但隨 著時間的推移備份會變慢,這取決于硬件設備是如何擴展,以及一個公司所經歷的數據變化的多少和數據增長的多少