導(dǎo)讀:隨著企業(yè)對數(shù)據(jù)安全的重視程度加強(qiáng),適合企業(yè)不同特性的從存儲備份方案也應(yīng)運(yùn)而生。重復(fù)刪除技術(shù)就是其中的一種。在這篇中就跟大家談?wù)劊裁礃拥钠髽I(yè)適合采用重復(fù)數(shù)據(jù)刪除技術(shù)。以便各個企業(yè)在選擇采用重復(fù)數(shù)據(jù)刪除技術(shù)時不盲目的去采用。
一、數(shù)據(jù)量大、且冗余大的企業(yè)適合使用重復(fù)數(shù)據(jù)刪除技術(shù)。
在對企業(yè)的信息化數(shù)據(jù)進(jìn)行存儲與備份時,超大的容量一直是項(xiàng)目管理員比較頭疼的問題。有不少企業(yè),可能一年就需要升級一下存儲設(shè)備的容量。在這種情況下,采用重復(fù)數(shù)據(jù)刪除技術(shù)能夠起到一定的效果。
通常情況下,當(dāng)企業(yè)的數(shù)據(jù)量越大,備份數(shù)據(jù)中所包含的冗余部分也就越多。雖然說增量的數(shù)據(jù)備份策略只是備份哪些有變化的文件,可以在一定程度上提高備份的效率、縮小磁盤空間。但是這個贈量備份策略通常也會包含比較多的冗余的數(shù)據(jù)塊。為此對節(jié)省磁盤空間的效果并不是很理想。
此時企業(yè)可以嘗試使用重復(fù)數(shù)據(jù)刪除技術(shù)來消除冗余的數(shù)據(jù)塊。通常情況下重復(fù)數(shù)據(jù)刪除技術(shù)的核心優(yōu)勢就是保存唯一一份備份數(shù)據(jù)的數(shù)據(jù)段。簡單的說,當(dāng)數(shù)據(jù)寫入到備份設(shè)備時,數(shù)據(jù)會被分割成可變長度的數(shù)據(jù)段。重復(fù)數(shù)據(jù)刪除解決方案會實(shí)時的將該數(shù)據(jù)段與已經(jīng)存儲的各個數(shù)據(jù)段進(jìn)行對比。如此的話,就可以保證每個唯一的數(shù)據(jù)段在存儲設(shè)備上只保留一份。因?yàn)橹貜?fù)數(shù)據(jù)刪出技術(shù)可以在文件內(nèi)或者文件間,甚至數(shù)據(jù)塊內(nèi)發(fā)現(xiàn)重復(fù)的文件和數(shù)據(jù)段,所以實(shí)際所需要的存儲空間也就比所需要保存的數(shù)據(jù)量低一個數(shù)據(jù)級別。容量優(yōu)化效率的高低主要取決于所采采用的算法。
為此如果企業(yè)想大幅度的降低其存儲容量,并且企業(yè)的數(shù)據(jù)存在比較大的冗余(如2011年的報(bào)表是在2010年的基礎(chǔ)上延續(xù)下去的),此時就可以使用重復(fù)數(shù)據(jù)刪出技術(shù)來解決存儲容量過大的問題。
不過這里需要提醒的是,其數(shù)據(jù)壓縮的效果直接跟其所采用的算法相關(guān)。現(xiàn)在針對重復(fù)數(shù)據(jù)刪除解決方案,有不少對應(yīng)的算法。在選型時,需要評估各種算法的優(yōu)劣。甚至可以直接測試一下,看看其容量優(yōu)化效果到底有多大。然后再根據(jù)實(shí)際情況來選型。
二、數(shù)據(jù)恢復(fù)時要客戶增量備份所帶來的困擾。
增量備份只備份有變化的文件或者數(shù)據(jù)。其可以在一定程度上降低備份的開銷、提高備份的效率。但是其也存在一些負(fù)面的效應(yīng)。如以O(shè)racle數(shù)據(jù)庫為例,有時候全備份方式的備份恢復(fù)執(zhí)行起來要比增量備份快。這主要是因?yàn)樵谠隽總浞葸^程中經(jīng)常要對整個數(shù)據(jù)庫進(jìn)行掃描,以便發(fā)現(xiàn)改變的數(shù)據(jù)塊。而且增量方式在數(shù)據(jù)恢復(fù)時還需要一個完全備份和多個增量備份文件。此時就會增加數(shù)據(jù)恢復(fù)的復(fù)雜性、降低數(shù)據(jù)恢復(fù)的速度。如果企業(yè)的數(shù)據(jù)管理員,正在為增量備份所帶來的這些問題所困擾,那么可以試著使用以下重復(fù)數(shù)據(jù)刪出技術(shù),看看能否幫你解決問題。
筆者還是以O(shè)racle數(shù)據(jù)庫為例。如果現(xiàn)在我們利用重復(fù)數(shù)據(jù)刪除技術(shù)對Oracle數(shù)據(jù)庫文件進(jìn)行備份,會有什么樣的改善呢?此時數(shù)據(jù)庫文件備份所需要的時間是由遍歷數(shù)據(jù)塊的時間和數(shù)據(jù)時間所構(gòu)成的。對于增量備份來說,數(shù)據(jù)塊的遍歷是對數(shù)據(jù)庫進(jìn)行全表掃描,以便發(fā)現(xiàn)改變的數(shù)據(jù)塊。這往往需要比較長的時間。而且其所需要的時間與數(shù)據(jù)庫的容量成正比。而以磁盤為介質(zhì)的備份設(shè)備具有高性能和在線重復(fù)數(shù)據(jù)刪除的功能。為此在對Oracle數(shù)據(jù)庫進(jìn)行多個完全備份時,只用了很少的存儲空間(因?yàn)橄巳哂嗟臄?shù)據(jù)塊)。此時企業(yè)進(jìn)行完全備份和數(shù)據(jù)塊級的增量備份所占用的存儲空間基本相同。而與普通的備份設(shè)備相比,使用重復(fù)數(shù)據(jù)刪除技術(shù)的設(shè)備做完全備份時,可以節(jié)省95%以上的存儲空間消耗。在某些場合中,其磁盤節(jié)省的效率比增量備份還要高。
簡單的說,從數(shù)據(jù)存儲空間、備份效率等綜合效果來看,重復(fù)刪除技術(shù)+完全備份〉增量備份。如果企業(yè)采用了重復(fù)刪除技術(shù)的存儲設(shè)備,那么就不需要再對數(shù)據(jù)庫進(jìn)新增量備份,而直接采用完全備份即可。此時即不用擔(dān)心磁盤空間的問題,也不用再顧慮采用增量備份時所帶來的負(fù)面作用。
三、對數(shù)據(jù)進(jìn)行異地備份。
在數(shù)據(jù)安全要求比較高的企業(yè),光本地備份還不行,往往還需要對數(shù)據(jù)進(jìn)行異地備份。如現(xiàn)在的電子商務(wù)網(wǎng)站,其可能在北京、上海各有分支機(jī)構(gòu)。為了數(shù)據(jù)的安全,不同分支機(jī)構(gòu)的數(shù)據(jù)要進(jìn)行相互之間的異地備份,以提高數(shù)據(jù)的安全性。在進(jìn)行異地備份時,數(shù)據(jù)管理人員最關(guān)心的莫過于數(shù)據(jù)的容量。當(dāng)數(shù)據(jù)的容量比較大時,不僅需要比較多的備份空間,而且在異地備份時對于帶寬的要求也比較高。正是由于這種原因,異地備份需要企業(yè)比較高的成本。這也限制了異地備份策略在企業(yè)中的應(yīng)用。
數(shù)據(jù)重復(fù)刪除技術(shù)很好的解決了這個問題。因?yàn)椴捎昧酥貜?fù)數(shù)據(jù)刪除技術(shù)之后,其備份文件的容量已經(jīng)非常的小。此時即時每幾個小時進(jìn)行一次完全備份也只需要少量的磁盤容量。然后將這個備份文件通過互聯(lián)網(wǎng)進(jìn)行傳輸時,還可以大大的節(jié)省網(wǎng)絡(luò)帶寬。從而可以幫助企業(yè)降低遠(yuǎn)程備份的成本。
在遠(yuǎn)程數(shù)據(jù)同步作業(yè)中,重復(fù)數(shù)據(jù)刪除技術(shù)也非常的有用。如筆者有一家客戶,他們就將備份數(shù)據(jù)的在線復(fù)制當(dāng)成異地磁帶存儲的替代解決方案。簡單的說,就是其服務(wù)器在北京,然后在上海在設(shè)置一臺備份服務(wù)器。然A服務(wù)器的數(shù)據(jù)與上海備份服務(wù)器的數(shù)據(jù)進(jìn)行同步。正常情況下使用北京的A服務(wù)器。等到A服務(wù)器因?yàn)槟撤N原因出現(xiàn)故障時,則立即利用上海的服務(wù)器代替。此時由于采用了重復(fù)數(shù)據(jù)刪除技術(shù),大大縮小了備份文件的容量,加快了網(wǎng)絡(luò)的傳輸能力。
四、要與現(xiàn)有設(shè)備與系統(tǒng)進(jìn)行有效的整合。
不少企業(yè)在采用新的信息化應(yīng)用時,需要考慮如何與原有的信息化設(shè)備與系統(tǒng)進(jìn)行有效的整合,即要考慮系統(tǒng)與設(shè)備之間的兼容性問題。在采用重復(fù)數(shù)據(jù)刪除技術(shù)時也存在這種情況。不過不用擔(dān)心,重復(fù)數(shù)據(jù)刪除方案提供了不同的解決方案,以提高這個方案與企業(yè)現(xiàn)有環(huán)境的兼容性。
如重復(fù)數(shù)據(jù)刪除解決方案現(xiàn)在有兩種解決思路:基于硬件的解決方案和基于軟件的解決方案。如果企業(yè)現(xiàn)在還沒有專業(yè)的存儲設(shè)備,那么就可以采用基于硬建的解決方案。簡單的說,就是軟件與硬件一起購買。如果企業(yè)已經(jīng)有了存儲設(shè)備,此時想節(jié)省磁盤空間的話,那么就可以購買軟件的解決方案。現(xiàn)在不少的提供商已經(jīng)江重復(fù)數(shù)據(jù)解決方案可以以軟件包的形式提哦能夠給客戶。
原文鏈接:http://database.51cto.com/art/201103/248514.htm