重復(fù)數(shù)據(jù)刪除技術(shù)明顯是對(duì)磁盤(pán)對(duì)磁盤(pán)備份技術(shù)的挑戰(zhàn)。上千的公司已給其備份環(huán)境實(shí)施了某種形式的重復(fù)數(shù)據(jù)刪除技術(shù),并感到運(yùn)行良好。重復(fù)數(shù)據(jù)刪除技 術(shù)可實(shí)現(xiàn)動(dòng)態(tài)數(shù)據(jù)精簡(jiǎn),使公司實(shí)現(xiàn)在一個(gè)小型磁盤(pán)上保留備份數(shù)據(jù)的多個(gè)連續(xù)復(fù)本。隨著越來(lái)越多的完整備份數(shù)據(jù)被發(fā)送到系統(tǒng),精簡(jiǎn)比例進(jìn)一步優(yōu)化,這些復(fù)本 已可支持磁盤(pán)數(shù)據(jù)恢復(fù)。一個(gè)重復(fù)數(shù)據(jù)刪除系統(tǒng)(通常是一個(gè)設(shè)備或用途導(dǎo)向的存儲(chǔ)陣列)事實(shí)上僅僅是將磁帶庫(kù)擴(kuò)容。其可提供時(shí)長(zhǎng)為幾周的備份數(shù)據(jù)on- site復(fù)本,也有的可延長(zhǎng)到幾個(gè)月,但是更長(zhǎng)時(shí)間的則無(wú)法實(shí)現(xiàn)。
但是在實(shí)現(xiàn)了大部分的數(shù)據(jù)恢復(fù)需求之后,這些舊備份數(shù)據(jù)該用來(lái)做什么呢?
1,將其恢復(fù),轉(zhuǎn)移到冗余文件夾中,再將那些數(shù)據(jù)集轉(zhuǎn)移到正式的檔案文件中嗎?
2,把這些數(shù)據(jù)刪除?因?yàn)檫@些文件已經(jīng)完成了最初的使命——支持幾周或幾個(gè)月的數(shù)據(jù)恢復(fù)。
3,或者是,將這些數(shù)據(jù)保留?
對(duì)于大多數(shù)企業(yè),答案是將這些數(shù)據(jù)保留,采用備份系統(tǒng)來(lái)管理一個(gè)檔案文件。盡管重復(fù)數(shù)據(jù)刪除技術(shù)使這種處理方式很具吸引力,采用備份系統(tǒng)長(zhǎng)期存 儲(chǔ)數(shù)據(jù)存在如下缺點(diǎn):數(shù)據(jù)安全、數(shù)據(jù)恢復(fù)和數(shù)據(jù)銷毀問(wèn)題。
我們真正需要的是一個(gè)關(guān)注歸檔(archive-focused)的存儲(chǔ)系統(tǒng),比如那些來(lái)自Permabit,仍可以壓縮或復(fù)制數(shù)據(jù),但是也可 保留長(zhǎng)期數(shù)據(jù)。備份和重復(fù)刪除的數(shù)據(jù)不提供數(shù)據(jù)加密,其未被鎖定以確保數(shù)據(jù)未經(jīng)更改,數(shù)據(jù)無(wú)法通過(guò)文件或EMAIL的恢復(fù)來(lái)讀取,也無(wú)法在必要時(shí)被銷毀。
加密
必須對(duì)數(shù)據(jù)加以安全防護(hù),這意味著應(yīng)避免不必要的或無(wú)意識(shí)的數(shù)據(jù)存取。這通常意味著必須對(duì)數(shù)據(jù)加密。但重復(fù)數(shù)據(jù)無(wú)法加密,除非存儲(chǔ)器平臺(tái)將其整 合,這是因?yàn)榉謩e加密確立了數(shù)據(jù)的唯一性,而唯一的無(wú)復(fù)本數(shù)據(jù)則不存在需要去除的重復(fù)數(shù)據(jù)。因此永久保存的備份數(shù)據(jù)是不能加密。
鎖定
除了給數(shù)據(jù)提供避免意外刪除或毀壞的保護(hù),還有其他需要關(guān)注的問(wèn)題。因?yàn)橛姓{(diào)整和從規(guī)的需求,當(dāng)前,IT管理人員必須使數(shù)據(jù)可用于法律發(fā)現(xiàn)。這 意味著數(shù)據(jù)可用于支持一個(gè)未了訴訟。但法律也需要確保這一數(shù)據(jù)在用于支持某一未了訴訟(例如監(jiān)管鏈)前未經(jīng)更改。驗(yàn)證監(jiān)管鏈未經(jīng)更改的唯一方法是:將數(shù)據(jù) 轉(zhuǎn)移到一個(gè)WORM數(shù)據(jù)流中。不幸的是,大多數(shù)重復(fù)數(shù)據(jù)備份系統(tǒng)也不提供WORM功能。
恢復(fù)
正如上面提到的,數(shù)據(jù)存儲(chǔ)的新需求是構(gòu)造特定數(shù)據(jù)以響應(yīng)法律發(fā)現(xiàn)行為。存儲(chǔ)系統(tǒng)必須恢復(fù)指定時(shí)段內(nèi)任何有問(wèn)題的文件;否則就要交罰金。其次,歷 史數(shù)據(jù)應(yīng)該可用于業(yè)務(wù)領(lǐng)域(例如趨勢(shì)分析和客戶預(yù)測(cè)程序),實(shí)現(xiàn)業(yè)務(wù)收益最優(yōu)化。同樣,數(shù)據(jù)歸檔之后,以前的一個(gè)項(xiàng)目或許需要重啟或重新研究。關(guān)鍵在于, 如果數(shù)據(jù)值得在最初就保留,則其應(yīng)該是可讀取并便于訪問(wèn)的,而且不是備份軟件的專有格式(在未來(lái)的幾年中會(huì)發(fā)生改變)。
因?yàn)閭浞菹到y(tǒng)的目的是改進(jìn)備份有效性,配置了重復(fù)數(shù)據(jù)刪除技術(shù)的備份系統(tǒng)將所有備份工作存儲(chǔ)在一起,通常是上千或幾十萬(wàn)的文件,同時(shí)每一次恢復(fù) 都必須對(duì)所需文件進(jìn)行重建。這與磁盤(pán)檔案(單一終端用戶訪問(wèn)共享文件和復(fù)制其所需的文件不同)的功能不同。從管理員的角度看,采用備份系統(tǒng)進(jìn)行長(zhǎng)期存儲(chǔ)的 結(jié)果是搜索所需文件需要額外時(shí)間(從冗繁的文件中找出相關(guān)文件)。
現(xiàn)在的組織中,郵件系統(tǒng)事實(shí)上是一個(gè)歸檔系統(tǒng)。在資源不確定的情況下,由于郵件系統(tǒng)是按時(shí)間順序排列,因此被用于進(jìn)行數(shù)據(jù)查詢。一些人甚至采用 郵件來(lái)存儲(chǔ)附件,這樣就不需要將其復(fù)制到共享文件中。當(dāng)考慮到采用一個(gè)有重復(fù)數(shù)據(jù)刪除功能的備份系統(tǒng)來(lái)長(zhǎng)期存儲(chǔ)郵件時(shí),存取和恢復(fù)成為問(wèn)題的關(guān)鍵。
由于郵件系統(tǒng)是一個(gè)大型數(shù)據(jù)庫(kù),因此備份系統(tǒng)威脅著郵件系統(tǒng)(以Exchange為例)。將每一信息都作為獨(dú)立記錄進(jìn)行存儲(chǔ),并將指示器引到現(xiàn) 有的文件附件。其備份過(guò)程類似數(shù)據(jù)庫(kù),但是存儲(chǔ)的數(shù)據(jù)信息量更大。進(jìn)行消息級(jí)(Message-level)存儲(chǔ)需要一個(gè)特殊的模塊,并且還需要進(jìn)行一個(gè) 更慢的備份過(guò)程,以將數(shù)據(jù)準(zhǔn)備好進(jìn)行小顆粒精確恢復(fù)。
實(shí)現(xiàn)數(shù)據(jù)使用最優(yōu)化、減少備份循環(huán)的方法是實(shí)施郵件歸檔解決方案。這一解決方案用于發(fā)送獨(dú)立文件類型檔案中的信息和附件。如果配置了 Permabit Enterprise Archive或類似的檔案級(jí)解決方案,歸檔系統(tǒng)就成為了保存信息的唯一倉(cāng)庫(kù)。這樣不僅效率提高,而且實(shí)現(xiàn)了對(duì)保留數(shù)據(jù)的管理。
銷毀
采用備份系統(tǒng)管理歸檔系統(tǒng)帶來(lái)了另一問(wèn)題。實(shí)現(xiàn)一個(gè)數(shù)據(jù)集的從規(guī)和法律審慎意味著不僅僅要給法庭提供文件,也意味著可訪問(wèn)文件的所有復(fù)本,這樣 他們即可適時(shí)銷毀文件。必須確保需要銷毀的文件已完全銷毀——文件及其復(fù)本均已徹底銷毀。
運(yùn)行重復(fù)數(shù)據(jù)刪除技術(shù)的備份系統(tǒng)會(huì)有很多備份文件復(fù)本。而這些文件或許僅物理存在于一個(gè)位置。但由于文件是初次保存,因此仍在虛擬擴(kuò)展到很多備 份中。眾多的冗余文件、虛擬復(fù)本,這使得重復(fù)數(shù)據(jù)刪除率在最初驚人地高。為了確保所有復(fù)本均已銷毀,每一項(xiàng)備份工作(以及工作涉及的文件)都必須在文件銷 毀之前找到,并全部銷毀。
采用備份結(jié)構(gòu)進(jìn)行長(zhǎng)期存儲(chǔ)出現(xiàn)的另一個(gè)問(wèn)題是隔離。由于備份任務(wù)都是整體寫(xiě)入存儲(chǔ)系統(tǒng),需要?jiǎng)h除的候選文件必須從備份任務(wù)的整體中隔離出來(lái)。這 意味著必須將備份任務(wù)恢復(fù),之后才能刪除文件。一旦文件被刪除,必須將備份任務(wù)另存,以保存剩余文件。這是一個(gè)復(fù)雜的程序,
總結(jié):
備份軟件最初的設(shè)計(jì)目的是進(jìn)行數(shù)據(jù)備份,其次是進(jìn)行數(shù)據(jù)恢復(fù)。備份系統(tǒng)假定數(shù)據(jù)是可存取、可更改的,并且不用于長(zhǎng)期管理這些數(shù)據(jù)集合。當(dāng)重復(fù)數(shù) 據(jù)刪除技術(shù)(數(shù)據(jù)被長(zhǎng)期存儲(chǔ))被用于備份系統(tǒng),就帶來(lái)了一些問(wèn)題。
在這些系統(tǒng)里,當(dāng)數(shù)據(jù)老化移出或越過(guò)了其更改、恢復(fù)的界限,則應(yīng)該在其成為候選刪除文件之前從備份系統(tǒng)中移出。對(duì)于已不屬于備份循環(huán)系統(tǒng)的數(shù) 據(jù),應(yīng)將其存儲(chǔ)在用途導(dǎo)向的歸檔存儲(chǔ)系統(tǒng)(采用軟件來(lái)長(zhǎng)期管理應(yīng)用軟件和多代技術(shù)的數(shù)據(jù)集)。這些系統(tǒng)可提供長(zhǎng)期存儲(chǔ)所需的三種技術(shù):數(shù)據(jù)安全,數(shù)據(jù)存取 和數(shù)據(jù)銷毀。