什么是歸檔?
什么時候你應(yīng)該應(yīng)用它?什么是實施的最好方法?這些都是CIO現(xiàn)在面臨的問題, 這些就是這篇文章要研究的問題。
什么是歸檔?
數(shù)據(jù)歸檔就是在二級存儲設(shè)備上存儲 非活動數(shù)據(jù),如在線磁盤。這些數(shù)據(jù)是在將來可能需要的信息,因此不能刪除他們。可能有合法的原因來保存這些數(shù)據(jù),也可能是機構(gòu)需要,如市場研究或正當?shù)睦?由也許就像刪除它會讓人很不舒服。不管怎樣,最后的決定是存儲而不是將其刪除。
保存數(shù)據(jù)的問題或者是由于合法原因,或者是“以防萬 一”,也就是它必須保存在某個地方。如果沒有一個有效的歸檔策略,這就意味著數(shù)據(jù)會和其他東西一樣被保存在同樣的地方——主存儲。
對于 昂貴的資源來說,在主存儲上存儲非活動數(shù)據(jù)是一個巨大的浪費。在主存儲之間每GBdelta的價錢至少在5到10美元之間甚至最貴形式的歸檔存儲,那是非 常大的。另外,主存儲旨在快速傳輸過度過程數(shù)據(jù)。它基本上不能支持數(shù)據(jù)恢復(fù)法規(guī)或在它被寫入存儲后的幾年,不能證實這一系列數(shù)據(jù)的完整性。這些都是歸檔存 儲的重要要求。
歸檔目標
歸檔第一步是為存儲庫選擇存儲平臺。這一元素必須是第一 步,因為被選擇的平臺決定策略如何實施。
傳統(tǒng)的磁帶被認為是理想的歸檔媒介。因為它很便宜也容易存儲、傳輸。磁帶的問題是它要求特殊的 軟件訪問。它不像在網(wǎng)絡(luò)上復(fù)制到另一個驅(qū)動上。對于數(shù)據(jù)檢索和虛擬無數(shù)據(jù)驗證能力也是有限的。
隨著磁盤的價錢逐漸下降,價格便宜的 NAS和SATA驅(qū)動技術(shù)也開始浮出水面。他們比磁帶更容易訪問,但它同樣也有其他挑戰(zhàn),主要是成本和擴展能力。
磁盤和磁帶的缺點導(dǎo)致 了基于磁盤的歸檔系統(tǒng)的開發(fā),像這些來源于Permabit技術(shù)。這些系統(tǒng)提供基于NAS存儲的訪問,成本更高效以及磁帶的可擴展性同時包括檢索和驗證功 能。
歸檔策略
一旦歸檔存儲庫選好后,這時可以著手開發(fā)一個策略程序。第一步是決 定數(shù)據(jù)如何被遷移到平臺,第二步是多久遷移一次,最后,如何保護歸檔。
如何遷移數(shù)據(jù)通常是需要深思熟慮的。做這些最簡單的事情是通過標 準OS命令,遷移這些數(shù)據(jù)到歸檔系統(tǒng)。如果歸檔平臺是基于磁盤的歸檔,這是非常正確的。因為這些系統(tǒng)是簡單的另一些網(wǎng)絡(luò)驅(qū)動名,把這些數(shù)據(jù)手動移到存儲庫 是非常簡單的。對于一些自動化操作,一個像Tek-Tool的工具可以用來產(chǎn)生一個列表,并且把這個列表插入移動數(shù)據(jù)的OS腳本。
手動 遷移程序的好處是它成本是高效的,通常是免費的,并且很快就可以實施。缺點是它不得不手動操作,維護,用戶沒有目標指導(dǎo),如文件數(shù)據(jù)移到哪里了。當一個更 規(guī)范的數(shù)據(jù)遷移程序開發(fā)出來的時候,它就不再是一個理想的策略。
這個更規(guī)范的程序通常是某種自動數(shù)據(jù)遷移的形式。這些可以通過 Atempo公司或EnigmaSoftware公司的某種特定的歸檔軟件完成。這些軟件通常部署一個代理或遠程接入你環(huán)境中的服務(wù)器來決定合適的歸檔文 件。然后遷移這些文件用來歸檔。大多數(shù)應(yīng)用創(chuàng)建一個透明鏈,以便用戶準確找回這些歸檔數(shù)據(jù)。
在幾個月或幾周里歸檔非活動數(shù)據(jù),基于軟件 和磁盤結(jié)合的歸檔允許非常具有挑戰(zhàn)性的遷移政策。在不損害用戶體驗的前提下,它給予主存儲最佳的利用率。當用戶訪問一個歸檔文件的時候,它正好是用戶離開 時刻的那點,因為它是磁盤歸檔,通常不會被注意到性能的減少。大多數(shù)調(diào)查報告顯示真正的活動數(shù)據(jù),在90天內(nèi)windows標注的數(shù)據(jù),僅僅以每年3%到 5%的速度增長,新的歸檔可以推遲未來幾年的存儲購買。
存儲策略的最后一部分是歸檔自身的保護。很多用戶試圖像其他備份設(shè)備一樣備份磁 盤歸檔。這樣是不正確的,歸檔永遠不需要被備份。
對于一個本地磁盤故障的保護,磁盤歸檔系統(tǒng)有先進的數(shù)據(jù)保護方案,提供比標準RAID 更牢固的保護。同樣他們有完整內(nèi)置數(shù)據(jù)自身的檢查。對于站點故障的保護,磁盤歸檔解決方案應(yīng)用可以通過WAN連接復(fù)制到另一個站點。這些要求購買一個二級 系統(tǒng),通過實施基于磁盤的歸檔節(jié)省的成本會比不設(shè)置這種附加的保護更多。
沒有一個二級系統(tǒng),歸檔存儲的數(shù)據(jù)會被全備份備份多次。例如, 如果在90天后遷移非活動數(shù)據(jù),并且你的備份規(guī)則是每周一個完全備份,這就意味著歸檔的數(shù)據(jù)將在大約12個全備份中受保護。對于規(guī)則的一個簡單的改變是由 原來的一個月備份一次到一個月以上備份一次意味著歸檔數(shù)據(jù)在磁帶上也是可用的。
歸檔的影響
基于磁盤的歸檔策略最快速、最明顯的好處是它可以今年或在以下的幾年里減少主存儲的需求,潛在的節(jié)省了IT預(yù)算中的存儲購買預(yù)算。在很多情況下,用戶可 以釋放他們主存儲能力的80%,通過重新分配存儲,用戶實際可以減少存儲量進而減少能源消耗。
最后,一個有效的歸檔策略可以通過減少 80%的備份負載,推遲升級到備份的投資。這些減少可以通過升級到備份到磁盤架構(gòu),備份帶寬和備份服務(wù)器實現(xiàn)。
在2009年,IT預(yù)算 趨勢和歸檔的高效性使歸檔成為一個理想的選擇。你能完成這個項目的事實是:提高主存儲性能,減少備份windows,增加數(shù)據(jù)安全性,在當今的經(jīng)濟情況下 使它成為一個有價值的項目。