什么是歸檔?
什么時(shí)候你應(yīng)該應(yīng)用它?什么是實(shí)施的最好方法?這些都是CIO現(xiàn)在面臨的問題, 這些就是這篇文章要研究的問題。
什么是歸檔?
數(shù)據(jù)歸檔就是在二級(jí)存儲(chǔ)設(shè)備上存儲(chǔ) 非活動(dòng)數(shù)據(jù),如在線磁盤。這些數(shù)據(jù)是在將來可能需要的信息,因此不能刪除他們。可能有合法的原因來保存這些數(shù)據(jù),也可能是機(jī)構(gòu)需要,如市場(chǎng)研究或正當(dāng)?shù)睦?由也許就像刪除它會(huì)讓人很不舒服。不管怎樣,最后的決定是存儲(chǔ)而不是將其刪除。
保存數(shù)據(jù)的問題或者是由于合法原因,或者是“以防萬 一”,也就是它必須保存在某個(gè)地方。如果沒有一個(gè)有效的歸檔策略,這就意味著數(shù)據(jù)會(huì)和其他東西一樣被保存在同樣的地方——主存儲(chǔ)。
對(duì)于 昂貴的資源來說,在主存儲(chǔ)上存儲(chǔ)非活動(dòng)數(shù)據(jù)是一個(gè)巨大的浪費(fèi)。在主存儲(chǔ)之間每GBdelta的價(jià)錢至少在5到10美元之間甚至最貴形式的歸檔存儲(chǔ),那是非 常大的。另外,主存儲(chǔ)旨在快速傳輸過度過程數(shù)據(jù)。它基本上不能支持?jǐn)?shù)據(jù)恢復(fù)法規(guī)或在它被寫入存儲(chǔ)后的幾年,不能證實(shí)這一系列數(shù)據(jù)的完整性。這些都是歸檔存 儲(chǔ)的重要要求。
歸檔目標(biāo)
歸檔第一步是為存儲(chǔ)庫(kù)選擇存儲(chǔ)平臺(tái)。這一元素必須是第一 步,因?yàn)楸贿x擇的平臺(tái)決定策略如何實(shí)施。
傳統(tǒng)的磁帶被認(rèn)為是理想的歸檔媒介。因?yàn)樗鼙阋艘踩菀状鎯?chǔ)、傳輸。磁帶的問題是它要求特殊的 軟件訪問。它不像在網(wǎng)絡(luò)上復(fù)制到另一個(gè)驅(qū)動(dòng)上。對(duì)于數(shù)據(jù)檢索和虛擬無數(shù)據(jù)驗(yàn)證能力也是有限的。
隨著磁盤的價(jià)錢逐漸下降,價(jià)格便宜的 NAS和SATA驅(qū)動(dòng)技術(shù)也開始浮出水面。他們比磁帶更容易訪問,但它同樣也有其他挑戰(zhàn),主要是成本和擴(kuò)展能力。
磁盤和磁帶的缺點(diǎn)導(dǎo)致 了基于磁盤的歸檔系統(tǒng)的開發(fā),像這些來源于Permabit技術(shù)。這些系統(tǒng)提供基于NAS存儲(chǔ)的訪問,成本更高效以及磁帶的可擴(kuò)展性同時(shí)包括檢索和驗(yàn)證功 能。
歸檔策略
一旦歸檔存儲(chǔ)庫(kù)選好后,這時(shí)可以著手開發(fā)一個(gè)策略程序。第一步是決 定數(shù)據(jù)如何被遷移到平臺(tái),第二步是多久遷移一次,最后,如何保護(hù)歸檔。
如何遷移數(shù)據(jù)通常是需要深思熟慮的。做這些最簡(jiǎn)單的事情是通過標(biāo) 準(zhǔn)OS命令,遷移這些數(shù)據(jù)到歸檔系統(tǒng)。如果歸檔平臺(tái)是基于磁盤的歸檔,這是非常正確的。因?yàn)檫@些系統(tǒng)是簡(jiǎn)單的另一些網(wǎng)絡(luò)驅(qū)動(dòng)名,把這些數(shù)據(jù)手動(dòng)移到存儲(chǔ)庫(kù) 是非常簡(jiǎn)單的。對(duì)于一些自動(dòng)化操作,一個(gè)像Tek-Tool的工具可以用來產(chǎn)生一個(gè)列表,并且把這個(gè)列表插入移動(dòng)數(shù)據(jù)的OS腳本。
手動(dòng) 遷移程序的好處是它成本是高效的,通常是免費(fèi)的,并且很快就可以實(shí)施。缺點(diǎn)是它不得不手動(dòng)操作,維護(hù),用戶沒有目標(biāo)指導(dǎo),如文件數(shù)據(jù)移到哪里了。當(dāng)一個(gè)更 規(guī)范的數(shù)據(jù)遷移程序開發(fā)出來的時(shí)候,它就不再是一個(gè)理想的策略。
這個(gè)更規(guī)范的程序通常是某種自動(dòng)數(shù)據(jù)遷移的形式。這些可以通過 Atempo公司或EnigmaSoftware公司的某種特定的歸檔軟件完成。這些軟件通常部署一個(gè)代理或遠(yuǎn)程接入你環(huán)境中的服務(wù)器來決定合適的歸檔文 件。然后遷移這些文件用來歸檔。大多數(shù)應(yīng)用創(chuàng)建一個(gè)透明鏈,以便用戶準(zhǔn)確找回這些歸檔數(shù)據(jù)。
在幾個(gè)月或幾周里歸檔非活動(dòng)數(shù)據(jù),基于軟件 和磁盤結(jié)合的歸檔允許非常具有挑戰(zhàn)性的遷移政策。在不損害用戶體驗(yàn)的前提下,它給予主存儲(chǔ)最佳的利用率。當(dāng)用戶訪問一個(gè)歸檔文件的時(shí)候,它正好是用戶離開 時(shí)刻的那點(diǎn),因?yàn)樗谴疟P歸檔,通常不會(huì)被注意到性能的減少。大多數(shù)調(diào)查報(bào)告顯示真正的活動(dòng)數(shù)據(jù),在90天內(nèi)windows標(biāo)注的數(shù)據(jù),僅僅以每年3%到 5%的速度增長(zhǎng),新的歸檔可以推遲未來幾年的存儲(chǔ)購(gòu)買。
存儲(chǔ)策略的最后一部分是歸檔自身的保護(hù)。很多用戶試圖像其他備份設(shè)備一樣備份磁 盤歸檔。這樣是不正確的,歸檔永遠(yuǎn)不需要被備份。
對(duì)于一個(gè)本地磁盤故障的保護(hù),磁盤歸檔系統(tǒng)有先進(jìn)的數(shù)據(jù)保護(hù)方案,提供比標(biāo)準(zhǔn)RAID 更牢固的保護(hù)。同樣他們有完整內(nèi)置數(shù)據(jù)自身的檢查。對(duì)于站點(diǎn)故障的保護(hù),磁盤歸檔解決方案應(yīng)用可以通過WAN連接復(fù)制到另一個(gè)站點(diǎn)。這些要求購(gòu)買一個(gè)二級(jí) 系統(tǒng),通過實(shí)施基于磁盤的歸檔節(jié)省的成本會(huì)比不設(shè)置這種附加的保護(hù)更多。
沒有一個(gè)二級(jí)系統(tǒng),歸檔存儲(chǔ)的數(shù)據(jù)會(huì)被全備份備份多次。例如, 如果在90天后遷移非活動(dòng)數(shù)據(jù),并且你的備份規(guī)則是每周一個(gè)完全備份,這就意味著歸檔的數(shù)據(jù)將在大約12個(gè)全備份中受保護(hù)。對(duì)于規(guī)則的一個(gè)簡(jiǎn)單的改變是由 原來的一個(gè)月備份一次到一個(gè)月以上備份一次意味著歸檔數(shù)據(jù)在磁帶上也是可用的。
歸檔的影響
基于磁盤的歸檔策略最快速、最明顯的好處是它可以今年或在以下的幾年里減少主存儲(chǔ)的需求,潛在的節(jié)省了IT預(yù)算中的存儲(chǔ)購(gòu)買預(yù)算。在很多情況下,用戶可 以釋放他們主存儲(chǔ)能力的80%,通過重新分配存儲(chǔ),用戶實(shí)際可以減少存儲(chǔ)量進(jìn)而減少能源消耗。
最后,一個(gè)有效的歸檔策略可以通過減少 80%的備份負(fù)載,推遲升級(jí)到備份的投資。這些減少可以通過升級(jí)到備份到磁盤架構(gòu),備份帶寬和備份服務(wù)器實(shí)現(xiàn)。
在2009年,IT預(yù)算 趨勢(shì)和歸檔的高效性使歸檔成為一個(gè)理想的選擇。你能完成這個(gè)項(xiàng)目的事實(shí)是:提高主存儲(chǔ)性能,減少備份windows,增加數(shù)據(jù)安全性,在當(dāng)今的經(jīng)濟(jì)情況下 使它成為一個(gè)有價(jià)值的項(xiàng)目。