最早的數據歸檔應用產生于大型主機環境,源于當時大型主機環境的IT應用的規模較大且相對成熟。因此,關于歸檔與備份的區別,國內較大的行業和企業用戶都比較了解,但對于IT應用歷史不長、規模不大、數據量有限的企業來說,對于兩者的區別可能就不那么清楚。
基礎的存儲應用主要包括數據備份與數據歸檔兩個方面。歸檔的目的是實現歷史數據和信息被系統、科學、長期地保存,以被公司決策管理、上級或第三方機構監管等用途。備份正好相反,其目的是數據的立即使用,以確保業務連續性,或者使業務中斷時能夠以最短的時間得到恢復。
近年來,西方國家發生了一些重大的企業舞弊案件,使得政府和整個社會都對企業數據資料的保存提出了更為嚴苛的要求,從而使數據歸檔的地位上升到關系到企業存亡和社會安定的高度。另外,早期計算機主要是處理文本數據,如今卻要處理大量的多媒體數據,對存儲容量和速度的要求已經發生了根本性的變化,企業在數據資料的保存和利用方面的投資越來越高,而歸檔是企業有效管理應用數據資料、降低成本的重要手段。
因此,從當今的數據歸檔應用來看,主要是解決好企業數據保存的法規遵從性和企業數據資產的有效管理兩個方面的問題。
雖然數據歸檔與備份都屬于存儲應用,但在技術實現上有很大區別。在IT應用早期,磁盤陣列不像今天這么發達,磁帶庫是主要的備份技術。如今,硬盤越來越便宜,不僅磁帶在備份中的應用減少了,甚至有人提出用磁盤陣列來做歸檔,全面取代磁帶庫。但是,由于磁盤陣列的技術特性所決定,存儲在其中的資料都處在熱狀態。
這就是說,用于數據歸檔的磁盤存儲系統不應該關機,其重新加電的過程也很復雜。而在提倡“綠色計算”的今天,長期開機很不利于能耗的降低。而且,幾十年、上百年的資料,使用頻度不一定很高,磁盤和磁帶相比,成本效益就更加懸殊。所以說,對于數據歸檔來說,磁帶庫仍然是不可替代的最佳選擇。
光盤存儲也被認為是數據歸檔的一種手段,其特點是價格低廉,技術含量低,而且便于大范圍分發。但是,其容量無法與磁帶和磁盤相比,能夠支持的應用也比較受限,因此并不適用于企業數據中心級別的數據歸檔應用。
我們都看到,在數據歸檔中應用ILM(Information Lifecycle Management,信息生命周期管理)的理念已經逐步被用戶接受,這不僅能幫助企業從整體上改善其數據資產的管理,以最低的成本來實現大量數據的有效管理與高效利用。并且隨著應用的成熟與現實的需求,我們發現數據加密、身份認證、虛擬化等技術也逐步走進數據歸檔的應用中,并且有效地提高了數據歸檔應用的效率,增強了數據安全性,大大降低了操作的復雜性和成本。
ILM的應用使得我們在考慮現有數據應用需求時,能夠更好地綜合考慮操作性、安全性、成本與生產效率的各方面因素,更加理性地、系統地構建數據歸檔保護基礎架構。