亚洲成精品动漫久久精久,九九在线精品视频播放,黄色成人免费观看,三级成人影院,久碰久,四虎成人欧美精品在永久在线

掃一掃
關注微信公眾號

分析:數據歸檔技術未來將走向何方
2010-06-03   網絡

數據量的爆炸性增長,讓我們不得不更加關心存儲。這也造成了目前談論“數據挖掘”、“知識管理”等話題更容易引起共鳴。現在所說的存儲,并非是 簡單的“存”和“儲”的含義,不是把數據放在角落里就萬事大吉的。更重要的是,我們要通過這些數據,進一步產生價值,提升企業業務能力,增加效益。這時 候,“存儲”就演變成了更多的其他含義。比如“備份”、“數據歸檔”、“數據保護”、“數據挖掘”等等。那么在這些“存儲”的替代名詞之中,目前哪個是業 界談論最多的呢?“數據歸檔”當屬其一。為什么這么說?是有充足理由的。

  備份與數據歸檔 即分散又統一

  存儲網絡工業協會(SNIA)是如何解釋數據歸檔的呢?SNIA在《網絡存儲雙語詞典》中的解釋是——Archive(數據歸檔)是指數據集合 的一致性拷貝,通常用以長期持久地保存事務或者應用狀態記錄。一般情況下,數據歸檔通常用以審計和分析的目的,而不是用于應用恢復的目的。

  上面的解釋太術語了,不好理解,那么我們可以用備份和數據歸檔作一下對比,因為備份是很多人容易理解的名詞。備份和數據歸檔都是數據存儲的應用 形式,只是應用目的不同。

  先來看看備份,其實就是對數據進行復制,是為了確保在出現數據丟失或系統災難時將復制的數據恢復回來。因此備份關注的是業務信息的變化和更新, 是短期的存儲行為,并且經常被覆蓋。比如銀行每天要備份交易記錄。

  根據備份的解釋再來看數據歸檔就很好理解了。數據歸檔是針對“海量數據”的應用,是對數據進行有計劃的遷移。當數據停止改變或不被頻繁使用時, 通過數據歸檔把它們轉移到別的地方,讓出主存儲空間,并且使之處于日常的備份窗口之外,既節約了空間,又提升了備份的效率。

  那么根據上面的解釋,如果再簡化來說,那就是“Ctrl+C”和“Ctrl+X”的區別,備份是復制,數據歸檔是剪切。當然,這只是為了方便理 解的比喻,其實里面的玄機還是很多的。

  備份和數據歸檔雖有區別但又互相聯系。只要涉及到數據歸檔必然會有數據備份的需求,并且兩者都是對存儲設備進行操作,因此它們完全可以基于同一 技術體系來實現。所以我們看現在的主流存儲廠商推出的都是“數據管理軟件”,既能備份,又可以數據歸檔,大有“分而合之”之意。目前,備份和數據歸檔常常 放在一起考慮,統稱BURA (BackUp, Restore, Archive)。兩者相似之處都是用復制來保護重要數據不被損壞或丟失。常見的BURA解決方案是D2D2T,就是Backup Disk to Disk, then to Tape。這樣滿足了對備份速度的要求,也滿足了對大容量長保存時間的數據歸檔要求,平衡了各方面的需求。

  廠商推出的軟件既然如此,那么企業對數據歸檔與備份的需求也是分不開的。對企業而言,備份和數據歸檔具有兩種不同但互補的功能:備份用于快速復 制和恢復,以減少故障、人員錯誤或災難帶來的影響;數據歸檔則用于對數據進行有效的管理、保留和長期的訪問與檢索。企業可以將數據歸檔和備份結合起來用, 以達到優化成本、改進存儲基礎設施的整體效力,使備份能夠在有效的數據歸檔解決方案下變得更有效率,而數據歸檔也可以利用備份基礎設施滿足數據保護需要。

  需求飆升 容量左右應用

  隨著數據量的爆炸性增長,數據歸檔的需求明顯增多。IDC在發布《2007年第三季度全球存儲軟件市場收入》時,其存儲軟件分析師 Michael Margossian曾說到:“整個市場受到數據歸檔和數據保護與恢復軟件市場強勁需求的推動。企業對備份軟件的需求似乎有所降溫,對數據歸檔軟件的需求 逐漸抬頭。”

  那么對于企業來說,在當前的市場競爭環境中,需要增加數據分析能力以提升競爭力非用“數據歸檔”不可。比如我們查詢每月電話費,目前只能查到6 個月之內的費用。而一年前的話費呢?并非電信部門將此數據刪除了,只是沒有讓其顯示給用戶。這些更久遠的數據是被“數據歸檔”了,但是又可以供電信部門隨 時查看。當電信部門需要分析話費,進而推出新業務時,就會從數據歸檔數據中調出這些“年代久遠”的數據來。國內一家制造領域大型企業CIO的感觸也十分 “直白”。他認為,“讓數據賺錢,比讓數據省錢來的更加有價值。”這也表明了,數據歸檔比備份來說,更容易幫助企業提升競爭力。

  可以說,數據歸檔是在企業實施備份方案后的進一步對數據的梳理。為什么說是在備份基礎之上的升華呢?因為沒有備份數據的情況下,誰敢“剪切”。 所以備份是前提,數據歸檔是提升。而且數據歸檔也比備份的前提條件要求更多。首先就是容量的要求,一般量級都是在TB級甚至PB級。對于不到TB級存儲量 的企業來說,與其采用數據歸檔,還不如直接加大磁盤容量來的實際。比如佛山伊戈爾這家致力于向全球市場提供電源變壓器、電力變壓器和變壓器鐵芯組件的專業 供應商,其IT部門負責人歐建文在接受記者采訪時介紹道:“在容量方面,佛山伊戈爾郵件數據庫120GB、工程資料文件70GB、一般應用系統SQL數據 庫120GB、Oracle數據庫及應用有170GB,總共480GB的數據量。由于數據量不大,我們確實對數據歸檔技術沒有需求,只是使用了備份功 能。”

  但并不意味著現在沒有應用數據歸檔技術的企業對這項技術就不關心。比如2007年,SNIA完成了一項全面調查,該調查涉及了來自世界各國各種 組織的數百人。令人驚訝的是,80%的人說他們的信息必須保存50年以上,68%的人說他們的數據必須保存100年以上。這樣保存數據的話,容量增長可想 而之。所以佛山伊戈爾也看到了這種數據爆炸增長的趨勢,在制定未來3年IT建設規劃時,“數據歸檔”已經躍然紙上。歐建文對記者說:“目前數據歸檔技術已 經排在佛山伊戈爾未來3年內應用的日程上了,未來會首先在ERP、財務信息和郵件方面應用數據歸檔。”

  ILM解決數據歸檔難題

  雖然數據歸檔的需求正在逐步崛起,但是擺在我們面前的難題其實還有很多。其中最主要的有兩個難點:數據長期保留和法規遵從。數據保留的時間遠遠 超過存儲系統(磁盤或磁帶)和應用程序的壽命。對于長期數據歸檔(15 年以上),最大的挑戰是邏輯遷移。邏輯遷移保持了應用程序的特定性,自動化主要流程變得更困難。完整“保存”需要保持數據的可讀性和可解釋性。

  在法規遵從方面,隨著越來越多的商務運作采用數字方式進行記錄和存儲,制定用以管理商務和數據的相關法律法規越來越多,未能遵從這些法規而造成 的后果也變得越來越嚴重。除遵從政府的規范法規之外,組織還需要制定自己的內部政策和規程,緩解風險和控制 IT。層層的法規遵從給數據歸檔增加了難度。

  目前在磁盤或磁帶上做備份、數據歸檔,每隔3~5年就需要遷移一次數據(同時在物理上和邏輯上)。物理遷移需要將信息從一個物理存儲系統移到另 一個系統,或從一種介質格式移到另一種格式以維持物理可讀性、可訪問性和完整性。邏輯遷移需要將信息從一種邏輯格式移到另一種格式(如從應用程序的舊版本 移到新版本),以保持可讀性和可解釋性。所以,對于上面提到的SNIA調查得出的結論,“絕大部分人希望數據保存50年甚至100年”,那么存儲于磁帶, 則要面臨讀取困難和保存時間不夠長這樣的問題。簡而言之,我們需要保留信息的時間遠遠超過存儲系統(磁盤或磁帶)和應用程序的典型生命周期。甚至保留期還 沒到,物理介質就開始退化,變得無法讀取。

  那么有沒有什么方法,既可以長久保留數據,又可以增加容量,還能快速讀取數據呢? SNIA長期數據歸檔和法規遵從存儲計劃 (LTACSI) 主席、NetApp全球實踐總監Gary Zasman給出的建議是:針對應用程序、操作及數據存儲庫實施正式生命周期管理流程,以在使用壽命中解決數據管理的效率問題。

  目前,在數據歸檔中應用ILM(Information Lifecycle Management,信息生命周期管理)的理念已經逐步被用戶接受,這不僅能幫助企業從整體上改善其數據資產的管理,以最低的成本來實現大量數據的有效 管理與高效利用。并且隨著應用的成熟與現實的需求,數據加密、身份認證、虛擬化等技術也逐步走進數據歸檔的應用中,并且有效地提高了數據歸檔應用的效率, 增強了數據安全性,大大降低了操作的復雜性和成本。

  數據歸檔技術走向何方

  一個好的存儲數據歸檔系統可以幫助企業實現以下目標:降低保留歷史數據的成本;更有效和快捷地對歷史數據訪問和利用;減少保護和維護信息所需的 人力管理成本;保護數據歸檔數據的安全性。但是對于數據的讀取,數據歸檔現在還不能做到盡善盡美。比如我們現在拿起一本100年前的書,可以毫不費力地進 行閱讀,而幾年前的備份磁帶,讀取可能要困難得多。即使有正確的硬件來讀取磁帶(且磁帶本身仍然完好),我們還是需要知道磁帶的寫入格式,且需要可以識別 此數據的應用程序。

  在IT應用早期,磁盤陣列不像今天這么發達,磁帶庫是主要的備份技術。如今,硬盤越來越便宜,不僅磁帶在備份中的應用減少了,甚至有人提出用磁 盤陣列來做數據歸檔,全面取代磁帶庫。但是,由于磁盤陣列的技術特性所決定,存儲在其中的資料都處在熱狀態。這就是說,用于數據歸檔的磁盤存儲系統不應該 關機,其重新加電的過程也很復雜。而在提倡“綠色計算”的今天,長期開機很不利于能耗的降低。而且,幾十年、上百年的資料,使用頻度不一定很高,磁盤和磁 帶相比,成本效益就更加懸殊。所以說,對于數據歸檔來說,磁帶庫仍然是不可替代的最佳選擇。

  為了更快更方便地讀取數據,數據歸檔的理想方案應該是VTL(虛擬磁帶庫)。VTL通常具有幾個重要優點,同其他D2D解決方案一樣,它們在本 質上比磁帶更可靠,并且不會出現介質錯誤、機械故障或起停問題。虛擬磁帶機和介質如果使用穩定,則不會磨損;它們也不需要清潔和維護。最重要的是,與物理 磁帶庫相比,企業VTL可以使數據歸檔的性能提高一個數量級。不過VTL雖然性能出眾、又具有管理便捷的優勢,但是其成本依然是一道難以逾越的門檻,這讓 很多有數據歸檔需求用戶不得不望VTL興嘆。

熱詞搜索:

上一篇:筆記本數據丟失用DLP技術還是全盤加密
下一篇:CIO你了解什么是“數據歸檔”嗎?

分享到: 收藏