磁帶庫數據備份存儲了我們很多重要的數據,但是我們的數據還是需要在不同的數據庫之間傳遞,這樣磁帶庫數據備份之間的傳遞就顯得格外重要。這已經是數據中心面臨的嚴峻問題。
隨著客戶應用系統需求的不斷增加,需要備份的數據不斷的增多,數據安全性要求也不斷提高,作為數據備份所用的磁帶庫的容量也不斷的增加,有時還有可能增加第二個磁帶庫數據備份,甚至更多的磁帶庫。基于資源共享的目的,不同存儲系統之間的數據在特定時間需要進行數據交換和共享。
有的用戶在進行系統方案設計時提議多個磁帶庫數據備份系統采用相同磁帶庫和磁帶,相同的數據存儲格式,希望通過磁帶離線的方式來實現數據的交換或共享問題。這個想法乍一聽好象很有道理,有一定的可行性,但只要詳細分析一下磁帶庫在業務系統中的具體應用流程,就會發現要想實現這個想法將面臨很多問題。
多個磁帶庫數據備份能否通過離線磁帶來進行數據的交換或共享問題,實際上就是不同磁帶庫中的數據之間的能否兼容的問題,按照數據庫存儲系統的結構和應用,兼容主要在以下三個方面:
第一, 磁帶庫數據備份物理設備的兼容
即兩個磁帶庫數據備份使用相同的磁帶和磁帶機。只有磁帶和磁帶機兼容,磁帶才能被磁帶機正常的裝載,磁帶才能MOUNT進磁帶機里。
第二,數據遷移或備份軟件系統兼容
大型磁帶庫系統會采用分步式的遷移或備份軟件來進行數據庫遷移和備份。分布式備份軟件都有一個數據庫,這個數據庫中記錄著每一盤磁帶的VOLUME、FORMAT信息、文件名稱、文件大小,寫入時間、源文件路徑等相關的元數據信息。在進行文件恢復或回遷時,遷移或備份軟件會按照數據庫中記錄的文件的元數據信息,將文件恢復到源路徑下。如果數據庫中沒有文件的元數據信息,即使磁帶中有數據,備份軟件也不可能正常的對文件進行備份和恢復。另外,為保證數據庫中的記錄信息和磁帶中數據的同步和一致性,備份軟件會默認為每一個初次放入帶庫的磁帶是一個空白帶,沒有任何數據,因此在第一次寫入數據前都會進行一個Relable的操作,相當于硬盤的格式化。當然可以手動地向數據庫中引入文件的元數據庫,但這只是在理論上可行,在實際的操作中會遇到相當大的困難。
注:在概念上一定要把遷移或備份的執行者ACTOR與備份請求的發起者initiator 區分開來,遷移或備份軟件是數據遷移和備份操作的執行者,負責從源存儲池(在線盤陣/磁帶庫)讀取文件,寫入到目的存儲池(磁帶庫/在線盤陣);發起者(initiator)只是按照制定的遷移或備份策略,向執行者發送請求,由執行者來完成數據的遷移和恢復操作。在實際的應用中,有時執行者并不是一個單獨的軟件,而是由操作系統來擔任的。
第三,應用軟件系統的兼容
針對不同應用和系統要求,磁帶庫數據備份在存儲系統中所起的作用也不相同。對于銀行和電訊等行業,存儲系統中的磁帶庫是整個的備份設備,負責備份數據庫中的數據,每次需要備份的數據文件在幾M到幾十個G之間。由于備份一般采用全備份或差異性備份等方式,備份的數據文件之間有一定的關系。本次對數據文件進行備份后,可能幾天之前備份的數據文件就不需要,或不重要了。
從存儲系統的運行情況來看,磁帶庫數據備份中的文件只是作為在線盤陣中的文件的冗余備份,所有文件會同時存在于在線盤陣和磁帶庫中,也就是說在在整個系統中每個需要進行備份的文件都是雙份的。在正常的情況下,磁帶庫數據備份中的數據文件不參與應用,只有當在線盤陣中數據發生損壞或丟失時,才手動或自動會恢復到在線盤陣中,保證存儲系統的正常運行。
對于數據庫系統備份,數據文件路徑等相關信息都通過備份軟件進行設置,并保存在備份軟件中,磁帶中記錄的只是數據文件本身,并不需要記錄與數據文件相關的元數據,或只記錄很少的元數據。在進行數據恢復時,備份軟件會將磁帶中的數據文件恢復到一個單一的、特定的路徑下,或手工指定一個恢復路徑,數據庫系統就可以對恢復后的文件進行讀寫。
針對這種應用方式,只要兩個磁帶庫數據備份系統,采用相同的備份軟件,就可以讀取另一種磁帶庫,兩個磁帶庫就可以通過互換磁帶的方式進行數據共享。也就是說兩個磁帶庫之的數據可以兼容。
原文鏈接:http://storage.it168.com/a2011/0929/1253/000001253404.shtml