《亞利桑那州共和報》采用了DataDomain的重復(fù)數(shù)據(jù)刪除系統(tǒng)來減少數(shù)據(jù)存儲需求和備份成本。
《亞利桑那州共和報》存儲部門的任務(wù)既像存儲客戶又像存儲廠商。它需要備份自己的數(shù)據(jù),還需要備份母公司(Gannett)旗下其他實體的數(shù)據(jù)。它使用多種系統(tǒng)和備份方式。因此,這個出版實體經(jīng)常處在備份技術(shù)的前沿,比如部署重復(fù)數(shù)據(jù)刪除系統(tǒng)來滿足日益增長的存儲需求。
《亞利桑那州共和報》成立于1890年五月,是該州最大和最有影響力的報紙。該公司同時也是互聯(lián)網(wǎng)媒體的先驅(qū),早在1995年就建立了一個網(wǎng)站。2000年,Gannett收購了這家報紙及其關(guān)聯(lián)的其他產(chǎn)業(yè)。Gannett是一家國內(nèi)新聞媒體集團(tuán),旗下媒體包括《今日美國》等。
這家亞利桑那州的媒體公司現(xiàn)在大約有450-500臺服務(wù)器,運(yùn)行著各種操作系統(tǒng),如Linux,Solaris,IBM AIX,X86和VMware等。《亞利桑那州共和報》的首席系統(tǒng)管理員John Tabor表示:“在媒體行業(yè),各家公司開發(fā)了許多定制的應(yīng)用程序,因為我們沒有很多現(xiàn)成的應(yīng)用程序可用。”
該公司目前管理者超過100TB的信息內(nèi)容。因此,高公司使用多種備份手段和系統(tǒng),比如CommVault的Simpana,EMC的Legato和Symantec的NetBackup。該媒體公司在服務(wù)器上遇到了備份時間瓶頸,大部分備份工作需要在周末進(jìn)行。一些數(shù)據(jù)是每天備份,而另一些則需要每周備份。
滿足備份窗口成為一個持續(xù)性的難題,這就是為什么該出版實體很早便采用虛擬磁帶庫(VTL)系統(tǒng)的原因之一。2003年,《亞利桑那州共和報》決定不再采用磁帶來備份日益龐大的SAN(存儲局域網(wǎng)),因為磁帶這種備份方式既昂貴且耗時太長。該媒體公司選擇EMC的VTL來支持存儲網(wǎng)絡(luò)。
隨著該出版商增加其他的系統(tǒng),比如網(wǎng)絡(luò)附加存儲(NAS),VTL需要備份的數(shù)據(jù)量也在不斷增加。NAS是每天備份,而該系統(tǒng)的數(shù)據(jù)量從4TB增加到了12TB。Tabor表示:“我們到了需要增加另一個系統(tǒng)的時候了。”
EMC的產(chǎn)品是很好,但是和許多第一代VTL一樣,它不能支持重復(fù)數(shù)據(jù)刪除。因此在2007年,這家出版公司決定選擇一個有重復(fù)數(shù)據(jù)刪除功能的VTL。《亞利桑那州共和報》將選擇范圍縮小到了Data Domain和EMC。前者提供了更為簡單的升級方式。Tabor表示:“EMC系統(tǒng)是‘推倒重來’的升級方式;但是如果采用Data Domain系統(tǒng)的話,那么我們只需要在現(xiàn)有系統(tǒng)中加入Data Domain系統(tǒng)而無需再購買新的磁盤。”
Data Domain系統(tǒng)的功能讓該出版公司覺得物有所值。新產(chǎn)品花費(fèi)了大約12萬美元,和購買新磁盤容量的成本相近。但是由于該VTL能夠更有效地利用現(xiàn)有存儲,因此不用再購買新的容量。此外,支持VTL的Symantec NetBackup軟件是按照裸容量來收費(fèi)而不是按照虛擬容量,因此新VTL的重復(fù)數(shù)據(jù)刪除功能讓該新聞媒體得以改善VTL存儲利用而無需增加軟件使用成本。
去年夏天,該公司購買了Data Domain系統(tǒng)并開始測試。測試過程進(jìn)行得很順利,因此該系統(tǒng)很快就得以部署。Tabor表示:“我們在系統(tǒng)安裝的同一天就創(chuàng)建了VTL。”新系統(tǒng)提供了強(qiáng)大的功能,比如可以在一分鐘或更短時間內(nèi)進(jìn)行即時的恢復(fù)操作。
不過,該系統(tǒng)的部署也非一帆風(fēng)順。首先,該系統(tǒng)不支持多路徑,而該媒體在它的冗余光纖數(shù)據(jù)中心網(wǎng)絡(luò)中使用了多路徑技術(shù)。這個問題很快得到了解決。在開始的時候,該媒體公司還有些擔(dān)心該系統(tǒng)的性能。重復(fù)數(shù)據(jù)刪除排除冗余數(shù)據(jù),減少需要備份的數(shù)據(jù)的數(shù)量,縮短了備份時間。Data Domain在開始的時候聲稱該系統(tǒng)能帶來20X的提升——將100TB數(shù)據(jù)減少到10TB——但是該媒體公司只實現(xiàn)了7-10X的提升。在仔細(xì)分析該媒體公司提交的性能報告之后,Data Domain的技術(shù)支持人員認(rèn)為一個一次性備份操作是導(dǎo)致結(jié)果不理想的主要原因。Tabor說:“我們出現(xiàn)了一次緊急事件,并使用了VTL來備份一個圖片歸檔。”在該公司第一次使用重復(fù)數(shù)據(jù)刪除功能的時候,該系統(tǒng)會建立必要的索引;只有在建立索引之后,性能提升的效果才能體現(xiàn)出來。而這個案例正是因為這個原因才顯得提升效果不明顯。
現(xiàn)在,該系統(tǒng)重復(fù)數(shù)據(jù)刪除功能的效果已經(jīng)很明顯,該媒體公司正計劃擴(kuò)展它的VTL。該公司計劃修改VMware備份,越過Symantec Netbackup系統(tǒng),直接將它們遷移到磁盤。Tabor表示:“自從增加了重復(fù)數(shù)據(jù)刪除功能之后,我們現(xiàn)在的存儲管理效率大大提高。”