《亞利桑那州共和報(bào)》采用了DataDomain的重復(fù)數(shù)據(jù)刪除系統(tǒng)來(lái)減少數(shù)據(jù)存儲(chǔ)需求和備份成本。
《亞利桑那州共和報(bào)》存儲(chǔ)部門(mén)的任務(wù)既像存儲(chǔ)客戶又像存儲(chǔ)廠商。它需要備份自己的數(shù)據(jù),還需要備份母公司(Gannett)旗下其他實(shí)體的數(shù)據(jù)。它使用多種系統(tǒng)和備份方式。因此,這個(gè)出版實(shí)體經(jīng)常處在備份技術(shù)的前沿,比如部署重復(fù)數(shù)據(jù)刪除系統(tǒng)來(lái)滿足日益增長(zhǎng)的存儲(chǔ)需求。
《亞利桑那州共和報(bào)》成立于1890年五月,是該州最大和最有影響力的報(bào)紙。該公司同時(shí)也是互聯(lián)網(wǎng)媒體的先驅(qū),早在1995年就建立了一個(gè)網(wǎng)站。2000年,Gannett收購(gòu)了這家報(bào)紙及其關(guān)聯(lián)的其他產(chǎn)業(yè)。Gannett是一家國(guó)內(nèi)新聞媒體集團(tuán),旗下媒體包括《今日美國(guó)》等。
這家亞利桑那州的媒體公司現(xiàn)在大約有450-500臺(tái)服務(wù)器,運(yùn)行著各種操作系統(tǒng),如Linux,Solaris,IBM AIX,X86和VMware等。《亞利桑那州共和報(bào)》的首席系統(tǒng)管理員John Tabor表示:“在媒體行業(yè),各家公司開(kāi)發(fā)了許多定制的應(yīng)用程序,因?yàn)槲覀儧](méi)有很多現(xiàn)成的應(yīng)用程序可用。”
該公司目前管理者超過(guò)100TB的信息內(nèi)容。因此,高公司使用多種備份手段和系統(tǒng),比如CommVault的Simpana,EMC的Legato和Symantec的NetBackup。該媒體公司在服務(wù)器上遇到了備份時(shí)間瓶頸,大部分備份工作需要在周末進(jìn)行。一些數(shù)據(jù)是每天備份,而另一些則需要每周備份。
滿足備份窗口成為一個(gè)持續(xù)性的難題,這就是為什么該出版實(shí)體很早便采用虛擬磁帶庫(kù)(VTL)系統(tǒng)的原因之一。2003年,《亞利桑那州共和報(bào)》決定不再采用磁帶來(lái)備份日益龐大的SAN(存儲(chǔ)局域網(wǎng)),因?yàn)榇艓н@種備份方式既昂貴且耗時(shí)太長(zhǎng)。該媒體公司選擇EMC的VTL來(lái)支持存儲(chǔ)網(wǎng)絡(luò)。
隨著該出版商增加其他的系統(tǒng),比如網(wǎng)絡(luò)附加存儲(chǔ)(NAS),VTL需要備份的數(shù)據(jù)量也在不斷增加。NAS是每天備份,而該系統(tǒng)的數(shù)據(jù)量從4TB增加到了12TB。Tabor表示:“我們到了需要增加另一個(gè)系統(tǒng)的時(shí)候了。”
EMC的產(chǎn)品是很好,但是和許多第一代VTL一樣,它不能支持重復(fù)數(shù)據(jù)刪除。因此在2007年,這家出版公司決定選擇一個(gè)有重復(fù)數(shù)據(jù)刪除功能的VTL。《亞利桑那州共和報(bào)》將選擇范圍縮小到了Data Domain和EMC。前者提供了更為簡(jiǎn)單的升級(jí)方式。Tabor表示:“EMC系統(tǒng)是‘推倒重來(lái)’的升級(jí)方式;但是如果采用Data Domain系統(tǒng)的話,那么我們只需要在現(xiàn)有系統(tǒng)中加入Data Domain系統(tǒng)而無(wú)需再購(gòu)買(mǎi)新的磁盤(pán)。”
Data Domain系統(tǒng)的功能讓該出版公司覺(jué)得物有所值。新產(chǎn)品花費(fèi)了大約12萬(wàn)美元,和購(gòu)買(mǎi)新磁盤(pán)容量的成本相近。但是由于該VTL能夠更有效地利用現(xiàn)有存儲(chǔ),因此不用再購(gòu)買(mǎi)新的容量。此外,支持VTL的Symantec NetBackup軟件是按照裸容量來(lái)收費(fèi)而不是按照虛擬容量,因此新VTL的重復(fù)數(shù)據(jù)刪除功能讓該新聞媒體得以改善VTL存儲(chǔ)利用而無(wú)需增加軟件使用成本。
去年夏天,該公司購(gòu)買(mǎi)了Data Domain系統(tǒng)并開(kāi)始測(cè)試。測(cè)試過(guò)程進(jìn)行得很順利,因此該系統(tǒng)很快就得以部署。Tabor表示:“我們?cè)谙到y(tǒng)安裝的同一天就創(chuàng)建了VTL。”新系統(tǒng)提供了強(qiáng)大的功能,比如可以在一分鐘或更短時(shí)間內(nèi)進(jìn)行即時(shí)的恢復(fù)操作。
不過(guò),該系統(tǒng)的部署也非一帆風(fēng)順。首先,該系統(tǒng)不支持多路徑,而該媒體在它的冗余光纖數(shù)據(jù)中心網(wǎng)絡(luò)中使用了多路徑技術(shù)。這個(gè)問(wèn)題很快得到了解決。在開(kāi)始的時(shí)候,該媒體公司還有些擔(dān)心該系統(tǒng)的性能。重復(fù)數(shù)據(jù)刪除排除冗余數(shù)據(jù),減少需要備份的數(shù)據(jù)的數(shù)量,縮短了備份時(shí)間。Data Domain在開(kāi)始的時(shí)候聲稱該系統(tǒng)能帶來(lái)20X的提升——將100TB數(shù)據(jù)減少到10TB——但是該媒體公司只實(shí)現(xiàn)了7-10X的提升。在仔細(xì)分析該媒體公司提交的性能報(bào)告之后,Data Domain的技術(shù)支持人員認(rèn)為一個(gè)一次性備份操作是導(dǎo)致結(jié)果不理想的主要原因。Tabor說(shuō):“我們出現(xiàn)了一次緊急事件,并使用了VTL來(lái)備份一個(gè)圖片歸檔。”在該公司第一次使用重復(fù)數(shù)據(jù)刪除功能的時(shí)候,該系統(tǒng)會(huì)建立必要的索引;只有在建立索引之后,性能提升的效果才能體現(xiàn)出來(lái)。而這個(gè)案例正是因?yàn)檫@個(gè)原因才顯得提升效果不明顯。
現(xiàn)在,該系統(tǒng)重復(fù)數(shù)據(jù)刪除功能的效果已經(jīng)很明顯,該媒體公司正計(jì)劃擴(kuò)展它的VTL。該公司計(jì)劃修改VMware備份,越過(guò)Symantec Netbackup系統(tǒng),直接將它們遷移到磁盤(pán)。Tabor表示:“自從增加了重復(fù)數(shù)據(jù)刪除功能之后,我們現(xiàn)在的存儲(chǔ)管理效率大大提高。”