在此之前,你可能沒有考慮過你的IT部門需要一個(gè)橫向擴(kuò)展(也稱向外擴(kuò)展)系統(tǒng)。在如今環(huán)境多樣化的狀況下,橫向擴(kuò)展系統(tǒng)將會(huì)具有深遠(yuǎn)的影響。由于某些行業(yè)需要存儲(chǔ)大量的文件,因此需要足夠的訪問帶寬才能滿足應(yīng)用對(duì)性能的要求,因此對(duì)外擴(kuò)展系統(tǒng)已經(jīng)首先在網(wǎng)絡(luò)附加存儲(chǔ)(NAS)方面發(fā)揮了威力。
例如,過去基于紙張或縮微膠片開展業(yè)務(wù)的一些大型傳統(tǒng)行業(yè),在信息數(shù)字化后,其數(shù)據(jù)存儲(chǔ)壓力撲面而來。對(duì)提供橫向擴(kuò)展NAS系統(tǒng)的供貨商而言,這些行業(yè)正是對(duì)他們充滿了吸引力的垂直市場(chǎng),因?yàn)樗麄兊漠a(chǎn)品正好可以為高性能的應(yīng)用提供支持。
如果我們觀察一下 “橫向擴(kuò)展NAS的垂直關(guān)聯(lián)行業(yè)圖”中的IO軸和吞吐量的關(guān)系模型,就會(huì)發(fā)現(xiàn)這些行業(yè)有許多應(yīng)用都要求非常高的吞吐量。在許多橫向擴(kuò)展NAS系統(tǒng)(包括明年將推出的支持并行網(wǎng)絡(luò)文件系統(tǒng)的NAS系統(tǒng))中內(nèi)置的并行數(shù)據(jù)服務(wù)功能提供的能力超過了每秒MB——傳統(tǒng)縱向擴(kuò)展NAS系統(tǒng)提供的能力值。
縱向擴(kuò)展NAS的垂直關(guān)聯(lián)行業(yè)圖
來源:企業(yè)戰(zhàn)略集團(tuán),2011年.
就在最近的五年前,這張圖還不是這個(gè)樣子。許多右上方的業(yè)務(wù)負(fù)載還擠在圖中的左下側(cè)。但是處理器技術(shù)(如多處理器和更快的芯片集),視頻、圖像和設(shè)計(jì)軟件(例如3-D CAD、4-D醫(yī)學(xué)成像、高清電視等等還有很多)等各方面的進(jìn)步,已經(jīng)催生了新的業(yè)務(wù)負(fù)載,而這些負(fù)載帶來了完全不同的性能需求。這些應(yīng)用產(chǎn)生了海量的文件和多線程的訪問請(qǐng)求,單處理器或雙處理器的縱向擴(kuò)展系統(tǒng)沒法及時(shí)完成響應(yīng),造成了業(yè)務(wù)系統(tǒng)的響應(yīng)減慢或請(qǐng)求服務(wù)超時(shí)。
讓我們對(duì)一些具體的行業(yè)進(jìn)行深入分析,來佐證我的觀點(diǎn)。
金融服務(wù)。這些習(xí)慣了管理巨量交易信息的用戶,現(xiàn)在成了高性能并行文件系統(tǒng)的主力用戶。高性能并行文件系統(tǒng)通常是應(yīng)用在市場(chǎng)業(yè)績(jī)預(yù)測(cè)和商業(yè)智能方面。這些應(yīng)用調(diào)用的文件,不只是內(nèi)容巨大,還需要長(zhǎng)時(shí)間的密集計(jì)算處理,需要高級(jí)別的數(shù)據(jù)保護(hù)并需要保證數(shù)據(jù)的即時(shí)可用性。金融服務(wù)的用戶特意尋找橫向擴(kuò)展架構(gòu)以消除數(shù)據(jù)整合的瓶頸。數(shù)據(jù)整合是金融服務(wù)IT的核心任務(wù)。對(duì)于這些用戶來說,理想的NAS解決方案是,可以隨時(shí)通過增加節(jié)點(diǎn),來使數(shù)據(jù)的訪問性能變得更快。
生命科學(xué)。毫不奇怪,從事與健康相關(guān)的科學(xué)研究組織,對(duì)并行文件系統(tǒng)解決方案非常感興趣,因?yàn)檫@些系統(tǒng)可以提供高帶寬的數(shù)據(jù)傳輸能力和大規(guī)模的可擴(kuò)展性。在這些組織中,緊密合作是非常必須的。例如,IT團(tuán)隊(duì)必須得想辦法,使成千上萬(wàn)的研究人員可以共享非常大的基因測(cè)序文件或蛋白質(zhì)組數(shù)據(jù)。這些企業(yè)還必須加快他們的發(fā)現(xiàn)過程來獲得成功。如果能更快地發(fā)明一種新的藥物,這種藥物就可以被更快地進(jìn)行測(cè)試,就能更快地獲得批準(zhǔn),并應(yīng)用于醫(yī)療和科研實(shí)踐中。對(duì)這些組織而言,要加速藥物的發(fā)現(xiàn)過程,以IT為中心的解決方案就是,構(gòu)建基于高性能并行文件系統(tǒng)的基礎(chǔ)設(shè)施,從而避免后續(xù)不斷進(jìn)行顛覆性的系統(tǒng)改造和升級(jí)。
制造和設(shè)計(jì)。像已經(jīng)明確的其他行業(yè)一樣,高科技制造商、航空航天公司、納米電子新企業(yè)、CAD / CAM設(shè)計(jì)公司以及其他更多的類似組織,也需要巨大的存儲(chǔ)量。他們都在尋找方法來優(yōu)化數(shù)據(jù)管理。這些行業(yè)用戶需要實(shí)現(xiàn)存儲(chǔ)容量的無縫擴(kuò)展,以應(yīng)對(duì)數(shù)字信息的不斷增長(zhǎng),并提高工程團(tuán)隊(duì)之間的信息共享能力。在這樣的環(huán)境中,系統(tǒng)失效會(huì)導(dǎo)致重大的經(jīng)濟(jì)損失。所以制造和設(shè)計(jì)領(lǐng)域的用戶希望部署基于文件的存儲(chǔ)系統(tǒng),以達(dá)到近乎100%的可靠性以及容量在線升級(jí)的簡(jiǎn)易性。他們?yōu)樵鰪?qiáng)文件系統(tǒng)管理、數(shù)據(jù)移動(dòng)、復(fù)制和遷移/分級(jí)存儲(chǔ)等功能,尋找自動(dòng)化的解決方案。
媒體和娛樂。傳媒和娛樂機(jī)構(gòu)的經(jīng)營(yíng)模式已經(jīng)發(fā)生了急劇的變化。在早期的年代里,他們會(huì)出版印刷的雜志,現(xiàn)在,這些雜志僅提供“單一網(wǎng)絡(luò)在線”格式。不僅所有編輯的內(nèi)容需要迅速提供給讀者和編者,所有的廣告文件也一樣。對(duì)數(shù)字密集型的媒體和娛樂公司而言,大型視頻文件也加劇了數(shù)據(jù)增長(zhǎng)帶來的問題。
今天的傳媒和娛樂機(jī)構(gòu)創(chuàng)建和保護(hù)著TB或PB級(jí)的文件數(shù)據(jù)。在一些企業(yè)中,大部分?jǐn)?shù)據(jù)是建立在“邊緣”——遠(yuǎn)離主數(shù)據(jù)中心的遠(yuǎn)程新聞分社或CGI設(shè)計(jì)工作室。這些業(yè)務(wù)機(jī)構(gòu)為數(shù)據(jù)的復(fù)制備份帶來了難題,甚至可能會(huì)使得基礎(chǔ)設(shè)施的災(zāi)難恢復(fù)(DR)能力受到障礙。媒體和娛樂機(jī)構(gòu)正在尋找高性能的橫向擴(kuò)展NAS解決方案來解決各種問題 ——例如提高虛擬服務(wù)器基礎(chǔ)設(shè)施的性能,或者,為內(nèi)容的創(chuàng)作者和閱讀者提供信息的隨時(shí)可用性和及時(shí)可用性。
石油和天然氣。在過去,探尋石油和天然氣儲(chǔ)量具有很大的不確定性。今天,借助于數(shù)字化的信息數(shù)據(jù),這已經(jīng)成了一個(gè)高精度的科學(xué)過程。過去的十年中,在油層下降和提取操作變得更加復(fù)雜的同時(shí),對(duì)疑似資源儲(chǔ)藏地點(diǎn)的三維可視化,已成為該行業(yè)無時(shí)不刻需要利用的工具。在石油和天然氣垂直市場(chǎng)的IT經(jīng)理,面臨的挑戰(zhàn)是找到NAS基礎(chǔ)設(shè)施,以支持海量數(shù)據(jù)的共享和保護(hù)。這些數(shù)據(jù)是對(duì)石油儲(chǔ)量建模/仿真處理的結(jié)果。如果沒有一個(gè)這樣的架構(gòu),能夠在數(shù)據(jù)存儲(chǔ)容量增長(zhǎng)的同時(shí)保持?jǐn)?shù)據(jù)訪問的性能,那么保持企業(yè)的競(jìng)爭(zhēng)優(yōu)勢(shì)會(huì)變得非常困難——主要原因是 “見效時(shí)間”(資源開采)太長(zhǎng)了。對(duì)石油和天然氣企業(yè)處理巨型規(guī)模的模擬計(jì)算而言, 橫向擴(kuò)展NAS系統(tǒng)是一個(gè)很好的解決方案。而這樣的模擬計(jì)算,是他們?cè)诟?jìng)爭(zhēng)中獲得成功的直接保證。
傳統(tǒng)的高性能計(jì)算、學(xué)術(shù)和研究。在公共部門工作的天體物理學(xué)家、分子生物學(xué)家、化學(xué)家、核物理學(xué)家和社會(huì)科學(xué)家,是海量數(shù)據(jù)的制造者和使用者。例如,由歐洲核子研究中心運(yùn)行的大型強(qiáng)子對(duì)撞機(jī),其IT團(tuán)隊(duì)在2010年中期就管理著 70 PB的數(shù)據(jù)。甚至規(guī)模非常小的研究設(shè)施(通常是運(yùn)行在經(jīng)費(fèi)有限的大學(xué)機(jī)構(gòu)或商業(yè)實(shí)驗(yàn)室)也依賴于高性能網(wǎng)格計(jì)算和并行文件系統(tǒng)架構(gòu),以支持建模和仿真任務(wù),才能夠解決現(xiàn)實(shí)世界問題以及為“大”問題做出回答。他們的工作需要低延遲的網(wǎng)絡(luò)集群,以應(yīng)對(duì)非常高的性能要求和帶寬要求。
這些行業(yè)是橫向擴(kuò)展系統(tǒng)的先期實(shí)際采用者,因?yàn)樗鼈冊(cè)谕掏铝啃阅芊矫嬗袡M向擴(kuò)展的剛性需求。但大多數(shù)的部門應(yīng)該充分考慮,將許多PB的數(shù)據(jù)存儲(chǔ)在一個(gè)單一命名空間,其效率如何以及能節(jié)省多少運(yùn)營(yíng)費(fèi)用。這是橫向擴(kuò)展系統(tǒng)在云架構(gòu)獲得應(yīng)用的原因。這種架構(gòu)使得類似Gluster這樣的公司,從基于云的業(yè)務(wù)和構(gòu)建私有云的企業(yè)中獲得了巨大收益。Gluster推出了一種橫向擴(kuò)展的文件系統(tǒng),運(yùn)行在普通硬件上,能夠支持塊、文件和對(duì)象數(shù)據(jù)。企業(yè)戰(zhàn)略集團(tuán)預(yù)測(cè),到2015年,所有外置NAS系統(tǒng)收入的80%都將來自于橫向擴(kuò)展系統(tǒng)的交付,而且,“大文件的數(shù)據(jù)”和云計(jì)算將是其增長(zhǎng)的核心點(diǎn)。
原文地址:http://www.searchstorage.com.cn/showcontent_58535.htm