縱觀中國(guó)現(xiàn)代信息技術(shù)發(fā)展的不同階段,到今天,硬件基礎(chǔ)架構(gòu)的發(fā)展大致已經(jīng)經(jīng)歷了網(wǎng)絡(luò)熱潮、服務(wù)器熱潮,現(xiàn)在正經(jīng)歷著存儲(chǔ)熱潮。這由2010年全球各大存儲(chǔ)廠商的平均百分之三四十的銷售增長(zhǎng)記錄上就可見一般。
每一種硬件技術(shù)的發(fā)展基本上都經(jīng)歷了由“百家爭(zhēng)鳴”、“百舸爭(zhēng)流”到“殊途同歸”的相同歷程。這其實(shí)與中國(guó)文化的發(fā)展有著異曲同工之妙。從春秋的諸子百家到后來的獨(dú)尊孔孟,都具有相同的發(fā)展經(jīng)歷。構(gòu)建信息基礎(chǔ)架構(gòu)的硬件技術(shù),通過在技術(shù)層面的排除異己、消滅競(jìng)爭(zhēng)對(duì)手的方法,使各種硬件技術(shù)都同質(zhì)化了。現(xiàn)在的網(wǎng)絡(luò)設(shè)備、服務(wù)器設(shè)備等硬件技術(shù)都基本完成了同質(zhì)化的進(jìn)程。而信息技術(shù)基礎(chǔ)架構(gòu)的最底層,存儲(chǔ)系統(tǒng)的發(fā)展,現(xiàn)在正處在最繁榮的“百家爭(zhēng)鳴” 時(shí)期。這種繁榮帶給我們無限的驚喜,同時(shí)又使得選擇合適自身應(yīng)用需求的存儲(chǔ)系統(tǒng),變得非常困難。
記得2006年網(wǎng)絡(luò)熱傳的一篇介紹磁盤陣列技術(shù)的文章--《光纖磁盤陣列技術(shù)簡(jiǎn)析》(以下簡(jiǎn)稱《簡(jiǎn)析》)(發(fā)表在《創(chuàng)新?求實(shí)》2006年7 月刊,中科院計(jì)算技術(shù)研究所,韓曉明),對(duì)當(dāng)時(shí)光纖磁盤陣列的技術(shù)差異和分類有了很精確的闡釋,普及了很多關(guān)于磁盤陣列硬件技術(shù)和市場(chǎng)格局的知識(shí),影響了很多剛進(jìn)入這個(gè)領(lǐng)域的年輕技術(shù)人員和用戶。經(jīng)過五年的發(fā)展,磁盤陣列技術(shù)發(fā)生了巨大的變化,其架構(gòu)也不僅僅局限于光纖,新的SAS技術(shù)的發(fā)展以及控制器架構(gòu)的差異,使得磁盤陣列技術(shù)進(jìn)入了新的繁榮階段。本文意在前文闡述基礎(chǔ)之上,根據(jù)這些年存儲(chǔ)技術(shù)發(fā)展的不同趨勢(shì),淺析當(dāng)前的磁盤陣列技術(shù),以期對(duì)這種繁榮進(jìn)行簡(jiǎn)要的總結(jié)。希望能幫助大家作出合適的選擇。
磁盤陣列的技術(shù)基礎(chǔ)和核心,是其控制器架構(gòu)技術(shù)。這在韓老師的《簡(jiǎn)析》中,已經(jīng)有了明確的說明。我非常贊成這種說法,并得到業(yè)界的廣泛共識(shí)。磁盤陣列不僅僅是一大堆硬盤的集合,它是能控制、有處理的智能設(shè)備。這種智能,來源于其基礎(chǔ)核心--控制器。相較控制器,磁盤、接口等都是磁盤陣列的身體,而控制器,是磁盤陣列的大腦和靈魂。
《簡(jiǎn)析》中把磁盤陣列,根據(jù)其控制器架構(gòu)的差異,劃分為低、中、高三個(gè)類型。如下圖:
三種類型控制器架構(gòu)的磁盤陣列有著各自特點(diǎn)和優(yōu)劣,請(qǐng)參閱《簡(jiǎn)析》。
經(jīng)過最近幾年存儲(chǔ)技術(shù)的發(fā)展,磁盤陣列控制器架構(gòu)的發(fā)展方向有了明顯的差異。例如,出現(xiàn)了由中端模塊化集群技術(shù)堆疊(松散耦合)而成的集群存儲(chǔ)系統(tǒng)(EMC V-MAX、IBM IXV、HP 3PAR等),也出現(xiàn)了由高端分布式多處理器組合而成的分布式多處理器集群技術(shù)(緊耦合)存儲(chǔ)系統(tǒng)(HDS VSP、HP P9500(來自Hitachi))。如下圖:
前者是模塊化存儲(chǔ)的堆疊,每個(gè)節(jié)點(diǎn)之間采用的是標(biāo)準(zhǔn)的外部互聯(lián)技術(shù),比如千兆以太網(wǎng)、RapidIO、infiniband等。后者采用的是總線互聯(lián)技術(shù),比如Crossbar等。兩種技術(shù)有著各自的特點(diǎn),適應(yīng)各自不同的市場(chǎng)需求。
對(duì)于模塊化集群堆疊技術(shù),有的廠商采用的是存儲(chǔ)節(jié)點(diǎn)堆疊,有的廠商僅僅是控制單元堆疊。不管是那種方式,其共同的優(yōu)點(diǎn)是減少了生產(chǎn)的成本,使得廠商可以通過標(biāo)準(zhǔn)的模塊組合形成大型存儲(chǔ)系統(tǒng),以適應(yīng)大型應(yīng)用系統(tǒng)對(duì)于存儲(chǔ)容量和性能的要求。比如IBM的XIV,其節(jié)點(diǎn)就是PC服務(wù)器;而EMC的 V-MAX,其節(jié)點(diǎn)就是類CX4-960的模塊化存儲(chǔ)。通過這種標(biāo)準(zhǔn)化,可以減少生產(chǎn)環(huán)節(jié)的成本損失,降低系統(tǒng)研發(fā)周期。未來,隨著這種類型的存儲(chǔ)的廣泛部署,很多用戶將在購買成本方面受益。這種技術(shù)的缺點(diǎn)是,由于采用了獨(dú)立的存儲(chǔ)節(jié)點(diǎn),存儲(chǔ)節(jié)點(diǎn)組成的集群會(huì)產(chǎn)生資源內(nèi)耗。即存儲(chǔ)節(jié)點(diǎn)之間的通信將增多,其損耗的系統(tǒng)資源將更大。這只能通過增加更多的節(jié)點(diǎn)來彌補(bǔ)。例如,EMC的V-MAX節(jié)點(diǎn),其CPU數(shù)量和接口數(shù)量均與其中端模塊化存儲(chǔ)CX4-960相當(dāng),并且緩存達(dá)到了CX4-960的4倍,但所能掛載的磁盤數(shù)量卻僅僅不到CX4-960的三分之一。集群中多個(gè)節(jié)點(diǎn)之間,不同節(jié)點(diǎn)訪問本節(jié)點(diǎn)和其它節(jié)點(diǎn)的緩存和磁盤的路徑均不相同,這將直接影響到訪問性能的確定性。
另外一種集群技術(shù)來源于原來的分布式多控制器存儲(chǔ)架構(gòu),即把多個(gè)分布式多控制器通過內(nèi)部總線技術(shù)互聯(lián),形成一個(gè)更大的分布式集群系統(tǒng)(如圖)。由于集群互聯(lián)是基于總線的,所以不存在訪問緩存和磁盤路徑不同的問題,所以其性能是相對(duì)確定的。但由于這種技術(shù)所采用的控制器部件,均不是標(biāo)準(zhǔn)化的產(chǎn)品,故價(jià)格因素將對(duì)其推廣影響較大。
這兩種新的存儲(chǔ)架構(gòu)技術(shù),由于有著各自不同的控制器組成方式,其面對(duì)的用戶群體,也將隨之發(fā)生潛移默化的變化。比如,模塊化集群堆疊技術(shù),由于其不同節(jié)點(diǎn)間訪問帶來的性能不確定性,一些大型用戶,比如大的銀行、運(yùn)營(yíng)商、大(云)數(shù)據(jù)中心等,就會(huì)慎重選擇。而隨著標(biāo)準(zhǔn)化組件帶來的成本降低,會(huì)受到大量的中小企業(yè)用戶的青睞。分布式控制器集群架構(gòu)的存儲(chǔ),由于其性能的穩(wěn)定性,對(duì)于更加關(guān)注應(yīng)用安全的高端用戶來講,將成為重要的選擇之一。
隨著云計(jì)算時(shí)代的到來,存儲(chǔ)的“云”化也在進(jìn)行中。云時(shí)代的存儲(chǔ)架構(gòu),或許也難逃同質(zhì)化的命運(yùn)。但是現(xiàn)在,我們可以充分享受“百舸爭(zhēng)流”的存儲(chǔ)盛宴了。