為了實(shí)現(xiàn)重要商業(yè)應(yīng)用的零誤工,一些企業(yè)把數(shù)據(jù)中心也聯(lián)合起來,這樣一來當(dāng)某個(gè)數(shù)據(jù)中心出現(xiàn)故障時(shí),上面的應(yīng)用可以切換到另外一個(gè)數(shù)據(jù)中心。服務(wù)器虛擬化技術(shù)的出現(xiàn),如VM遷移,使這一選擇更具靈活性。有些企業(yè)更勝一籌,通過創(chuàng)建相互連接的數(shù)據(jù)中心同時(shí)在兩個(gè)不同的數(shù)據(jù)中心里運(yùn)行相同的應(yīng)用。
雖然有許多關(guān)于此部署的架構(gòu)決策,但或許最關(guān)鍵的是兩個(gè)數(shù)據(jù)中心如何通過DCI連接。應(yīng)用與虛擬化軟件的要保持同步,則需要兩個(gè)數(shù)據(jù)中心之間的延時(shí)非常短,通常要控制在毫秒范圍。這一要求在IT和數(shù)據(jù)中心設(shè)計(jì)師創(chuàng)建DCI架構(gòu)性時(shí)起到了舉足輕重的作用。
由DCI連接的應(yīng)用需要使用以太網(wǎng),這樣就會(huì)帶來巨大的挑戰(zhàn),包括延時(shí)問題,還可能創(chuàng)建環(huán)路從而導(dǎo)致網(wǎng)絡(luò)崩潰。有多種方案可以應(yīng)對(duì)這種挑戰(zhàn),包括使用運(yùn)營商服務(wù),如VirtualPrivateLAN服務(wù),但是這些方案也存在自身局限性。
例如,當(dāng)VPLS可用來阻止運(yùn)營商網(wǎng)絡(luò)中的循環(huán)時(shí),它不會(huì)阻止客戶內(nèi)部網(wǎng)絡(luò)中出現(xiàn)循環(huán)。VPLS可能帶來延時(shí)并因此影響應(yīng)用的使用。客戶或許想使用MultichassisLinkAggregation之類的技巧,在這種技巧中,兩到多個(gè)以太網(wǎng)交換機(jī)在本地合并到一起使兩條以太網(wǎng)連接成為一條。
其他選擇還包括使用暗光纖和DWDM,二者都可以提供很快的連接。雖然暗光纖和DWDM都很貴,但是它們能為DCI提供最優(yōu)連接。
數(shù)據(jù)中心互聯(lián)增強(qiáng)應(yīng)用有效性
應(yīng)用如果出現(xiàn)故障,對(duì)企業(yè)的損失是比較大的,特別那些關(guān)乎關(guān)鍵業(yè)務(wù)的系統(tǒng)。阻止應(yīng)用故障的策略之一就是創(chuàng)建數(shù)據(jù)中心的互聯(lián),或是用DCI連接兩個(gè)數(shù)據(jù)中心,這樣當(dāng)故障出現(xiàn)在一個(gè)數(shù)據(jù)中心的時(shí)候,應(yīng)用會(huì)繼續(xù)在另一個(gè)數(shù)據(jù)中心里運(yùn)行。在ITIL推薦要發(fā)揮所有固有資產(chǎn)價(jià)值以及使用積極數(shù)據(jù)中心模式的倡導(dǎo)下,這種方法得到了進(jìn)一步發(fā)展。
有兩種方法可在兩個(gè)數(shù)據(jù)中心中創(chuàng)建可用性較高的應(yīng)用。第一是選擇一個(gè)應(yīng)用,在其中一個(gè)數(shù)據(jù)中心中使用這個(gè)應(yīng)用,而另外一個(gè)數(shù)據(jù)中心則作為備用。這樣,當(dāng)?shù)谝粋€(gè)數(shù)據(jù)中心出現(xiàn)故障時(shí),應(yīng)用會(huì)轉(zhuǎn)換到另一個(gè)數(shù)據(jù)中心繼續(xù)運(yùn)作。監(jiān)控管理技術(shù),如VMmare的vMotion,可以讓虛擬機(jī)從一個(gè)物理服務(wù)器轉(zhuǎn)移到另一個(gè)服務(wù)器上,通過此項(xiàng)操作來實(shí)現(xiàn)進(jìn)程的持續(xù)運(yùn)作。
第二種選擇是應(yīng)用同步化,這樣就可以在兩個(gè)數(shù)據(jù)中心里同時(shí)運(yùn)行應(yīng)用。群集,共享和存儲(chǔ)復(fù)制等技術(shù)都有助于實(shí)現(xiàn)同步化。
但是許多有應(yīng)用運(yùn)行的群集和復(fù)制技術(shù)都需要共享一個(gè)以太網(wǎng),而且以太網(wǎng)數(shù)據(jù)會(huì)通過單點(diǎn)播放/多點(diǎn)播放或廣播的形式發(fā)送給集群中的所有要素(服務(wù)器,數(shù)據(jù)庫和存儲(chǔ))。
問題在于,雖然以太網(wǎng)可在數(shù)據(jù)中心電纜上傳輸幾百米,但是它的局限性也會(huì)對(duì)企業(yè)創(chuàng)建DCI形成阻礙。這些阻礙包括延時(shí)和帶寬挑戰(zhàn)。
運(yùn)營商也提供了一些服務(wù)期望能應(yīng)對(duì)諸如此類的挑戰(zhàn),但是這些服務(wù)在部署方面仍然存在局限性,而且還不足以保障應(yīng)用的高可用性。我們將審查這些挑戰(zhàn)并介紹一些可創(chuàng)建DCI連接的替代物。最佳選擇是使用MultichassisLinkAggregation(MLAG)等技術(shù),因?yàn)樗鼈兪褂昧税倒饫w和DWDM服務(wù)。
延時(shí)問題
延時(shí)是一個(gè)比較麻煩的問題。造成延時(shí)的原因主要有三個(gè),最主要的就是距離。距離越遠(yuǎn),電子信號(hào)的傳輸時(shí)間就越長。
兩個(gè)數(shù)據(jù)中心之間最常見的延時(shí)底線由VM遷移來決定,如用于VMwarevSphere服務(wù)器的vMotion,它可以讓虛擬機(jī)從一個(gè)物理機(jī)組遷移到另一個(gè)機(jī)組。VMware稱,源服務(wù)器和目標(biāo)服務(wù)器之間的延時(shí)必須小于5毫秒(vMotionMetro許可證更改了vMotionTCP堆棧使其支持動(dòng)態(tài)套接緩沖,這樣便調(diào)整了TCP協(xié)議堆棧中里的內(nèi)存數(shù)據(jù)包緩沖,按照延時(shí)/帶寬情況優(yōu)化性能,可以容許稍長一點(diǎn)的延時(shí))。
你的企業(yè)有沒有為改善網(wǎng)絡(luò)制定預(yù)算?
▲圖一:改善網(wǎng)絡(luò)連接的預(yù)算
實(shí)踐結(jié)果是數(shù)據(jù)中心的距離在50-75公里范圍內(nèi)可以進(jìn)行可靠的VM遷移。
遺憾的是,這個(gè)距離對(duì)于較嚴(yán)重的災(zāi)難恢復(fù)計(jì)劃而言還不夠(如颶風(fēng),地震或是區(qū)域性的電信故障)。因此企業(yè)要平衡應(yīng)用應(yīng)對(duì)災(zāi)難恢復(fù)要求的彈性。
延時(shí)還會(huì)影響存儲(chǔ)復(fù)制,特別是在同步復(fù)制中,數(shù)據(jù)塊寫入必須在兩個(gè)站點(diǎn)間在5-10毫秒內(nèi)復(fù)制完,這要取決于恢復(fù)點(diǎn)的目標(biāo)恢復(fù)時(shí)間。
對(duì)于同步操作而言,延時(shí)的影響比較小,因?yàn)閷懭氪_認(rèn)可以在不影響存儲(chǔ)源的情況下被接收到,而且請(qǐng)求/響應(yīng)順序沒有通過寫入確認(rèn)來限制。但是如果你計(jì)劃進(jìn)行亞秒故障轉(zhuǎn)移,通常需要進(jìn)行同步存儲(chǔ)來確保數(shù)據(jù)不被丟失。
另一個(gè)導(dǎo)致延時(shí)的不顯著因素是運(yùn)營商往往使用隧道協(xié)議,如MPLS,ATM或SONET。MPLS網(wǎng)絡(luò)的問題在于運(yùn)營商不能保障網(wǎng)絡(luò)中兩站點(diǎn)之間的路徑。運(yùn)營商網(wǎng)絡(luò)可能在一個(gè)城市的多個(gè)節(jié)點(diǎn)跳動(dòng),這樣以太網(wǎng)絡(luò)幀在轉(zhuǎn)發(fā)時(shí)會(huì)增加處理延時(shí)。
最后一個(gè)導(dǎo)致延時(shí)的要素是帶寬。網(wǎng)速快當(dāng)然延時(shí)就短;例如,1G接口的延時(shí)為5.7毫秒,但是10G接口的延時(shí)僅為0.57毫秒。簡而言之,改善延時(shí)問題的簡單方法就是使用高帶寬網(wǎng)絡(luò)。
QoS挑戰(zhàn)
應(yīng)用在兩個(gè)數(shù)據(jù)中心之間的有效性也會(huì)影響QoS設(shè)置的限制。以太網(wǎng)有五個(gè)可用的QoS類可以對(duì)數(shù)據(jù)流進(jìn)行分類管理,這樣便能限制第二層數(shù)據(jù)中心互聯(lián)可以處理的服務(wù)量。
▲
同時(shí),在DCI上你還有兩股不同類型的數(shù)據(jù)來維持應(yīng)用的有效性:突發(fā)性,高帶寬應(yīng)用和低延時(shí),持續(xù)爆發(fā)的監(jiān)控遷移數(shù)據(jù)流。因此,你必須設(shè)計(jì)好QoS設(shè)置使其滿足兩種數(shù)據(jù)的需求。
注意,不論有多少帶寬可用,都可能出現(xiàn)瞬時(shí)數(shù)據(jù)爆發(fā)占用所有帶寬,從而使你的QoS設(shè)置失效。這種情況可能出現(xiàn)在數(shù)據(jù)路徑的任何一處,即便是以微秒來計(jì)算的數(shù)據(jù)爆發(fā)都嚴(yán)重影響整體傳輸性能。網(wǎng)絡(luò)阻滯可能導(dǎo)致各種數(shù)據(jù)回流,致使問題復(fù)雜化。
TrafficTrombone
創(chuàng)建DCI過程中以太網(wǎng)面臨的另一種挑戰(zhàn)是“TrafficTrombone(網(wǎng)絡(luò)內(nèi)部的信息往返流動(dòng))”(圖3)。以在線商務(wù)為例:它有面向公眾的Web/應(yīng)用服務(wù)器,該服務(wù)器可連接至內(nèi)部數(shù)據(jù)庫服務(wù)器。假設(shè),有一個(gè)VLAN已被擴(kuò)展到第二個(gè)數(shù)據(jù)中心。
如果該Web服務(wù)器在兩個(gè)數(shù)據(jù)中心間徘徊,它會(huì)保留相同的IP地址,所有數(shù)據(jù)都必須穿過DCI鏈接。如圖3所示,里面包括了出入外部用戶端的數(shù)據(jù)以及出入數(shù)據(jù)庫的數(shù)據(jù)。
另需增加的帶寬嚴(yán)重限制了該方案的可擴(kuò)展性而且還增加了帶寬的成本。供應(yīng)商正推出DNS負(fù)載平衡之類的傳輸系統(tǒng),因?yàn)檫@樣的系統(tǒng)可以隨時(shí)將數(shù)據(jù)流發(fā)送到新地址,不過它們的實(shí)用性還不足。例如,如果你的數(shù)據(jù)庫沒有用類似Web服務(wù)器這樣的監(jiān)管平臺(tái)進(jìn)行虛擬化,你如何能對(duì)推動(dòng)數(shù)據(jù)庫服務(wù)器及其相關(guān)應(yīng)用和Web服務(wù)器機(jī)制進(jìn)行管理呢?
▲
阻止循環(huán)
以太網(wǎng)為DCI的創(chuàng)建帶來了另一個(gè)技術(shù)性障礙。以太網(wǎng)創(chuàng)建于30年前,是一種本地網(wǎng)絡(luò)協(xié)議,所以當(dāng)時(shí)沒有考慮到跨機(jī)器擴(kuò)展。就設(shè)計(jì)而言,以太網(wǎng)是一種多路存取技術(shù),所以可通過網(wǎng)絡(luò)上的所有端點(diǎn)接收以太網(wǎng)廣播和多點(diǎn)傳播幀。
因此,當(dāng)主機(jī)發(fā)送以太網(wǎng)廣播或多點(diǎn)播幀時(shí),這個(gè)幀必須通過所有以太網(wǎng)進(jìn)行轉(zhuǎn)發(fā),包括DCI。當(dāng)廣播幀循環(huán)回到以太網(wǎng)網(wǎng)絡(luò)時(shí),它就會(huì)被所有交換機(jī)轉(zhuǎn)發(fā),即便它此前已被廣播。這就制造了一種快速消耗所有網(wǎng)絡(luò)帶寬的條件,而結(jié)果便是導(dǎo)致網(wǎng)絡(luò)癱瘓。
數(shù)年前開發(fā)的生成樹協(xié)議就是為了阻止這種循環(huán),而且它現(xiàn)在仍在沿用,盡管RapidSpanningTreeProtocol(RSTP)已經(jīng)在可靠性和速度方面有所超越。
問題是SpanningTree不能在長距離傳輸中效果不好。當(dāng)網(wǎng)絡(luò)延時(shí)超過250毫秒時(shí),RSTP就不再能阻止循環(huán)。
結(jié)論便是SpanningTree不能在創(chuàng)建DCI時(shí)有效阻止循環(huán)。試一下你就會(huì)發(fā)現(xiàn)它易受單向數(shù)據(jù)流的影響,而其他操作都會(huì)出現(xiàn)故障。雖然存在單向鏈路檢測(cè)協(xié)議(UDLD)這樣的補(bǔ)丁,但是運(yùn)營商的服務(wù)很有可能會(huì)攔截UDLD或是其他減少STP限制的功能。
供應(yīng)商開發(fā)出了很多技術(shù)復(fù)雜的方案用于解決循環(huán)問題。三種最常見的方案就是VPLS,MLAG/PortChannel和OTV。
#p#副標(biāo)題#e#
MPLS的變體
被廣泛用于網(wǎng)路電路管理的MPLS協(xié)議已經(jīng)擴(kuò)展為添加Layer2的方法,包括VPLS,Layer2Pseudowires和MPLS以太網(wǎng)。
VPLS是多協(xié)議標(biāo)記交換的一種形式,可以在使用MPLS的網(wǎng)絡(luò)中進(jìn)行提供透明化的LAN服務(wù)。它最顯著的性能是運(yùn)營商可以輕易將這個(gè)服務(wù)部署到現(xiàn)有網(wǎng)絡(luò)上,因此可用較少的精力和成本銷售新服務(wù)。
VPLS比較普遍,因?yàn)樵S多人都會(huì)向運(yùn)營商尋求解決方案。根據(jù)2010年InformationWeek對(duì)334位IT專業(yè)人士進(jìn)行的調(diào)查發(fā)現(xiàn)有30%的企業(yè)已經(jīng)部署了VPLS,另外有4%的企業(yè)打算在未來12個(gè)月里進(jìn)行部署。
▲WAN服務(wù)的使用
雖然這對(duì)于運(yùn)營商來說是件好事,但是如果你想通過創(chuàng)建DCI來提高應(yīng)用的可用性,那么VPLS的作用是有限的,因?yàn)榛A(chǔ)MPLS網(wǎng)絡(luò)仍然不穩(wěn)定,且延時(shí)會(huì)超過5毫秒。如前所述,延時(shí)對(duì)VM遷移或其他集群具有極壞的影響。
一個(gè)運(yùn)營商的MPLS網(wǎng)絡(luò)容易受到這些問題的影響,因?yàn)楫?dāng)網(wǎng)絡(luò)被改變,擴(kuò)展的時(shí)候,它會(huì)隨時(shí)間發(fā)生變化。MPLS也讓運(yùn)營商訂購超量帶寬。雖然每個(gè)運(yùn)營商的的訂購水平不同,但是客戶對(duì)帶寬可用性或性能并不確定。這些條件都為客戶網(wǎng)絡(luò)帶來了不確定性,而且用來監(jiān)控Layer2性能的工具也極少。
簡而言之,雖然VPLS是一種可承受網(wǎng)絡(luò)延時(shí)與不穩(wěn)定的方案,但是它不適合你想在DCI上運(yùn)行的重要應(yīng)用。
Layer2Pseudowires(L2PW),是對(duì)其他與MPLS相關(guān)技術(shù)(L2TP,,VPWS,L2TPv3等)的統(tǒng)稱,這些技術(shù)都是Layer2點(diǎn)對(duì)點(diǎn)連接。許多運(yùn)營商都提供L2PW服務(wù)是因?yàn)楸阌谒麄冊(cè)诂F(xiàn)有網(wǎng)絡(luò)上進(jìn)行部署。
對(duì)于所有VPLS和L2PW服務(wù)而言,客戶必須部署自己的阻止循環(huán)方案,因?yàn)闆]有哪項(xiàng)服務(wù)可以阻止客戶網(wǎng)絡(luò)中的循環(huán),只能在運(yùn)營商的網(wǎng)絡(luò)中進(jìn)行阻止。客戶必須確保端對(duì)端網(wǎng)絡(luò)中循環(huán)的安全。
▲新WAN方案的部署情況
EoMPLS在常被運(yùn)營商使用。許多客戶使用EoMPLS在現(xiàn)有企業(yè)或私有MPLS網(wǎng)絡(luò)上創(chuàng)建自己的L2DIC,特別是使用DWDM/暗光纖的時(shí)候。
但是VPLS只適用于EoMPLS:缺少確定性,路徑服務(wù)不穩(wěn)定和服務(wù)性能的可視性較差。建議將其作為備用方案或是當(dāng)你確信運(yùn)營商提供的服務(wù)可以達(dá)到協(xié)定水平而且你可以對(duì)此進(jìn)行監(jiān)督時(shí)才使用。
超越MPLS
當(dāng)談到應(yīng)用可用性的要求時(shí),雖然MPLS及其擴(kuò)展存在問題,但企業(yè)可能想找到它的替代物,包括MultichassisLinkAggregation和OverlayTransportVirtualization。
MultichassisLinkAggregation是用兩個(gè)端到端L2服務(wù)連接兩個(gè)數(shù)據(jù)中心的最常見方案,大多數(shù)網(wǎng)絡(luò)供應(yīng)商都具備MLAG功能,包括Avaya,思科,Dell/Force10,惠普和Juniper。
MLAG是指把兩個(gè)或兩個(gè)以上以太網(wǎng)交換裝置連成一個(gè)單獨(dú)的操作裝置的過程。其基本概念是兩個(gè)兩個(gè)交換機(jī)架都有單獨(dú)的控制面板,因此可以使用鏈接或聚合實(shí)現(xiàn)兩個(gè)以太網(wǎng)的連接。
可使用LinkAggregationControlProtocol把機(jī)架之間的以太網(wǎng)連接整合成邏輯水平的單獨(dú)連接。MLAG最適合短距離網(wǎng)路電路或是DWDM,在這樣的網(wǎng)路電路中可以訪問暗光纖,而且可以同時(shí)進(jìn)行本地L2VLAN和L3路由服務(wù)。
思科熱衷于針對(duì)非常見問題研發(fā)出解決方案,然后以專屬性能的方式提供給客戶。OverlayTransportVirtualization(OTV)也不例外。OTV將以太網(wǎng)幀包裝到IP數(shù)據(jù)包中,因此可以較低的運(yùn)營商成本在數(shù)據(jù)中心之間使用任意Layer3傳輸。
OTV為企業(yè)提供了一種很好的方式對(duì)使用現(xiàn)有L3MPLS服務(wù)的Layer2DCI進(jìn)行管理,控制和查看。雖然其部署和維護(hù)都簡便但是卻需要小心設(shè)計(jì)才能確保運(yùn)營商的服務(wù)能處理OTV數(shù)據(jù)。
但是OTV的優(yōu)勢(shì)是可以抵消許可證和硬件成本。OTV僅限于思科Nexus7000交換機(jī)和ASR9000路由。其性能取決于運(yùn)營商的基礎(chǔ)服務(wù)滿足你服務(wù)目標(biāo)的程度。
暗光纖和光波
客戶的另一個(gè)選擇是在使用暗光纖的數(shù)據(jù)中心之間部署自己的電纜。雖然這辦法可能因?yàn)檎?guī)定而難以實(shí)施,但是它卻具穩(wěn)定性而且不復(fù)雜。
如果你可以訪問自己的暗光纖,MLAG就是用于L2服務(wù)的最佳選擇。
如果暗光纖不在考慮之列,你可以搜尋DenseWavelengthDivisionMultiplexing來購買不受MPLS網(wǎng)絡(luò)問題限制的以太網(wǎng)服務(wù)。DWDM將網(wǎng)路電路多元化為鐳射波長,然后在網(wǎng)絡(luò)上復(fù)制其物理信號(hào)。你的數(shù)據(jù)沒有被轉(zhuǎn)發(fā),橋接或封裝。你的帶寬可以得到保障,而且可以完全掌控QoS,流量等。
▲無效WAN服務(wù)
不過DWDM和暗光纖的資金成本意味著必須有高回報(bào)才可行,因此許多客戶選擇同時(shí)運(yùn)行Layer3和Layer2服務(wù)。因?yàn)镈WDM/暗光纖服務(wù)是端到端的可靠帶寬而且不會(huì)與其他服務(wù)共享,你可以控制系統(tǒng)中的所有要素,而且可決定QoS,流量控制和性能。
從技術(shù)層面來講,暗光纖/DWDM是實(shí)現(xiàn)可靠和可預(yù)測(cè)網(wǎng)絡(luò)傳輸?shù)淖顚?shí)用選擇。L2鏈接控制可通過LLDP/UDLD來創(chuàng)建,而使用EoMPLS與MPLS的L3服務(wù)也可用來進(jìn)行數(shù)據(jù)隔離以滿足網(wǎng)絡(luò)安全需求。一旦你完全控制住網(wǎng)路電路,就可使用MPLS為數(shù)據(jù)中心里多個(gè)層級(jí)提供安全保障/隔離。
從商業(yè)角度來講,用于暗光纖/DWDM服務(wù)的SLA是通過確定性建立聯(lián)系。其結(jié)果是小型緊湊的MPLS網(wǎng)絡(luò)且具有一個(gè)MLAG方案的最佳性能。
注意此前我們提到運(yùn)營商的MPLS服務(wù)不是非常有力的選擇,因?yàn)橛脩羧鄙倏刂魄覍?duì)操作缺乏可視性。當(dāng)你可以自己控制帶寬時(shí)——可能是使用暗光纖/DMDW——MPLS成為了數(shù)據(jù)中心相互連接的實(shí)用工具。
▲正確連接
了解自己的局限性
或許使用Layer2DCI應(yīng)參考的建議是:規(guī)模小,結(jié)構(gòu)簡單,了解自己的局限性。如果你資金雄厚,可以選擇暗光纖或DWDM進(jìn)行關(guān)鍵任務(wù)安裝,因?yàn)橛辛朔?wù)的所有權(quán)與控制權(quán)就會(huì)有產(chǎn)出。
如果光纖或DWDM對(duì)你而言太貴了,可以尋求端到端EoMPLS服務(wù)或OTV。
注意對(duì)于很多企業(yè)而言,L2DCI都需要執(zhí)行配套的培訓(xùn)和調(diào)查研究,因?yàn)槠髽I(yè)的網(wǎng)絡(luò)設(shè)計(jì)師可能不熟悉MPLS,MLAG和DWDM。
還要注意Layer2DCI可支持少量VLAN。但是如果要擴(kuò)展到10到20個(gè)VLAN,那么規(guī)劃與對(duì)硬件供應(yīng)商和運(yùn)營商的調(diào)查就需要更多資金。誤差與錯(cuò)誤可能摧毀數(shù)據(jù)中心的網(wǎng)絡(luò),因此不推薦使用大量VLAN。
盡管DCI的使用存在極大挑戰(zhàn),但是可從操作能力,恢復(fù)能力和應(yīng)用可用性方面對(duì)其進(jìn)行平衡。
花點(diǎn)時(shí)間研究和了解相關(guān)事宜,特別是運(yùn)營商服務(wù)的可靠性問題上年要進(jìn)行了解。在通往項(xiàng)目成功與長期可靠性的道路上,你得有個(gè)好的開始。
原文鏈接:http://net.it168.com/a2011/1229/1296/000001296127.shtml