數據中心基礎設施的可用性問題,最初是由IT廠商提出的,如IBM提出的“隨需應變”(OnDemand)、HP提出的“動成長企業”(AdaptiveEnterprise)等概念,它們都推崇“逐步升級”的擴展模式,來替代“一步到位”的建設模式。全球經濟環境變化的加劇,正是用戶對可擴展性的要求逐漸提高的根本推動動因。
數據中心由兩個層面組成——IT層面和機房設施層面。機房設施的擴展性需求,是IT層面的擴展性對運行環境的靈活性的訴求。與IT層面的擴展性相比,機房設施的可擴展性實現起來更困難一些,就好比前者是家具,后者是房間。
機房設施的擴展方式,或稱擴容方式,從目前國內的情況看,“一步到位”的方式與“逐步升級”的方式,都因用戶需求各異而共存著。實際上,這兩種方式確實各有千秋。從機房設施的工程實踐上看,前者易、后者難;從投資風險上看,前者大、后者小;從投資、運營的過程和管理上看,前者簡便、后者繁瑣。所以,對于業務相對穩定的企業用戶,更愿意選擇前者;而業務發展迅速或市場風險高的企業,則更愿意選擇后者,即對機房設施的可擴展性要求高,希望“隨需應變”。
用戶對機房設施“隨需應變”的要求,對機房的規劃、設計、設備選型、運行維護等四個環節及電源、空氣調節、防雷、機柜、監控等五個子系統(有時將防雷納入電源子系統)提出了挑戰。
一、規劃
在規劃環節,首先需要在數據中心機房選址問題上考慮擴展性的要求,包括對面積、樓層位置、樓層凈高、地面載荷等方面的要求。
如果決定采用單一房間,顯然要考慮未來擴容時的IT設備及機房設備的面積需求;另外可行的方案是,擴容時占用其他房間——在這種情況下,需要同時對欲占用的房間進行同樣的結構評估,包括樓層位置、樓層凈高與承重。
樓層位置主要影響空調室外機房的放置問題。一般情況下,空調室外機與機房的垂直距離不宜超過15米,所以機房的選址樓層多選在距離樓頂、底層或設備層較近的樓層,并在樓頂、底層或設備層中預留足夠的空間,以備未來機房空調系統擴容時,安裝空調室外機。
如果未來擴容時計劃不擴大機房面積,而是增大機房內的設備密度(或機架數量),則必須考慮未來的設備重量與機房地板承重。
二、設備選型
設備選型環節應考慮的問題很多,以下分為子系統來討論。
1、供電子系統
從供電子系統來看,需要考慮包括UPS、供電線路、配電線路等在內的整體的可擴展性。
對于一般規模數據中心機房來講,可以不考慮擴容對電力變壓器的要求,但是需要考慮機房供電線路的容量問題。由于供電線路的擴容改造工程比較復雜,所以建議在機房初建時,應預留能夠滿足未來機房設備擴容需求的容量,其中應特別注意空調機、新風機等其他設備的負荷問題。
對于機房主輸入開關的配置,有三種方案可以選擇。如果采用“一步到位”的方案,則擴容時不必斷開此開關及上級主開關,不存在機房輸入市電中斷的情況,但缺點是在機房運行初期由于開關容量過大,發生負載故障時,存在動作不靈敏的可能及線路火災隱患。采用“逐步升級”即每當擴容時更換主開關的方案,則不存在以上隱患,但缺點是擴容時需斷電。折中方案是根據擴容前后的容量,預先安裝兩個或多個空氣開關,根據某一階段的實際負載量,啟用一個、兩個或多個空開,這種方式能夠解決斷電隱患和火災隱患。
在機房的設備投資中,UPS占有很大比重,所以UPS的擴展性問題更應引起關注。目前,隨著半導體技術、電力電子技術、控制技術的發展,UPS技術已日瑧完善與成熟,并機技術已經被廣泛采用,從而為不停機擴容提供了技術保障。而模塊化技術的發展,則使UPS的擴容變得異于尋常地簡便——就像直流電源模塊的擴容一樣,推拉之間便可完成增加或更換模塊,完成系統擴容或修復。但是與整機模式相比,模塊化設計的模式的單位容量制造成本較高,并且單模塊的容量不宜做得很大,這使得模塊化UPS更常用于有冗余要求的方案中,尤其是N+1冗余配置的場合,以改善整個UPS系統的經濟性。
對于UPS輸出配電的選擇也不容易忽視。輸出配電包括配電柜和機柜內電源插排及線纜連接等。資料顯示,40~50%的負載斷電故障的原因是由于輸出配電而不是UPS或電池組的問題(數據來源:司安瑞咨詢,2004年),而其中有許多案例往往發生在輸出擴容過程中(如支路過載、電源插排接觸不良等問題)。配電環節投資比重很低,建議用戶在選用時應注意配電部件的產品品質,并且在機柜內杜絕使用非機柜專用插排,擴容前檢測每一支路的負載電流情況,配電柜應預留足夠支路空開位置,盡量選用可熱插拔的空開等。
2、空氣調節子系統
空氣調節子系統包括數據中心機房專用空調機設備、新風機設備等組成的氣流發生系統以及氣流組織、配送系統。氣流發生系統用來產生恒溫、恒濕、潔凈的氣流,其容量根據設備的熱負荷決定,擴容時主要考慮空間、承重問題和供電容量等問題(見前文)。
氣流配送系統用來形成合理的氣流組織,將氣流分配、輸送到IT設備。如果整個機房的擴容采用不增加面積、而增加設備密度的方式,氣流配送系統的擴容將必須考慮更多的因素。與配電回路中的電阻、壓降可以忽略不計相反,氣流配送回路中的風阻和風壓的降落不可忽略,而且可能比負荷(IT設備等)本身的風阻、風壓降落還要大;更嚴重的是,回路參數與許多變動的現場環境條件有關,如地板開口面積、數量、位置、機房密閉程度、IT設備放置位置、角度、方向、機鄰機柜之間的距離和相對位置、機柜柜門的開孔率、地板高度等等。為了給擴容時提供變化余地,需要在機房初建時盡量減少固定風阻,如地板下送風風阻。減小送風風阻的方法有:增加高架地板高度(國家標準《電子計算機機房設計規范GB50174-93》中規定,地板敷設高度宜為200~350mm,但國內有經驗、有條件的用戶已經建設高度為600mm的機房);規范地板下線纜鋪設工藝;保證機柜上部凈高以以及回風通路載面積。國內經常出現忽視樓層凈高問題,而導致擴容后部分IT設備運行溫度過高的情況,如某地板高度為150mm的機房,在擴容時被迫遷址的案例。另外常見的案例是錯誤選用普通空調機而出現擴容后無法克服回路風阻、提供足夠的風量而使IT設備超溫的情況。
3、機柜子系統
機柜子系統越來越受到重視。IT設備的機架化勢不可擋,以至于非機架或設備(如塔式服務器)也“借機”上架了。正如美國可用性研究中心提出的“IT微環境”概念所提示的那樣,機架(機柜)正在成為IT設備的“新家”,或者說,機柜內的微環境,才是所謂的“機房環境”,更有研究專家稱:“機柜即機房”。在某種程度上講,至少在機房的物理空間層面上講,機柜確實可以理解為被“切割成模塊的機房”。
數據中心機柜的擴展性表現在機柜內設備密度的擴展和機柜數量的擴展。
一般情況下,用戶在機房初建時都在機柜內預留了相當寬裕的空間,以42U機柜為例,通常所有設備只占據10~20個U,所以表面上看,在空間上具有100~200%的擴展性。但是,實際的擴展性都遠非如此樂觀,因為必須將機柜的配風能力(通常稱為散熱能力)以及配電能力考慮在內。
首先,機柜內的設備需要溫度、濕度適宜并且風量充足的冷風(冷空氣),這些冷風被機柜內的IT設備吸入,從而為設備內的部件尤其是CPU降溫。當機柜內設備數量增加到一定數量時,由地板出風口送出的冷風的風量將不能滿足所有設備的需求,從而形成部分IT設備配風不足而過熱,形成局部熱點。風量的分配由包括出風口風壓、出風口面積等的許多因素決定,在冷風從地板出風口向上排出后的上升過程中,動壓不斷下降,從而引起位于機柜不同高度的設備的配風量分布很不均勻。而且,當出口風速比較小時,動壓不夠強,冷風不能被送到機柜上部的設備,使上部設備過熱;而加大出口風速,雖然能夠解決機柜上部的送風問題,但會引起機柜下部位置的凈壓過低甚至產生負壓(射流效應),從而使下部設備配風不足,引起過熱。
解決機柜內設備密度擴展時遇到的這種局部熱點問題,可以采用調配IT設備位置的方式來解決。例如,把熱負荷最大的設備,安裝在機柜中部位置,以便獲得最大的配風風量。另外的解決方法是,在機柜的上部或下部位置,安裝軸向水平的強排風扇,增強上部或下部的吸入能力(即減小IT設備的入口靜壓),從而增加配風風量。值得注意的是,早期機柜的頂部通常都安裝有垂直軸向的、向上排風的強排風扇,但這種風扇對目前的標準IT機柜沒有任何作用,因為現在所有的機架式IT設備均為前進風、后排風。
其次,機柜內的設備需要供電以及與機柜外部的通訊聯絡。當機柜內的IT設備數量增加時,這些線纜、連接端子同時成倍地增加,從而對機架式電源排插的容量、插口數量都提出了擴展要求。如果要增加電源排插的數量,則需要考慮是否有留有空間、在配電柜上是否留有空開及接線位置。機柜內的布線空間也是需要提前考慮的,因為當機柜內的功率密度提高時,設備后部的線纜將明顯增加風阻,所以必須考慮線纜管理及走線空間的問題。
數據中心機柜數量的擴展方式,則主要要求機柜外部的擴展條件,考慮問題的內容被包含在機房的擴展問題中。
4、防雷子系統
數據中心防雷子系統包括機房內的電源防雷和信號防雷,不包括建筑物防雷。其擴展性比較容易實現。
數據中心防雷子系統由接地系統和各級防雷器組成。接地系統的規格與機房擴容的關系不大;電源防雷器安裝在開關柜中,其規格則與被保護負載的容量無關,其安裝數量與設備數量(空開數量)有關;信號防雷器直接串在信號線纜一端或兩端,基本不占用空間。所以,防雷系統在擴容時的要求,主要是開關柜中占用卡排的空間位置。只要在機房初建時防雷子系統按照標準設計和建設,并在開關柜中預留足夠的空間位置,防雷子系統的可擴展性很容易得到保證。
5、監控子系統
數據中心機房監控子系統的可擴展性表現在硬件層面和軟件層面。
與其他子系統的物理設施相比,監控子系統硬件層面的擴容比較容易實現,因為無論是傳感器還是變送器、采集器以及布線均不消耗太多功率、不占用太大空間,擴容時對供電容量和空間要求都很小。
軟件層面則更靈活一些。雖然需要考慮監控軟件的兼容性、可升級性、以及管理節點的可擴展性,但這些問題多半不是技術問題,而是商業(費用)問題。軟件的升級甚至是重新安裝新版本,都可以很容易地、對機房運行沒有任何影響地進行。
可擴展性是IT發展的重要趨勢之一,許多用戶無論對硬件、軟件還是機房基礎設施,都希望能隨著業務的調整而變化。而要實現這種擴展性,需要在規劃設計、設備選型階段時就要開始考慮,從而為將來留下發展的空間。