服務器的安全性能要求非常高,這主要體現在RAS性能上。RAS性能指的是機器的可靠性(Reliability)、可用性(Availability)和可服務性 (Serviceability)。RAS能力主要看幾個方面:System 級別的RAS特性、CPU RAS特性、內存RAS特性、I/O RAS特性等。可以看出,RAS性能是個綜合性指標,對于不同行業用戶而言,其對RAS性能的要求是不盡相同的。
CPU和內存的RAS性能尤其重要
服務器內存的RAS特性最為關鍵,因為服務器的所有計算機幾乎都是跑在內存中的,內存的好壞決定了服務器是否能正常工作。可以說程序不是寄存在服務器上,而是寄生在內存中的。根據 Google 與一些機構的合作研究表明,內存錯誤率其實比想象中的要高(refer),內存也因為老化等原因會出現性能降低,這是個很有參考價值的信息。據寶德客服人 員反映,有些寶德服務器也連續跑了五年而從沒有停過機,直到設備更新時查看工作記錄才發現,程序運行起來后就從來沒停過機。現在許多X86服務器銷的賣點宣傳也多集中在內存上,比如內存的 ECC 特性,Spare Row、Chip Kill、Single Device Data Correction (SDDC)等,其中Chip Kill是IBM的專利技術,主要用在高端服務器上。
CPU處理器的RAS性能也非常關鍵。英特爾早 先推出的Xeon 7500系列處理器,將Xeon平臺的可靠性、可用性和可維護性(RAS)帶到新的高度,將原本只為RISC架構專屬的諸如機器校驗架構(Machine Check Architecture,MCA)等特性的移植,也使Xeon 7500平臺在面向高端關鍵性業務應用時底氣更足。Xeon 7500的推出,是Intel志在關鍵應用市場一展身手的重要一步。
最近英特爾更是推出了Xeon E7、XeonE5系列處理器,繼承了許多大型機開發中驗證過的RAS技術。通過所有CPU電路間的錯誤檢測和恢復機制,避免CPU錯誤帶來的系統故障。并可保證CPU內部的數據傳輸和存儲的隨機錯誤通過ECC 數據糾正處理和指令重試技術恢復。即使不可恢復的錯誤發生時,CPU也不會停止,只會繼續記錄所有的錯誤信息,因此任何錯誤原因都能迅速檢測出來。Xeon E7以英特爾上一代Xeon 7500為基礎,建立了面向諸多高端計算應用,包括商業智能、實時數據分析和虛擬化的全新標準。這些全新的處理器還提供高級安全特性,可確保更好的數據完整性,以鞏固數據中心的安全防線。
RAS能力在不同行業側重點也有不同
RAS能力是評判服務器的重要標準,但是由于RAS能力提升了服務器的制造成本,所以行業應用中,用戶只關心自己最需要的那些RAS指標,而不是面面俱到地要求服務器各方面的RAS性能都非常拔尖。
可靠性(Reliability)在行業中的應用主要是雙機熱備份。雖然安騰小型機、 高端服務器如PR4840R也有很高的穩定性,但是在一些關鍵應用中,還是有用戶喜歡用雙機熱備的方式。雙機熱備份就是一臺主機為工作機,另一臺主機為備 份機,在系統正常情況下,工作機為信息系統提供支持,備份機監視工作機的運行情況,工作機也同時監視備份機是否正常,有時備份機因某種原因出現異常,工作 機可盡早通知系統管理工作人員解決,確保下一次切換的可靠性。當工作機出現異常,不能支持信息系統運營時,備份機主動接管工作機的工作,繼續支持信息的運 營,從而保證信息系統能夠不間斷地運行。當工作機經過維修恢復正常后,它會將其先前的工作自動抓回,恢復以前正常時的工作狀態。
金融、電力、醫療等行業,因為對計算可靠性要求非常高,所以習慣采用這種雙機熱備的方式。
可用性(Availability)是指系統被請求使用時可能迅速反饋并被正確操作的可能性。行業應用中的許多關鍵業務是不能在運行中出現間斷的,包括商業智能分析、業務流程處理(交易處理和ERP等)、核心數據庫等,特別是政府、國防、安全、電信、金融、交通、醫療等關系到國民生計的企業和機構所運行的這類應用。
關鍵業務的特性決定了其應用的運行一旦出現意外中斷就會造成極大的、甚至是無法彌補的不良影響及損失,這就對支持它的IT平臺,特別是承載它的 服務器提出了非常嚴格的要求。比如亞馬遜在幾年前停機一分鐘損失可達5萬美元,現在停機一分鐘損失則可達幾十萬美元計。在一些金融證券交易中,更是一雇刻 千金。雙備份可以迅速恢復系統性能。另外還有多子星系統,滿足多節點服務需求等。另外許多應用可以提供方案遠程管理,虛擬化應用等,提高可用性。
在高鐵運營管理中用到一種SSI標準刀片服務器,有6個計算刀片和14個存儲刀片,集成度高,非常適合于分散狀況下的高鐵運營管理。整個解決方案采用PR6000M刀片服務器與寶德的雙機熱備軟件。兩臺刀片服務器與一套雙機熱備軟件組成雙機熱備系統,兩臺服務器通過心跳線相連,兩臺服務器構成主從工作模式,為前端應用服務器提供不間斷的后臺支持,在一臺服務器出現故障時,另一臺服務器承擔全部工作負荷,直至故障服務器被修復。一臺刀片服務器就集中多個子系統,還進行雙機熱備,真正解決了集中管理與安全穩定的問題。
可維護性(Serviceability)對于要處理的數據量非常巨大,而又要求實時、動態和效率時,其承載平臺要有非常出色且易于擴展的高性能處理能力。比如內存的擴充和硬盤的擴充,如寶德的模塊化服務器,存儲服務器等。
例如某銀行的核心業務數據庫要求確保24*7小時不宕機。為此將核心業務數據庫部署在寶德PR6850N服務器雙機系統上,該服務器為6U四路服務器,擁有超過20項RAS特性,在同城兩個機房的兩臺GS8810FD磁盤陳 列上,將核心交易系統及外圍系統業務布置在虛擬機上。兩臺PR6850N部署的虛擬機可以互相接管,實現業務不中斷,同時虛擬機部署到存儲上實現整個虛擬 機連同業務和數據庫的備份;同城的異地機房存儲設備間的鏡像,完成了業務邏輯層的容災。該方案不僅實現了比原有小型機更高的可擴展性。
需要提醒大家注意的是,服務器的RAS 能力實際上是需要提升成本來實現的,所以用戶在服務器選型的時候需要考慮實際需求和性價比,還是應該按照自己的行業需求來選擇自己的服務器。例如做為托管 的服務器只要穩定運行即可,并不需要太高的性能。而影視藝術、教育和科研類應用,主要希望運算性能更強,并不一定需要考慮雙機熱備。而除法院系統外,其他 系統要求視頻數據實時備份也比較少。