亚洲成精品动漫久久精久,九九在线精品视频播放,黄色成人免费观看,三级成人影院,久碰久,四虎成人欧美精品在永久在线

掃一掃
關注微信公眾號

游龍科技解讀金融企業大規模服務器集群運維
2010-01-11   網絡

服務器運行狀態收集和分析對于業務平臺至關重要,這也是服務器管理中最基本的組成部分。而如今在各行業中都廣為出現的服務器集群(Server Cluster),在客戶端來講他們是隱型的,而在管理員眼中則需要分而治之,當群集中的服務器數量越來越多的時候,運維人員應該如何具體的進行監控和管理呢?游龍科技(SiteView)作為國內領先的IT運維廠商,在大量金融行業實施案例的基礎上,對于服務器集群的監控和管理提出了嶄新的觀點。

服務器集群(Clusters)的“亞健康”

服務器集群提供了改進的容錯能力和模塊化的系統擴展能力,一旦某個系統出現故障,應用服務將被重新啟動或被另一臺服務器接管,這正符合了金融行業客戶的廣泛需求。網上業務量的大量增長,使得服務器集群在這些企業中的應用大量出現。作為高可用性和穩定性的代表,服務器集群的應用本是無可挑剔的,但仍有一些企業牽動這些“大象”時,卻依然在使用過時的技術。舉例來說,一個服務器集群的運行狀況,一般就代表一個核心業務系統的可用與否的關鍵因素,傳統監控方法僅僅簡單地認為集群中的某臺主機“可用”或“不可用”兩種狀態。

游龍科技認為:“正是因為管理人員對于集群系統的過分信任,才會導致判斷它時采用這樣簡單的做法,但這只考慮了兩種極端的狀態,顯然無法對集群系統的健康狀況進行全面分析”。根據農發行、上海交行、新華期貨、金石期貨、江海證券、中海基金……等國內大量游龍科技的客戶實際應用中,我們對各種服務器應用集群進行了監控,大量的情況證明系統從“可用”轉向“不可用”并非是瞬間發生,而存在一個相當繁瑣的過程。在這個過程中,系統的某些核心指標將會提前顯示出異常,雖然此時系統對外表現出的仍然為“可用”,但整個系統實際已經處于“亞健康”,對客戶端的請求反應逐漸變慢,系統出現不穩定的跡象,系統整體可用性逐漸降低,如果不進行任何干預,系統在未來某個時點將有極大可能轉化為真正“不可用”,從而導致災難性的后果。

服務器集群(Clusters)運維“三步走”

集群中每臺服務器都應該得到同樣的關注,而如何整體監控到整個集群的好壞呢?游龍科技認為可以采用這樣的步驟:“先做到監控單臺服務器的性能,然后根據業務進行分組,最后針對集群整體性能實時監控”。

第一步:全面掌控集群運行的基本信息。在沒有有效工具幫助的情況下,服務器集群的維護工作異常繁重,同時也直接影響了運行的效果。管理人員首先可以利用SiteView ECC實時全面的信息收集,如對服務器靜態指標(如:操作系統類型、版本、CPU型號、CPU個數、物理內存和交換空間的大小等)收集上來,然后將動態指標(如:系統連續運行時間、CUP、內存、磁盤分區使用率、某一進程占用的系統資源、某一進程在系統中的數目等)在管理平臺上設置儀表盤或者直方圖顯示,做好最基本的監控管理。

第二步:根據業務狀況將集群進行對應分組。可通過SiteView ECC的分組功能將服務器、存儲和網絡設備針對業務進行分組。分組功能相當重要,為什么這么說呢?在20年前,一個典型的銀行僅提供3-5種業務,但是現在,主要業務就達幾十乃至上百種。這包括:抵押貸款、個人貸款、儲蓄,以及信用卡賬戶和內部協同管理服務器群等等,如果不分組的話,在管理員眼里這些系統還都是單獨的,這也就失去了整體運維的作用。管理員利用分組功能之后,就可使用SiteView ECC內置的幾十種監測器,通過對業務服務主機進行定時和實時的監測,提供其需要的業務服務水平數據,包括業務系統所經路經的延遲、丟包、流量、網絡停頓時間和網絡可用率更詳細數據的管理。

第三步:全面預警,深化調優。管理員可通過SiteView ECC可定制的監測器功能對集群性能整體進行監管。例如:反映集群服務的總體運行狀況,集中顯示特定方面的數據;反映服務器運行狀況和性能的基礎結構數據;反映心跳線中數據檢測的正常工作;反映可能出現服務器切換的響應時間;反映特定用戶體驗的客戶端數據,例如連接集群時間、連接成與失敗的特定操作等等。并根據指定的邏輯與給定閥值進行比較,如果滿足該邏輯,則進行報警。報警方式可選擇郵件或者手機短信息。并且還可以將采集來的數據存入SiteView ECC數據庫,作為數據挖掘,集群性能分析的數據源。

游龍科技針對服務器集群的運維方向的研究已經被眾多的金融企業所應用。以上海交行為例,SiteView ECC被安裝在核心服務器上,能夠對上海交行的上千臺服務器進行統一的監測,通過一個界面能夠看到整個服務器集群的運行狀況,全面掌握服務器區的運行,這樣就可不用部署復雜繁多的設備來監控大規模的服務器集群。與上交行的感觸相同,很多金融企業中的運維人員紛紛表示:“我們的系統必須能夠每天 24 小時、每周 7天不間斷地工作。此外,我們還需要簡化數據中心,以便快速部署系統來應對需求波動,SiteView ECC強大的功能讓我們感到驚訝。對于那些正在尋找任務關鍵型數據中心運維解決方案的人來說,也可以方便的滿足用戶自己的配置定義和功能擴充要求。”

熱詞搜索:

上一篇:在危機中呈現轉機的網絡管理
下一篇:攜手走向卓越:SiteView與農發行共建網絡標準化運維

分享到: 收藏