亚洲成精品动漫久久精久,九九在线精品视频播放,黄色成人免费观看,三级成人影院,久碰久,四虎成人欧美精品在永久在线

掃一掃
關(guān)注微信公眾號

游龍科技解讀金融企業(yè)大規(guī)模服務(wù)器集群運維
2010-01-11   網(wǎng)絡(luò)

服務(wù)器運行狀態(tài)收集和分析對于業(yè)務(wù)平臺至關(guān)重要,這也是服務(wù)器管理中最基本的組成部分。而如今在各行業(yè)中都廣為出現(xiàn)的服務(wù)器集群(Server Cluster),在客戶端來講他們是隱型的,而在管理員眼中則需要分而治之,當群集中的服務(wù)器數(shù)量越來越多的時候,運維人員應該如何具體的進行監(jiān)控和管理呢?游龍科技(SiteView)作為國內(nèi)領(lǐng)先的IT運維廠商,在大量金融行業(yè)實施案例的基礎(chǔ)上,對于服務(wù)器集群的監(jiān)控和管理提出了嶄新的觀點。

服務(wù)器集群(Clusters)的“亞健康”

服務(wù)器集群提供了改進的容錯能力和模塊化的系統(tǒng)擴展能力,一旦某個系統(tǒng)出現(xiàn)故障,應用服務(wù)將被重新啟動或被另一臺服務(wù)器接管,這正符合了金融行業(yè)客戶的廣泛需求。網(wǎng)上業(yè)務(wù)量的大量增長,使得服務(wù)器集群在這些企業(yè)中的應用大量出現(xiàn)。作為高可用性和穩(wěn)定性的代表,服務(wù)器集群的應用本是無可挑剔的,但仍有一些企業(yè)牽動這些“大象”時,卻依然在使用過時的技術(shù)。舉例來說,一個服務(wù)器集群的運行狀況,一般就代表一個核心業(yè)務(wù)系統(tǒng)的可用與否的關(guān)鍵因素,傳統(tǒng)監(jiān)控方法僅僅簡單地認為集群中的某臺主機“可用”或“不可用”兩種狀態(tài)。

游龍科技認為:“正是因為管理人員對于集群系統(tǒng)的過分信任,才會導致判斷它時采用這樣簡單的做法,但這只考慮了兩種極端的狀態(tài),顯然無法對集群系統(tǒng)的健康狀況進行全面分析”。根據(jù)農(nóng)發(fā)行、上海交行、新華期貨、金石期貨、江海證券、中海基金……等國內(nèi)大量游龍科技的客戶實際應用中,我們對各種服務(wù)器應用集群進行了監(jiān)控,大量的情況證明系統(tǒng)從“可用”轉(zhuǎn)向“不可用”并非是瞬間發(fā)生,而存在一個相當繁瑣的過程。在這個過程中,系統(tǒng)的某些核心指標將會提前顯示出異常,雖然此時系統(tǒng)對外表現(xiàn)出的仍然為“可用”,但整個系統(tǒng)實際已經(jīng)處于“亞健康”,對客戶端的請求反應逐漸變慢,系統(tǒng)出現(xiàn)不穩(wěn)定的跡象,系統(tǒng)整體可用性逐漸降低,如果不進行任何干預,系統(tǒng)在未來某個時點將有極大可能轉(zhuǎn)化為真正“不可用”,從而導致災難性的后果。

服務(wù)器集群(Clusters)運維“三步走”

集群中每臺服務(wù)器都應該得到同樣的關(guān)注,而如何整體監(jiān)控到整個集群的好壞呢?游龍科技認為可以采用這樣的步驟:“先做到監(jiān)控單臺服務(wù)器的性能,然后根據(jù)業(yè)務(wù)進行分組,最后針對集群整體性能實時監(jiān)控”。

第一步:全面掌控集群運行的基本信息。在沒有有效工具幫助的情況下,服務(wù)器集群的維護工作異常繁重,同時也直接影響了運行的效果。管理人員首先可以利用SiteView ECC實時全面的信息收集,如對服務(wù)器靜態(tài)指標(如:操作系統(tǒng)類型、版本、CPU型號、CPU個數(shù)、物理內(nèi)存和交換空間的大小等)收集上來,然后將動態(tài)指標(如:系統(tǒng)連續(xù)運行時間、CUP、內(nèi)存、磁盤分區(qū)使用率、某一進程占用的系統(tǒng)資源、某一進程在系統(tǒng)中的數(shù)目等)在管理平臺上設(shè)置儀表盤或者直方圖顯示,做好最基本的監(jiān)控管理。

第二步:根據(jù)業(yè)務(wù)狀況將集群進行對應分組。可通過SiteView ECC的分組功能將服務(wù)器、存儲和網(wǎng)絡(luò)設(shè)備針對業(yè)務(wù)進行分組。分組功能相當重要,為什么這么說呢?在20年前,一個典型的銀行僅提供3-5種業(yè)務(wù),但是現(xiàn)在,主要業(yè)務(wù)就達幾十乃至上百種。這包括:抵押貸款、個人貸款、儲蓄,以及信用卡賬戶和內(nèi)部協(xié)同管理服務(wù)器群等等,如果不分組的話,在管理員眼里這些系統(tǒng)還都是單獨的,這也就失去了整體運維的作用。管理員利用分組功能之后,就可使用SiteView ECC內(nèi)置的幾十種監(jiān)測器,通過對業(yè)務(wù)服務(wù)主機進行定時和實時的監(jiān)測,提供其需要的業(yè)務(wù)服務(wù)水平數(shù)據(jù),包括業(yè)務(wù)系統(tǒng)所經(jīng)路經(jīng)的延遲、丟包、流量、網(wǎng)絡(luò)停頓時間和網(wǎng)絡(luò)可用率更詳細數(shù)據(jù)的管理。

第三步:全面預警,深化調(diào)優(yōu)。管理員可通過SiteView ECC可定制的監(jiān)測器功能對集群性能整體進行監(jiān)管。例如:反映集群服務(wù)的總體運行狀況,集中顯示特定方面的數(shù)據(jù);反映服務(wù)器運行狀況和性能的基礎(chǔ)結(jié)構(gòu)數(shù)據(jù);反映心跳線中數(shù)據(jù)檢測的正常工作;反映可能出現(xiàn)服務(wù)器切換的響應時間;反映特定用戶體驗的客戶端數(shù)據(jù),例如連接集群時間、連接成與失敗的特定操作等等。并根據(jù)指定的邏輯與給定閥值進行比較,如果滿足該邏輯,則進行報警。報警方式可選擇郵件或者手機短信息。并且還可以將采集來的數(shù)據(jù)存入SiteView ECC數(shù)據(jù)庫,作為數(shù)據(jù)挖掘,集群性能分析的數(shù)據(jù)源。

游龍科技針對服務(wù)器集群的運維方向的研究已經(jīng)被眾多的金融企業(yè)所應用。以上海交行為例,SiteView ECC被安裝在核心服務(wù)器上,能夠?qū)ι虾=恍械纳锨_服務(wù)器進行統(tǒng)一的監(jiān)測,通過一個界面能夠看到整個服務(wù)器集群的運行狀況,全面掌握服務(wù)器區(qū)的運行,這樣就可不用部署復雜繁多的設(shè)備來監(jiān)控大規(guī)模的服務(wù)器集群。與上交行的感觸相同,很多金融企業(yè)中的運維人員紛紛表示:“我們的系統(tǒng)必須能夠每天 24 小時、每周 7天不間斷地工作。此外,我們還需要簡化數(shù)據(jù)中心,以便快速部署系統(tǒng)來應對需求波動,SiteView ECC強大的功能讓我們感到驚訝。對于那些正在尋找任務(wù)關(guān)鍵型數(shù)據(jù)中心運維解決方案的人來說,也可以方便的滿足用戶自己的配置定義和功能擴充要求。”

熱詞搜索:

上一篇:在危機中呈現(xiàn)轉(zhuǎn)機的網(wǎng)絡(luò)管理
下一篇:攜手走向卓越:SiteView與農(nóng)發(fā)行共建網(wǎng)絡(luò)標準化運維

分享到: 收藏