IT基礎架構不僅是一項具有戰略價值的資產,而且是現代型企業業務有效運轉與員工信息溝通關鍵基礎。對許多組織機構來說,其自身的成長壯大和新技術的迅速發展催生出極其復雜的異構網絡環境,數據中心和服務器系統平臺之間的管理開始遭遇瓶頸。
人們對網絡的絕對依賴,更加突出了服務器在信息計算體系中的核心地位。無論是運行關鍵任務的企業信息系統(包括ERP系統)程序、企業防毒體系、身份認證平臺,還是諸如Email、文件、打印和數據庫服務等核心IT服務,服務器的可用性和性能是決定這些業務能否順利運行的重要因素。但異構分布式環境的復雜性又使得服務器管理充滿了必要性和挑戰性。
服務器管理問題凸顯
在錯綜復雜的信息環境,企業要想吸取有效信息,就必須面對跨越異構環境(硬件平臺、操作系統、數據庫平臺……)帶來的層層障礙。隨著企業成長發生的變化,在異構環境下的企業數據中心,其中的數百臺各種品牌的服務器和存儲設備中跑著各種應用,管理起來就成了大問題(圖1)。
圖1
1.總體擁有成本增加
在傳統的IT 環境中,企業的每項業務都會有一套單獨的、分布在不同分支機構的IT系統來支持,配備有特定的系統管理員。在一家國際貨運公司招聘過程中,出現了一個非常“可笑”的例子:他們在南京成立分部,需要招聘5名分支代表,而其中一人必須需要懂得Linux操作系統和數據庫管理,他必須要每周將服務器的系統狀態做成報表發給總部。當然,這樣的例子并不多見,但由于企業信息化的觸角伸及到每個角落的時候,也就造成了服務器、存儲設備部署數量過多及物理位置分散的現象。不僅系統的靈活性、數據的完整性和可用性差,而且增加了整個IT基礎設施的總體擁有成本。
2.服務器運行狀況成了“迷局”
服務器運行狀態收集和分析對于正在提供服務管理功能中企業信息平臺非常重要,也對任何重大升級換代過程中的服務管理都是至關重要。通過將收集的數據和報告IT 部門核心管理層可以非常有把握地確定任何給定時間服務的總體運行狀況。操作人員可以使用這些數據來檢查任何影響服務的事件,將影響與所提供的服務相關聯,并為提供的服務制定預先響應計劃和前景展望。但在異構分布環境中不斷進行變更中,會使無法在第一時間準確的掌控它們。
在分布式異構環境中,我們通常按照自己預計的峰值負載來選擇配置服務器,并且“自以為是”的為這些服務器提供充裕的存儲空間。但在資源需求增長很快的部門卻因為服務器容量過載,不能滿足業務需求,造成服務水平下降。而有些服務器的在信息交換量很少部門卻顯得十分奢華,我們曾經對多個大型網絡進行過統計,大量的數據表明,他們一半以上分支部門的服務器平均利用率還不到20%,這是一個非常低的利用率。
3.管理人員的壓力增大
處在異構服務器管理里情景中的IT專業人員面臨著來自企業各個方面的壓力。他們要求IT環境下的一切都能“正常運轉”,例如,隨時隨地訪問信息資料并收發電子郵件;與內部團隊成員及外部合作伙伴實現即時協作;開辟更多門戶,召開更多視頻會議,并提供其它協作工具;允許以自助方式調用基礎架構服務。
另外,人工干涉導致的系統錯誤具有很高的挑戰性,幾乎不可能完成。在效率低下的同時,還具有很大的隨意性。當系統發生故障后,用戶很難立刻根據表面現象判斷出故障的真正原因,服務器管理人員和網絡管理人員會根據經驗一步一步地檢查故障,很容易出現人為錯誤。尤其是分支機構中的管理員,他們不可能人人都是個“全面手”,不可能面對不同版本的操作系統、數據庫系統、Web應用系統、郵件系統都成為專家。
擴大管理范疇 決勝千里之外
20年前,Gartner Group就提出了SOA(Service Oriented Architecture,面向服務的架構)概念,其基本思想是以服務為核心。所以,現今的服務器管理也不僅僅是服務器硬件本身,而是在服務過程中監管應用效能,以及檢測系統應用中出現的瓶頸和潛在問題,并能夠從危急情況中自動恢復。對CIO而言,需要保證運行維護的規范性以減少意外的發生,同時需要掌握各種資源(網絡設備、網絡帶寬、服務器、各種終端)的利用情況,為網絡優化和服務器資源擴容提供強有力的依據。游龍科技根據多年的研究和經驗積累,將服務器管理軟件擴展到網絡架構中的各個方面,它們包括:
- 反映服務的總體運行狀況,集中顯示特定方面的數據;
- 反映服務器運行狀況和性能的基礎結構數據;
- 反映特定用戶體驗的客戶端數據,例如連接時間、連接成與失敗的特定操作;
- 影響服務和用戶工作效率的問題;
- 有關進行預算和規劃所需的最高操作成本的詳細信息。
實時全面的信息收集,對大量分散服務器集中管理的環境應用優勢尤為明顯。
服務器子元素的采集
監控服務器系統靜態信息(CPU、內存、硬盤、光驅、網卡、顯卡、操作系統、RAID卡、PCI附加卡等信息)和動態信息(主板、CPU、SCSI 模組、風扇板等設備的溫度、電壓、風扇轉速信息以及CPU利用率、內存利用率、硬盤I/O訪問流量等系統資源信息),以及實現對RAID陣列的管理;
外部環境的掌控
系統管理更注重收集網絡內運行的數據信息,提供網絡的性能統計, 并完成性能分析與容量規劃。分析歷史統計數據,優化網絡性能,消除網絡與主機中的瓶頸。網絡負載的合理安排、網絡資源的高效利用都是服務器單一角色所不能決定的。
只有采用集中式監控管理平臺,才能實現外部環境的安全掌控。不但要提供KVM監控、性能監控、安全監控、告警監控、角色管理和權限認證,還需要克服異構網絡中的局部性,為系統管理員提供基于層次結構的全局資源統一視圖。監控管理平臺需要提供對不同品牌服務器的服務器監控管理工具的集成接口,從而實現同時對各類服務器進行全局資源監控和管理。
智能的處理流程
以往的監控平臺,只能實現:在上述被監控對象發生超越門限等異常事件時,監控軟件會通過多種形式(消息框、郵件、告警音、短信)告警,同時將告警事件記錄入日志,方便管理員根據告警日志分析診斷。而智能的處理流程是一種質的轉變,當然,它并不是指監管平臺能夠進行邏輯推理,智能是對“新事件”而言的,平臺應該可以自動學習,并存入知識庫作為經驗積累,也可以與知識庫進行對比,從紛繁復雜的現象中發現服務器故障的本質。
服務器管理的發展方向
當前不同服務器廠商均提供獨立的服務器監控管理工具,但在企業的網絡信息中心仍然無法統一地對不同廠商的服務器進行監控、管理、報警、配置。另外,企業核心區域的服務器都是承擔關鍵應用,這些應用對于用戶來說絕對是7*24小時需要保障地。
例如:基于Web應用的關鍵站點,通常分為三層結構模式:Web服務器、應用服務器和數據庫服務器。Web服務器承擔Web訪問量,應用服務器完成相應的數據調用,數據庫后臺則承擔數據請求。由于關鍵應用對數據的可用性、可靠性和安全性具有嚴格要求,所以我們必須需要一種能夠將這些應用劃分到一個集合中,同一進行管理的平臺。
SiteView綜合系統管理,它專注對局域網、廣域網和互聯網上的應用系統、服務器和網絡設備的故障監測和性能管理。能夠將異構環境中的關鍵應用系統、網絡設備、服務器、中間件、數據庫、郵件系統、WEB系統、DNS系統、FTP系統、電子商務等進行全面深入的監測管理。不但可以根據企業的網絡拓撲,還可以將異構網絡中的關鍵服務器進行邏輯分組管理。通過友好界面來簡化系統引導、電源、存儲、驅動器固件與軟件、關鍵業務運行狀態的管理。這都為企業跨平臺、跨網絡、全面地服務器監控提供了安全的解決方案,我們將整個IT架構中的核心(服務器),安心的放在您掌骨之上。與您同行,在異構環境中實現簡單管理,開創企業信息化的新時代。