在云計算、大數據浪潮席卷全球的大背景下,數據中心市場在經歷金融危機后,重新回歸快速增長通道。數據顯示,2011年,我國數據中心服務市場規模達到1587.5億元,同比增長18.6%,預計到2015年,規模將達3031.1億元,年復合增長率為17.8%。巨大的市場蛋糕使各地開始大規模建設數據中心。
對于這些數據中心的建設,建設者和管理者往往將目光聚焦在其“綠色標簽”上,從照明、制冷的節能,到IT基礎設施的功耗,都會被上上下下掃描一番。在這種形勢下,“高大全”的數據中心建成了。如果說數據中心的正式運營標志了啟動了其生命起點,而對于其生命周期中的系統維護,則將伴隨著數據中心度過漫長的數十年。
在一些數據中心管理者的眼中,數據中心IT運維并不是新鮮事兒,無論是自建維護團隊還是外包第三方服務,都是必需必要的。然而,他們忽視了非常重要的一點——在后信息時代下,傳統的IT服務模式,還能繼續下去嗎?
后信息時代的一個重要特點是數據的大批量集聚,表現為數據來源各式各樣、數據規模飛速增長、數據結構紛繁復雜、數據處理手段百出,數據應用面面俱到。海量數據的爆發式增長,需要有足以支撐的IT硬件和軟件系統。而對于這些無論從規模還是從功能上都大幅升級的IT系統,如果還堅持傳統的“走讀式”IT服務,將會遭遇巨大的挑戰。
傳統IT運維通常采用日常巡檢與故障排除的組合式服務,需要IT服務人員要有較高的耐心和細心。對于有數十臺IT設備的中小規模數據中心,這樣的服務方式足以滿足要求。但是,當數據中心的規模以數千臺甚至上萬臺IT設備來計時,這種“手工作業”的模式則會被淘汰,取而代之的是“自動化”模式的IT管理服務。
在天璣科技看來,要支撐大型數據中心的可靠運維,必須依賴一個統一的運維管理平臺。它應該具備這樣的功能:
一、 覆蓋數據中心全部IT設備,即將所有設備統一在一個平臺上進行管理。
二、 該平臺能夠實時監控管理對象,使IT人員的管理觸角可同時延伸至所有設備。
三、 能夠預警,即通過閾值的正確設定,確定預警門檻,既能夠“防患于未然”,又不會“虛驚一場”。
四、 能夠自動數據分析,具有報表的自動生成功能,使管理運維工作及時、真實地反應出來。
具備了以上性能的運維管理平臺,應該說只是具有的基本的功能框架,還需要大量的細節來加以豐富。例如:對于該平臺的訪問模式,是采用單一模式還是多樣模式?是否接受遠程訪問?告警內容以何種方式發送給對應人員,語音、短信,抑或電子郵件?如何在自定義周期內進行自動觸發,從而完成IT運維的例行巡檢,并生產巡檢報告?如何聯動分析告警信息,從而判斷單點告警事件的影響面有多大?如何進行風險評估,并提前解決風險點?
以上種種,看似瑣碎,實則需要運維管理平臺的建設者擁有豐富的實踐管理經驗,而并非閉門造車可以產生的。比如,倘若沒有深厚的技術和經驗積淀,很難設立準確的閾值,設的高了,意味著小事件變成大事件了才為人所知;而設的低了,則動不動警報亂響,大驚小怪,白白耗費各種資源。再如,運維人員和管理人員對數據分析結果要求不同,運維管理平臺就要提前明確這些各自不同的要求,從而生成符合需要的分析報表和函數圖形。
天璣科技在大型數據中心運維管理方面累計了豐富經驗,因而擁有深厚的運維管理平臺設計和建設能力。由其研發的數據中心運維管理平臺,已經在多家運營商數據中心得以使用,可同時覆蓋數千個節點,通過實踐驗證了該平臺的性能完全能夠滿足后信息時代數據中心IT 運維的要求。
數據中心的管理是個漫長的工程,在日復一日看似單一而枯燥的監控報表中,孕育著這個時代的先進技術和不斷膨脹的時代需求。運維管理這門課也在不斷地增加新內容,須知停滯就會被淘汰。
后信息時代里,數據中心的建立管理影響到千萬上億人的工作和生活,將毫無疑問地成為“柴米油鹽醬醋茶”之后的開門第八件事。只有先進的運維管理手段,才能保障其安全可靠的運營。它的重要性,堪比你家附近的菜場,或者我家附近的米店!