信息孤島一直是懸而未決的問題,如何有效地利用網絡、利用信息化,整合單位資源成為人們所關注的課題。
網絡的管理人員相信只有數據大集中,數據才有可能變得更加安全、可靠。因此,大集中是不可阻擋的趨勢。但數據的大集中同時也會帶來很多其他的問題。例如數據本身的安全性、可靠性等,因此,企業不得不建更多的備份中心。同樣,這些多中心同步又會產生一系列的問題。
總結來看,有六大問題在困擾著網絡管理者,想要成功地實現數據中心的集中化,這六大問題是必須要解決的。究竟是哪六大問題呢?北塔作為IT運維的管理專家,我們與您一起“醫療”網絡。
抓住計算核心,保證服務器的穩定
毋庸置疑,服務器是網絡的計算核心,是各個系統的運行平臺。如果我們把數據中心進行了整合,當服務器因為故障而宕機,那么將直接造成系統的癱瘓。服務器本身是有性能瓶頸的,同時,在可靠性、安全性等方面都有局限性存在。同時,目前X86服務器在實際應用中還占據著很大的比重,而作為X86的主要平臺,Windows系統的穩定性在業內又一直飽受置疑。當然,我們也可以采用UNIX服務器或者在X86平臺上運行Linux系統,但是,UNIX服務器的價格昂貴,而Linux系統又不像Windows那樣普及。所以,對于很多的網絡管理者來說,服務器就好像一顆不定時的炸彈,它隨時可能出現問題,而一旦服務器出現了問題,往往都是最為嚴重的問題。
那么,我們通過什么管理手段來保證服務器的穩定呢?我們認為對于服務器的管理應該防范于未然,或者說,采用事前管理的手段。想要實現服務器的事前管理就不可避免的要借助一些管理工具,因為對于一個人來說,服務器的很多故障隱患不是可以隨時掌握的,比方說關鍵進程的運行數據,CPU、內存的占用情況,對于類似這樣的數據,僅僅依靠人工是不可能達到7*24小時掌握的。這就需要類似北塔軟件IT運維管理系統BTNM這樣的管理系統來輔助我們進行服務器的實時監控,并且在服務器的各個運行指標出現異常時及時報警,確保網絡管理者在服務器宕機之前做出有效的故障處理。
確保網絡通暢——保證網絡設備的穩定
對于很多網絡管理者來說,網絡是一個看得見也摸得著,但就是不知道內在情況的“黑盒子”,雖然對于主干網絡來說,我們可以通過網絡拓撲圖來進行掌握,但是對于整體網絡而言,它的變化我們是無從所知的。當數據中心進行了整合之后,一方面網絡設備的密度會加大,另一方面,網絡設備與網絡設備之間關聯的復雜程度也會增加。
舉個簡單的例子來說,某臺交換機的某個端口出現了故障,那么這個端口所連接的相關網絡設備也有可能停止工作。這個故障對于網絡管理者來說,可能會過了很長一段時間他才會知道,而當他知道了這個問題之后,還要花費大量的時間去逐級定位故障原因,當故障被排除之后,可能已經過去了幾個小時甚至更長的時間,而在這個時間段造成的業務損失可能是巨大的。這樣的故障如果影響到業務部門,有可能造成核心業務的停滯而使企業產生業務虧損,如果影響到生產部門,有可能造成產品交付的不及時而是企業違約。
試想一下,如果在年底的時候,這樣的故障影響到了財務部門,那么年底的封賬就會產生問題,有可能造成單位大量的資金流失。而導致這一切的“元兇”僅僅是一個小小的交換機端口。所以說,保證網絡設備的穩定,使得網絡通暢也是數據中心集中化的基礎之一。
我們當然希望能夠有效地了解網絡中設備與設備之間是如何關聯的,時刻掌握詳盡的網絡拓撲圖(如圖1),當然希望了解網絡中每臺設備的IP地址、名稱,使得整體網絡對于管理者來說是一張“透明”的網絡(如圖2)。北塔軟件IT運維管理系統BTNM可以為整個網絡提供設備間連接情況加以注釋,對關鍵的網絡設備提供實時有效的監控以及故障和潛在故障的快速定位。同時能夠把這些信息真實有效的傳遞給網絡管理者。
![]() |
圖1 網絡透明化管理中詳盡的拓撲圖 |
![]() |
圖2 透明化網絡管理示意圖 |
讓網絡速度得到保證——掌控網絡的流量
數據中心整合之后,網絡速度是實現各個業務系統順利運行的一個前提條件。很多人發現,網絡速度慢并不是因為帶寬不夠而導致的。造成網速慢的很大一部分原因是網絡流量分配不合理。當網絡中充斥著電驢、BT這些“血栓”的時候,你怎么可能希望您的視頻會議、ERP可以順暢的運行呢?更可怕的是,當網絡中出現了蠕蟲之類的病毒之后,您的關鍵業務系統就有可能因為得不到足夠的帶寬而成為一個裝飾品。
所以,我們對于網絡流量方面要盡可能詳細的掌握,確保關鍵的業務系統得帶寬不會被占用。同時,當數據中心整合之后,跨IP網段的分析捕捉各類異常網絡數據流變的尤為重要,它是保證數據中心和各個分支機構正常運行的基礎之一。
保證IT設施的良好環境——對于機房環境的保證
數據中心進行了集中統一的整合,我們對服務器、網絡設備、網絡流量等關鍵要素進行了實時的監控之后,您千萬不要忘記機房環境。一旦機房環境出現了問題,您前面所作的一切努力便都會成為“無用功”。我們還需要對整體的核心機房環境、UPS等設備的狀態進行掌握,這樣才是集中化數據中心的保障。
及時有效的通知——故障報警的方式
當網絡產生了故障,首先要做的是讓網絡管理者在第一時間得到通知,進而讓其了解是哪里出了故障。如果網絡管理者事先得知某網元即將出現故障并采取應對措施,那么故障量將大大減少。對于IT運維系統來說,這就是告警管理。
對于網管員來說,數據中心大集中之后的網絡變得更加復雜,網絡的事前預警和出現故障后的及時報警就更加重要。
妥善的資料分析——詳實的報表提供
網管系統是為網絡管理者所服務的,所以網管系統要為網絡管理者提供出簡潔明了、一語中地的網絡分析數據。整合的數據中心的網絡層必然比分散的數據中心復雜,沒有一份詳實的網絡運行報表,網絡管理是無法對網絡整體進行有效的調整、升級和優化的。所以,網管系統必須為網絡管理者提供有效的“網絡病歷”。
總結
當然,網絡管理相關的著眼點還有很多,我們在這里只是提出了最為重要的幾個方面。
據中心的集中化使得核心網絡更加的復雜,網絡管理迎來了新的挑戰。可是,如果沒有通過良好的管理方式使得數據中心能夠穩定的運行,整合后的數據中心非但不能達到預期的目的,更有可能為用戶帶來更多的煩惱和損失。所以,整合數據中心時千萬不要忘記構建一套妥善的網絡管理方案,只有這樣,您的數據中心才能為您提供穩健的服務。