在很多人眼中,網絡分析是一個高深的技術,是一項很難的任務。而在實際的網絡管理中,也常常是在發生故障和問題的時候才想到網絡分析。如何看待網絡分析?如何善用網絡分析?帶著這些疑問,記者采訪了科來軟件技術總監高彥剛先生。
科來軟件技術總監高彥剛先生
記者:為什么需要網絡分析,它對于在網絡管理的意義是怎樣的?
高彥剛:網管的概念十分廣泛,所做的工作繁多,網絡分析是這個過程中很關鍵的一部分。要做好網絡管理,首先要知道怎樣去管理,要有一個明確的管理目的以及自己需要為實現管理所做的工作內容,而分析恰恰是解決這個環節非常重要的部分。
如果不能把問題產生的原因分析清楚,就沒辦法做到有效、科學的管理,這也是網絡分析是網絡管理過程很重要的一部分的原因。所以說,數據分析應該含蓋在整個網管的過程里。
記者:現在的網管工具也可以監測到網絡數據,是否就不需要網絡分析了?
高彥剛:網管工具一般監測的是諸如交換機、路由器等設備的運行狀態,而網絡分析并不局限于數據包級的分析。分析是一個過程,其中最核心的部分還是人,即最終做分析的是人,而不是設備。人只是借助于各種工具和系統進行分析,網管工具就是其中的一種工具。
做為一個大企業用戶的網管,需要用到多種多樣的網管工具,這些工具和系統都可能提供一些數據依據,這些都作為網管員分析判斷的依據,最終靠人來作出分析的結論。正如醫生診病,通過化驗、B超、CT等一系列的手段來分析,這些手段給醫生提供的都是數據依據,但是層面不一樣,有些反映的是表面的問題,有些則反映底層問題,不同工具反映的深度不一樣。有些管理人員可能通過一些表面現象,比如某臺設備運行緩慢,根據自己的經驗判斷就可以做一定的分析,但這些分析有可能并不完全準確。如果能深入地看到網絡中正在傳輸的數據,他的判斷可以更準確,效率也更高。
記者:網絡分析在國外發展得比較好,在國內發展到什么了程度?
高彥剛:從科來的感覺,這兩年這個市場的發展還是非常快的,越來越多的用戶在重視這方面的管理。現在的網管本身是維護用戶業務正常運行的一個基本的需求,因此網絡分析這一業務的發展也是很迅速的。
然而就行業來講,國內仍然有大量的大型企業客戶在網絡分析這方面是一片空白,但我覺得這是一個逐漸發展的過程,核心還是人的技術水平提升的過程。以前的網管,更多地只是流于表面性的網管,并不具備更高的技術能力去管理維護好一個網絡,甚至說很多用戶都沒有專門的人去管網絡,這一點是問題的關鍵。
然而,這個問題正在很快地進行著改變。現在越來越多的客戶都設置了專門的人去管理網絡,甚至有專門的人來分析網絡。認知到必須有一個良好的網絡分析才能實現良好的網絡管理,真正地使人在水平上得到提高,管理水平的提高歸根結底還是人的水平提高。
這是一個逐步發展的過程。因為諸如美國等發達國家的網絡管理,經過多年的發展積累了眾多的技術人員,一些老的技術人員可能從事了幾十年的網管工作,而我們國內很多用戶的網管還是比較年輕的技術人員,所以這是一個不斷積累的過程。網管員的需求量會越來越大,因為用戶的網絡對業務的影響越來越關鍵,網管也會越來越重要。以前往往很多技術人員不愿做網管,因為他們不是真正的業務人員。例如法院也會有相應的網絡,但是人們都更愿意去當法官審理案件,從事業務相關工作,而不是去管理網絡。然而現在人們認識到了網絡越來越重要,因為現在的很多業務都是在網絡上運行的,網絡出現了問題就會影響業務的正常運行。所以,慢慢地隨著網絡地位的提升,人的認知也在提升,技術也在提升。
記者:在取得網絡分析數據之后,如何讓用戶知道在哪里出現了問題,需要怎么解決?
高彥剛:網絡分析涵蓋的范圍很廣泛。作為一名網絡管理人員,可能更關注以下兩方面:一是網絡有沒有設備的損壞、故障,這里面的數據可以通過網管工具得到;二是分析網絡中有沒有丟包、擁塞、時延等網絡服務質量問題,這就需要通過數據包級的分析工具去取得相應的分析,來確定網絡的狀態。
一些應用的管理人員,可以通過分析整個交易處理的數據包的交互,看出應用當前的響應時間、處理能力有沒有異常,并且可以把詳細的應用處理做記錄,如果有問題就可以進行追溯。安全管理人員也一樣,可以通過分析網絡中的網絡行為,發現有沒有攻擊、病毒、木馬等。這些都可以通過網絡分析的手段來獲取,雖然不同職能的管理人員利用的信息并不完全一樣,但他們都是通過提取底層的數據包來實現,最終解決出現的問題。
記者:回溯分析是一種什么樣的技術?它的應用范圍是怎樣的?
高彥剛:現在有很多產品可以提出告警,但是告警并不能作為確切的依據。我們的回溯分析系統具有完整的通訊數據包記錄,這些數據就可以當做分析問題的依據,尤其是現在很多網絡問題、應用問題都如此。回溯分析系統實現了快速歷史數據回溯分析功能,使網絡分析突破時間的限制,在數據挖掘、追蹤定位以及安全取證等方面更精確、高效。
回溯分析系統可以應用于各種類型的網絡,取決于用戶網絡的關鍵程度或是網絡的價值程度。有些用戶雖然網絡規模很小,但是他的業務很關鍵,那么他對網管的要求就會非常高,本身也就需要做追溯。回溯分析系統具備出了問題可以進行追溯的特點,尤其是對于一些對網絡安全要求很高的用戶來說十分關鍵。
記者:現在數據中心的結構越來越復雜,虛擬化應用也越來越普遍,網絡分析產品對虛擬化的支持怎么樣?
高彥剛:我們的軟件就可以裝到虛擬機上。此外,現在不管是云計算也好,虛擬化也好,實際上是對網絡的依賴性更強了,因為要有云的話,首先要有網絡把各個節點連接起來,各個節點之間的通訊可以很容易通過分析手段來進行分析。現在比較通用的云技術,一個客戶端訪問過來,會有一些設備做負載均衡和分配,有可能分配到不同的服務器上。而對于客戶來講,他看到的只是一個應用服務,但這個應用服務可能是多臺計算機多個節點來提供的,對客戶來講它是透明的,但是在服務器端是相對復雜的。它有相應的負載分配技術、服務器的支持技術,在出現問題時,要分析出問題的所在也相應地比較復雜。
就用戶的感知來講,出現問題就一定是服務器端的問題,但是在基于云技術的數據中心中找到問題到底出在哪是很復雜的,這時候就需要進行網絡分析。利用我們產品的分析手段是不錯的選擇,因為我們的產品可以看到所有數據的交互過程,包括服務器和服務器之間的交互過程。只要是通過網絡,我們就可以分析到,為確定哪個環節出現異常提供非常明確的數據依據。否則的話,這個問題很難解決,因為現在的設備太繁多,其中一個交換機出現異常都有可能導致整個服務的異常。此外在用戶端的體驗,比如100臺服務器中只有一部分有問題,那么就有可能影響到了部分客戶的訪問體驗,遇到這種情況該如何解決呢?利用我們的網絡分析產品,就可以快速地對所有的服務器會話進行分析,挑揀出有異常的服務器,將結果很直觀地呈現出來。