企業局域網發生故障是不可避免的,因此網絡故障管理的主要任務之一是及時發現并排除網絡故障。一般當網絡發生物理連接不通、不能瀏覽Web等連通性故障時,因為故障現象比較明確,所以容易觀察和定位故障點,解決起來也不困難。然而最令人頭痛的故障類型是,網絡的物理連接是通的,但網速卻莫名地變慢。在本文中我結合自己的經驗,就導致此類故障的因素進行分析,并和大家共享自己的解決方法。
1.由網線連接方法及網線質量而導致的網速變慢
(1)因素分析
局域網的安裝從電纜開始,電纜是整個網絡系統的基礎。我做了一個大概的估計大約有50%一70%的網絡故障與電纜有關,電纜本身的質量及電纜安裝的方法都直接影響到網絡能否健康地運行。大家知道,雙絞線是由四塒線按嚴格的規定緊密地絞和在一起的,用來減少串擾
和背景噪音的影響。。同時,在T568A標準和T568B標準中僅使用了雙絞線的1、2和3、6四條線,其中1、2用于發送,3、6用于接收,而且1、2必須來自一個繞對,3、6必須來自一個繞對。只有這樣,才能最大限度地避免串擾,保證數據傳輸。在大量實踐中發現不按正確標準(T586A、T586B)制作的網線,存在很大的隱患。表現為:一種情況是剛開始使用時網速就很慢;另一種情況則是開始網速正常,但過了一段時問后,網速變慢。后一種情況在臺式電腦上表現非常明顯,但用筆記本電腦檢查時網速卻表現為正常。
(2)排錯方案
對于這一問題經多次實踐發現,因不按止確標準制作的網線引起的網速,變慢還同時與網卡的質量有關。一般臺式計算機的網帚的性能不如筆記本電腦的,因此,在用交換法排除故障時,使用筆記本電腦檢測網速正常并不能排除網線不按標準制作這一問題的存在。因此實際使用中應當嚴格按照F586A或T586B標準來JK制網線,在檢測線纜故障時筆記本電腦和臺式電腦相結合。
2.網絡中存在回路導致網速變慢
(1)因素分析
當網絡涉及的節點數不足很多、結構不足很復雜時,這種現象一般很少發生。但在一些比較復雜的網絡中,經常有多余的備用線路,如無意間連上時會構成回路;或者交換機的uplink口一般都和1/24口共用一個物理通道,如果1/uplink或24/uplink同時接上客戶機,也會造成異常。例如某醫院的網線從網絡中心接到門診大樓,再從門診大樓接到總務科,同時從網絡中心又有一條備用線路直接連到總務科,若這幾條線同時接通,則構成回路,數據包會不斷發送和校驗數據,從而影響整體網速。這種情況查找比較困難。
(2)解決方案
為避免這種情況發生,要求在鋪設網線時一定養成良好的習慣:網線打上明顯的標簽,有備用線路的地方要做好記載。當懷疑有此類故障發生時,一般采用分區、分段、逐步排除的方法。
3.網絡設備硬件故障引起的廣播風暴而導致網速變慢
(1)因素分析
作為發現未知設備的主要手段,廣播在網絡中起著非常重要的作用。然而,隨著網絡中計算機數量的增多,廣播包的數量會急劇增加。當廣播包的數量達到30%時,網絡的傳輸效率將會明顯下降。當網乍或網絡設備損壞后,會不停地發送廣播包,從而導致廣播風暴,使網絡通信陷于癱瘓。因此,當網絡設備硬件有故障時也會引起網速變慢。
(2)排錯方案
當懷疑有此類故障時,首先可采用冒換法替換集線器或交換機來排除集線設備故障。如果這些沒備沒有故障,關掉集線器或交換機的電源后,在命令行下用“Ping”命令對所涉及計算機逐一測試,找到有故障網卡的計算機,更換新的網卡即町恢復網速正常。網卡、集線器以及交換機是最容易出現故障引起網速變慢的設備。
4.網絡中某個端口形成了瓶頸導致網速變慢
(1)因素分析
實際上,路由器廣域網端口和局域網端口、交換機端口、集線器端口和服務器網卡等都可能成為網絡瓶頸。其原因主要是因為端口鎖死、端口故障、端口模式不匹配所致。
(2)排錯方案
當網速變慢時,我們可在網絡使用高峰時段,利用網管軟件查看路由器、交換機、服務器端口的數據流苗;也可用Netstat命令統計各個端口的數據流量。據此確認網絡數據流通瓶頸的位置,設法增加其帶寬。具體方法很多,如更換服務器網卡為lOOM或1000M、安裝多個網卡、劃分多個VLAN、改變路由器配置來增加帶寬等,都町以有效地緩解網絡瓶頸,町以最大限度地提高數據傳輸速度。
5.蠕蟲等病毒的影響導致網速變慢
(1)因素分析
通過E-mail散發的蠕蟲病毒對網絡速度的影響越來越嚴重,危害性極大。這種病毒導致被感染的用戶只要一上網就不停地往外發郵件,病毒選擇用戶個人電腦中的隨機文檔附加在用戶
機子的通訊簿的隨機地址上進行郵件發送。成百上千的這種垃圾郵件有的排著隊往外發送,有的又成批成批地被退回來堆在服務器上。造成個別骨干互聯網出現明顯擁塞,網速明顯變慢,使局域網近于癱瘓。
(2)解決方案
管理員必須及時升級內網計算機所用殺毒軟件,操作系統也要及時升級、安裝系統補丁程序,同時卸載不必要的服務、關閉不必要的端口,以提高系統的安全性和可靠性。
6.一個相關排錯案例
為了時大家對局域網連通性故障的排錯有一個感性的認識,為此我列舉一個案例。
(1)故障狀態
某單位的網絡突然出現嚴重堵塞,主機間的數據頻頻中斷,協同辦公不能正常進行,在線視頻系統經常掉線。另外,無論是從文件服務器中上傳還是下載文件都異常緩慢,有時會因超時而中斷。
(2)故障診斷
在一臺主機上用ping命令測試到網關的連通性,輸入命令“ping 192.168.2.1 -n 1000”發送1000個Ping包測試網關。測試結果可以ping通網關,但是發現掉包現象很嚴重,1000個包有720個包丟了,丟包率為72%,持續掉包時間也很長。運行arp -a命令,發現網關IP和網關MAC地址指向正確,通過上面的測試基本排除網絡設置錯誤以及ARP欺騙。
接下來在核心交換機上做鏡像用Sniffer對整個內網進行監控。監控結束后分析時發現網絡利用率達到了97%,這是很不正常的現象。以該單位的網絡規模以及日常業務量網絡利用率應該在20%-30%之間,這樣可以斷定造成網絡丟包的根源應該是異常流量占用大量的網絡帶寬所致。
繼續分析發現MAC為00-0A-E6-98-84-B7的主機占了整個網絡流量的57.87%,初步把目標鎖定在該主機上,繼續分析沒有發現大量的廣播包,因此完全排除了廣播風暴影響。找到00-0A-E6-98-84-B7對此主機分析,發現該主機的網絡活動非常可疑,進入該主機的數據包才700多個,而出去的數據包在短短的10多分鐘內就有了幾十萬個包,這是極不正常的。
(3)故障解決
通過對00-0A-E6-98-84-B7主機的單獨抓包分析,發現該主機通過UDP協議項向外網的一個IP進行數據拷貝,可以斷定該主機應該被植入了木馬。接下來在交換機上對該主機隔離斷開其網絡連接,整個網絡馬上就恢復了正常。最后用殺毒軟件對該主機進行殺毒,殺毒完畢后接入網絡一切正常,故障解決。
最后,希望本文就網絡連通故障的因素分析、解決之道,以及最后的相關案例解析,能夠從理論到實踐對大家進行網絡排錯有幫助。