企業網絡管理,很大方面是關于對網絡互通性的維護與管理。平時注重對網絡的維護,當遇到網絡連通問題時采取合理的辦法,快速而準確的解決,是企業網絡管理員的一項必備技能。本文即是對較為常見的一些網絡故障作分析與解決介紹。
一、廣播風暴的成因、預防
廣播風暴指過多的廣播包消耗了大量的網絡帶寬,導致正常的數據包無法正常在網絡中傳送,通常指一個廣播包引起了多個的響應,而每個響應又引起了多個得響應,就像滾雪球一樣,把網絡的所有帶寬都消耗殆盡。該現象通常是由于網絡環路、故障網卡、病毒等引起。
下面就來看看此類現象的預防與故障排除過程。
1.預防(以CISCO catalyst switch為例)
具體步驟可從如下方面進行:
(1)首先使用網管分析你網絡的baseline,這樣可以明確你的網絡當中正常情況下的廣播包比例是多少。
(2)目前絕大多數交換機都支持廣播風暴抑制特性,配置了這個特性以后,你可以控制每個端口的廣播包維持在特定的比例之下,這樣可以保留帶寬給必須的應用。
配置舉例:(以CISCO catalyst switch為例)
Int XX
storm-control broadcast level 20.00
switch#sh storm
Interface Filter State Level Current
--------- ------------- ------- -------
Fa1/0/1 Forwarding 20.00% 0.00%
(3)針對缺省STP配置無法排除的網絡環路問題,利用STP的BPDUguard特性來預防廣播風暴。此種環路情況示意如下:
switch------hub(portA---portB)
Switch啟用了STP,而hub則被人有意無意的用一根網線聯起來,導致引起了環路。SWITCH的端口不會收到其他交換機或本交換機其他端口的BPDU,不會觸發該端口的STP決策過程,也就不可能blocking該端口,這樣就會引起廣播風暴。我們可以利用CISCO STP的BPDUguard 特性來預防這一點。
int xxx
spanning-tree bpduguard enable
值得注意的是bpduguard可以在全局下配置,也可以在每端口的基礎上配置。如果在全局下配置,則只對配置了portfast的端口起作用,如果在端口下配置,則不用配置portfast。
#p#副標題#e#
2.廣播風暴排障(以CISCO catalyst switch為例)
如果網絡中已經產生了網絡風暴(現象通常為網絡丟包、響應遲緩、時斷時通等),則可以利用如下的方法來排障:
(1)首先確認是否是網絡風暴或其他異常流量引起的網絡異常,在核心交換機上配置如下:
Switch>sh proc cpu | e 0.00
CPU utilization for five seconds: 19%/0%; one minute: 19%; five
minutes: 19%
PID Runtime(ms) Invoked uSecs 5Sec 1Min 5Min TTY Process
15 20170516 76615501 263 0.31% 0.13% 0.12% 0 ARP Input
26 7383266801839439482 401 5.03% 4.70% 5.08% 0 Cat4k Mgmt HiPri
27 8870781921122570949 790 5.67% 7.50% 6.81% 0 Cat4k Mgmt LoPri
43 730060152 341404109 2138 6.15% 5.29% 5.28% 0 Spanning Tree
50 59141788 401057972 147 0.47% 0.37% 0.39% 0 IP Input
56 2832760 3795155 746 0.07% 0.03% 0.01% 0 Adj Manager
58 4525900 28130423 160 0.31% 0.25% 0.18% 0 CEF process
96 20789148 344043382 60 0.23% 0.09% 0.08% 0 Standby (HSRP)
如果交換機的CPU利用率較高,且大部分的資源都被“IP Input”進程占用,則基本可以確定網絡中有大流量的數據。
(2)查找異常流量是從交換機的哪一個端口來,配置如下:
switch #sh int | i protocol|rate|broadcasts
FastEthernet1/0/1 is up, line protocol is up (connected)
Queueing strategy: fifo
5 minute input rate 0 bits/sec, 0 packets/sec
5 minute output rate 2000 bits/sec, 3 packets/sec
Received 241676 broadcasts (0 multicast)
如果找到一個端口的input rate非常高,且接收到的廣播包也非常多,則基本可以找到來源,如果該端口下聯的也是可管理的交換機,則再次執行此過程,直到找到一個連接PC或者交換機的端口為止。
(3)shutdown該端口
int xx
shutdown
(4)查找產生異常流量的根源
如果是交換機環路,則拆掉環;如果是病毒,則做殺毒處理;如果是網卡異常,則更換網卡。此部分不詳述。
(5)確認交換機的CEF功能是否啟用,如果沒有,則需要啟用,可以加速流量的轉發,配置命令如下:
switch>sh ip cef
配置CEF時,只需在全局模式下輸入ip cef即可。
#p#副標題#e#
二、網速太慢的分析與解決
企業網絡中的網速太慢,通常可從以下幾方面去分析解決。
1.網絡自身問題
即是說想要連接的目標網站所在的服務器帶寬不足或負載過大。處理辦法很簡單,換個時間段再上或者換個目標網站即可。
2.網線問題導致網速變慢
我們知道,雙絞線是由四對線按嚴格的規定緊密地絞和在一起的,用來減少串擾和背景噪音的影響。同時,在T568A標準和T568B標準中僅使用了雙絞線的1、2和3、6四條線,其中1、2用于發送,3、6用于接收,而且1、2必須來自一個繞對,3、6必須來自一個繞對。只有這樣,才能最大限度地避免串擾,保證數據傳輸。
但不少用戶在實踐中發現不按正確標準(T586A、T586B)制作的網線,存在很大的隱患。表現為:一種情況是剛開始使用時網速就很慢;另一種情況則是開始網速正常,但過了一段時間后,網速變慢。后一種情況在臺式電腦上表現非常明顯,但用筆記本電腦檢查時網速卻表現為正常。
因不按正確標準制作的網線引起的網速變慢還同時與網卡的質量有關。一般臺式計算機的網卡的性能不如筆記本電腦的,因此,在用交換法排除故障時,使用筆記本電腦檢測網速正常并不能排除網線不按標準制作這一問題的存在。我們現在要求一律按T586A、T586B標準來壓制網線,在檢測故障時不能一律用筆記本電腦來代替臺式電腦。
3.網絡中存在回路導致網速變慢
當網絡涉及的節點數不是很多、結構不是很復雜時,這種現象一般很少發生。但在一些比較復雜的網絡中,經常有多余的備用線路,如無意間連上時會構成回路。
比如網線從網絡中心接到計算機一室,再從計算機一室接到計算機二室。同時從網絡中心又有一條備用線路直接連到計算機二室,若這幾條線同時接通,則構成回路,數據包會不斷發送和校驗數據,從而影響整體網速。這種情況查找比較困難。
為避免這種情況發生,要求我們在鋪設網線時一定養成良好的習慣:網線打上明顯的標簽,有備用線路的地方要做好記載。當懷疑有此類故障發生時,一般采用分區分段逐步排除的方法。
4.網絡設備硬件故障引起的廣播風暴而導致網速變慢
作為發現未知設備的主要手段,廣播在網絡中起著非常重要的作用。然而,隨著網絡中計算機數量的增多,廣播包的數量會急劇增加。當廣播包的數量達到30%時,網絡的傳輸效率將會明顯下降。當網卡或網絡設備損壞后,會不停地發送廣播包,從而導致廣播風暴,使網絡通信陷于癱瘓。
當懷疑有此類故障時,首先可采用置換法替換集線器或交換機來排除集線設備故障。如果這些設備沒有故障,關掉集線器或交換機的電源后,DOS下用 “Ping” 命令對所涉及計算機逐一測試,找到有故障網卡的計算機,更換新的網卡即可恢復網速正常。網卡、集線器以及交換機是最容易出現故障引起網速變慢的設備。
5.網絡中某個端口形成了瓶頸導致網速變慢
路由器廣域網端口和局域網端口、交換機端口、服務器網卡等都可能成為網絡瓶頸。當網速變慢時,我們可在網絡使用高峰時段,利用網管軟件查看路由器、交換機、服務器端口的數據流量;也可用 Netstat命令統計各個端口的數據流量。據此確認網絡數據流通瓶頸的位置,設法增加其帶寬。
具體方法很多,如更換服務器網卡為100M或1000M、安裝多個網卡、劃分多個VLAN、改變路由器配置來增加帶寬等,都可以有效地緩解網絡瓶頸,可以最大限度地提高數據傳輸速度。
6、蠕蟲病毒的影響導致網速變慢
通過E-mail 散發的蠕蟲病毒對網絡速度的影響越來越嚴重,危害性極大。這種病毒導致被感染的用戶只要一上網就不停地往外發郵件,病毒選擇用戶個人電腦中的隨機文檔附加在用戶機子的通訊簿的隨機地址上進行郵件發送。成百上千的這種垃圾郵件有的排著隊往外發送,有的又成批成批地被退回來堆在服務器上。造成個別骨干互聯網出現明顯擁塞,網速明顯變慢,使局域網近于癱瘓。
因此,我們必須及時升級所用殺毒軟件;計算機也要及時升級、安裝系統補丁程序,同時卸載不必要的服務、關閉不必要的端口,以提高系統的安全性和可靠性。