企業(yè)網(wǎng)絡(luò)管理,很大方面是關(guān)于對網(wǎng)絡(luò)互通性的維護(hù)與管理。平時(shí)注重對網(wǎng)絡(luò)的維護(hù),當(dāng)遇到網(wǎng)絡(luò)連通問題時(shí)采取合理的辦法,快速而準(zhǔn)確的解決,是企業(yè)網(wǎng)絡(luò)管理員的一項(xiàng)必備技能。本文即是對較為常見的一些網(wǎng)絡(luò)故障作分析與解決介紹。
一、廣播風(fēng)暴的成因、預(yù)防
廣播風(fēng)暴指過多的廣播包消耗了大量的網(wǎng)絡(luò)帶寬,導(dǎo)致正常的數(shù)據(jù)包無法正常在網(wǎng)絡(luò)中傳送,通常指一個(gè)廣播包引起了多個(gè)的響應(yīng),而每個(gè)響應(yīng)又引起了多個(gè)得響應(yīng),就像滾雪球一樣,把網(wǎng)絡(luò)的所有帶寬都消耗殆盡。該現(xiàn)象通常是由于網(wǎng)絡(luò)環(huán)路、故障網(wǎng)卡、病毒等引起。
下面就來看看此類現(xiàn)象的預(yù)防與故障排除過程。
1.預(yù)防(以CISCO catalyst switch為例)
具體步驟可從如下方面進(jìn)行:
(1)首先使用網(wǎng)管分析你網(wǎng)絡(luò)的baseline,這樣可以明確你的網(wǎng)絡(luò)當(dāng)中正常情況下的廣播包比例是多少。
(2)目前絕大多數(shù)交換機(jī)都支持廣播風(fēng)暴抑制特性,配置了這個(gè)特性以后,你可以控制每個(gè)端口的廣播包維持在特定的比例之下,這樣可以保留帶寬給必須的應(yīng)用。
配置舉例:(以CISCO catalyst switch為例)
Int XX
storm-control broadcast level 20.00
switch#sh storm
Interface Filter State Level Current
--------- ------------- ------- -------
Fa1/0/1 Forwarding 20.00% 0.00%
(3)針對缺省STP配置無法排除的網(wǎng)絡(luò)環(huán)路問題,利用STP的BPDUguard特性來預(yù)防廣播風(fēng)暴。此種環(huán)路情況示意如下:
switch------hub(portA---portB)
Switch啟用了STP,而hub則被人有意無意的用一根網(wǎng)線聯(lián)起來,導(dǎo)致引起了環(huán)路。SWITCH的端口不會(huì)收到其他交換機(jī)或本交換機(jī)其他端口的BPDU,不會(huì)觸發(fā)該端口的STP決策過程,也就不可能blocking該端口,這樣就會(huì)引起廣播風(fēng)暴。我們可以利用CISCO STP的BPDUguard 特性來預(yù)防這一點(diǎn)。
int xxx
spanning-tree bpduguard enable
值得注意的是bpduguard可以在全局下配置,也可以在每端口的基礎(chǔ)上配置。如果在全局下配置,則只對配置了portfast的端口起作用,如果在端口下配置,則不用配置portfast。
#p#副標(biāo)題#e#
2.廣播風(fēng)暴排障(以CISCO catalyst switch為例)
如果網(wǎng)絡(luò)中已經(jīng)產(chǎn)生了網(wǎng)絡(luò)風(fēng)暴(現(xiàn)象通常為網(wǎng)絡(luò)丟包、響應(yīng)遲緩、時(shí)斷時(shí)通等),則可以利用如下的方法來排障:
(1)首先確認(rèn)是否是網(wǎng)絡(luò)風(fēng)暴或其他異常流量引起的網(wǎng)絡(luò)異常,在核心交換機(jī)上配置如下:
Switch>sh proc cpu | e 0.00
CPU utilization for five seconds: 19%/0%; one minute: 19%; five
minutes: 19%
PID Runtime(ms) Invoked uSecs 5Sec 1Min 5Min TTY Process
15 20170516 76615501 263 0.31% 0.13% 0.12% 0 ARP Input
26 7383266801839439482 401 5.03% 4.70% 5.08% 0 Cat4k Mgmt HiPri
27 8870781921122570949 790 5.67% 7.50% 6.81% 0 Cat4k Mgmt LoPri
43 730060152 341404109 2138 6.15% 5.29% 5.28% 0 Spanning Tree
50 59141788 401057972 147 0.47% 0.37% 0.39% 0 IP Input
56 2832760 3795155 746 0.07% 0.03% 0.01% 0 Adj Manager
58 4525900 28130423 160 0.31% 0.25% 0.18% 0 CEF process
96 20789148 344043382 60 0.23% 0.09% 0.08% 0 Standby (HSRP)
如果交換機(jī)的CPU利用率較高,且大部分的資源都被“IP Input”進(jìn)程占用,則基本可以確定網(wǎng)絡(luò)中有大流量的數(shù)據(jù)。
(2)查找異常流量是從交換機(jī)的哪一個(gè)端口來,配置如下:
switch #sh int | i protocol|rate|broadcasts
FastEthernet1/0/1 is up, line protocol is up (connected)
Queueing strategy: fifo
5 minute input rate 0 bits/sec, 0 packets/sec
5 minute output rate 2000 bits/sec, 3 packets/sec
Received 241676 broadcasts (0 multicast)
如果找到一個(gè)端口的input rate非常高,且接收到的廣播包也非常多,則基本可以找到來源,如果該端口下聯(lián)的也是可管理的交換機(jī),則再次執(zhí)行此過程,直到找到一個(gè)連接PC或者交換機(jī)的端口為止。
(3)shutdown該端口
int xx
shutdown
(4)查找產(chǎn)生異常流量的根源
如果是交換機(jī)環(huán)路,則拆掉環(huán);如果是病毒,則做殺毒處理;如果是網(wǎng)卡異常,則更換網(wǎng)卡。此部分不詳述。
(5)確認(rèn)交換機(jī)的CEF功能是否啟用,如果沒有,則需要啟用,可以加速流量的轉(zhuǎn)發(fā),配置命令如下:
switch>sh ip cef
配置CEF時(shí),只需在全局模式下輸入ip cef即可。
#p#副標(biāo)題#e#
二、網(wǎng)速太慢的分析與解決
企業(yè)網(wǎng)絡(luò)中的網(wǎng)速太慢,通常可從以下幾方面去分析解決。
1.網(wǎng)絡(luò)自身問題
即是說想要連接的目標(biāo)網(wǎng)站所在的服務(wù)器帶寬不足或負(fù)載過大。處理辦法很簡單,換個(gè)時(shí)間段再上或者換個(gè)目標(biāo)網(wǎng)站即可。
2.網(wǎng)線問題導(dǎo)致網(wǎng)速變慢
我們知道,雙絞線是由四對線按嚴(yán)格的規(guī)定緊密地絞和在一起的,用來減少串?dāng)_和背景噪音的影響。同時(shí),在T568A標(biāo)準(zhǔn)和T568B標(biāo)準(zhǔn)中僅使用了雙絞線的1、2和3、6四條線,其中1、2用于發(fā)送,3、6用于接收,而且1、2必須來自一個(gè)繞對,3、6必須來自一個(gè)繞對。只有這樣,才能最大限度地避免串?dāng)_,保證數(shù)據(jù)傳輸。
但不少用戶在實(shí)踐中發(fā)現(xiàn)不按正確標(biāo)準(zhǔn)(T586A、T586B)制作的網(wǎng)線,存在很大的隱患。表現(xiàn)為:一種情況是剛開始使用時(shí)網(wǎng)速就很慢;另一種情況則是開始網(wǎng)速正常,但過了一段時(shí)間后,網(wǎng)速變慢。后一種情況在臺(tái)式電腦上表現(xiàn)非常明顯,但用筆記本電腦檢查時(shí)網(wǎng)速卻表現(xiàn)為正常。
因不按正確標(biāo)準(zhǔn)制作的網(wǎng)線引起的網(wǎng)速變慢還同時(shí)與網(wǎng)卡的質(zhì)量有關(guān)。一般臺(tái)式計(jì)算機(jī)的網(wǎng)卡的性能不如筆記本電腦的,因此,在用交換法排除故障時(shí),使用筆記本電腦檢測網(wǎng)速正常并不能排除網(wǎng)線不按標(biāo)準(zhǔn)制作這一問題的存在。我們現(xiàn)在要求一律按T586A、T586B標(biāo)準(zhǔn)來壓制網(wǎng)線,在檢測故障時(shí)不能一律用筆記本電腦來代替臺(tái)式電腦。
3.網(wǎng)絡(luò)中存在回路導(dǎo)致網(wǎng)速變慢
當(dāng)網(wǎng)絡(luò)涉及的節(jié)點(diǎn)數(shù)不是很多、結(jié)構(gòu)不是很復(fù)雜時(shí),這種現(xiàn)象一般很少發(fā)生。但在一些比較復(fù)雜的網(wǎng)絡(luò)中,經(jīng)常有多余的備用線路,如無意間連上時(shí)會(huì)構(gòu)成回路。
比如網(wǎng)線從網(wǎng)絡(luò)中心接到計(jì)算機(jī)一室,再從計(jì)算機(jī)一室接到計(jì)算機(jī)二室。同時(shí)從網(wǎng)絡(luò)中心又有一條備用線路直接連到計(jì)算機(jī)二室,若這幾條線同時(shí)接通,則構(gòu)成回路,數(shù)據(jù)包會(huì)不斷發(fā)送和校驗(yàn)數(shù)據(jù),從而影響整體網(wǎng)速。這種情況查找比較困難。
為避免這種情況發(fā)生,要求我們在鋪設(shè)網(wǎng)線時(shí)一定養(yǎng)成良好的習(xí)慣:網(wǎng)線打上明顯的標(biāo)簽,有備用線路的地方要做好記載。當(dāng)懷疑有此類故障發(fā)生時(shí),一般采用分區(qū)分段逐步排除的方法。
4.網(wǎng)絡(luò)設(shè)備硬件故障引起的廣播風(fēng)暴而導(dǎo)致網(wǎng)速變慢
作為發(fā)現(xiàn)未知設(shè)備的主要手段,廣播在網(wǎng)絡(luò)中起著非常重要的作用。然而,隨著網(wǎng)絡(luò)中計(jì)算機(jī)數(shù)量的增多,廣播包的數(shù)量會(huì)急劇增加。當(dāng)廣播包的數(shù)量達(dá)到30%時(shí),網(wǎng)絡(luò)的傳輸效率將會(huì)明顯下降。當(dāng)網(wǎng)卡或網(wǎng)絡(luò)設(shè)備損壞后,會(huì)不停地發(fā)送廣播包,從而導(dǎo)致廣播風(fēng)暴,使網(wǎng)絡(luò)通信陷于癱瘓。
當(dāng)懷疑有此類故障時(shí),首先可采用置換法替換集線器或交換機(jī)來排除集線設(shè)備故障。如果這些設(shè)備沒有故障,關(guān)掉集線器或交換機(jī)的電源后,DOS下用 “Ping” 命令對所涉及計(jì)算機(jī)逐一測試,找到有故障網(wǎng)卡的計(jì)算機(jī),更換新的網(wǎng)卡即可恢復(fù)網(wǎng)速正常。網(wǎng)卡、集線器以及交換機(jī)是最容易出現(xiàn)故障引起網(wǎng)速變慢的設(shè)備。
5.網(wǎng)絡(luò)中某個(gè)端口形成了瓶頸導(dǎo)致網(wǎng)速變慢
路由器廣域網(wǎng)端口和局域網(wǎng)端口、交換機(jī)端口、服務(wù)器網(wǎng)卡等都可能成為網(wǎng)絡(luò)瓶頸。當(dāng)網(wǎng)速變慢時(shí),我們可在網(wǎng)絡(luò)使用高峰時(shí)段,利用網(wǎng)管軟件查看路由器、交換機(jī)、服務(wù)器端口的數(shù)據(jù)流量;也可用 Netstat命令統(tǒng)計(jì)各個(gè)端口的數(shù)據(jù)流量。據(jù)此確認(rèn)網(wǎng)絡(luò)數(shù)據(jù)流通瓶頸的位置,設(shè)法增加其帶寬。
具體方法很多,如更換服務(wù)器網(wǎng)卡為100M或1000M、安裝多個(gè)網(wǎng)卡、劃分多個(gè)VLAN、改變路由器配置來增加帶寬等,都可以有效地緩解網(wǎng)絡(luò)瓶頸,可以最大限度地提高數(shù)據(jù)傳輸速度。
6、蠕蟲病毒的影響導(dǎo)致網(wǎng)速變慢
通過E-mail 散發(fā)的蠕蟲病毒對網(wǎng)絡(luò)速度的影響越來越嚴(yán)重,危害性極大。這種病毒導(dǎo)致被感染的用戶只要一上網(wǎng)就不停地往外發(fā)郵件,病毒選擇用戶個(gè)人電腦中的隨機(jī)文檔附加在用戶機(jī)子的通訊簿的隨機(jī)地址上進(jìn)行郵件發(fā)送。成百上千的這種垃圾郵件有的排著隊(duì)往外發(fā)送,有的又成批成批地被退回來堆在服務(wù)器上。造成個(gè)別骨干互聯(lián)網(wǎng)出現(xiàn)明顯擁塞,網(wǎng)速明顯變慢,使局域網(wǎng)近于癱瘓。
因此,我們必須及時(shí)升級(jí)所用殺毒軟件;計(jì)算機(jī)也要及時(shí)升級(jí)、安裝系統(tǒng)補(bǔ)丁程序,同時(shí)卸載不必要的服務(wù)、關(guān)閉不必要的端口,以提高系統(tǒng)的安全性和可靠性。