作為網絡管理員,在工作過程中總是會遇到各種各樣的問題,特別是在遇到一些比較陌生的網絡的時候,比如我們為本市的某單位提供了光纖聯網服務,雖然交換機設備不屬于我們提供,但是由于最近該單位的網絡頻繁出現丟包問題,該單位的網管人員就給我們提供他們單位交換機的登錄密碼,希望我們協助他一起查找網絡故障,下面我們就結合這次查找故障的過程,說明一定位網絡故障節點的方法和技巧。
一、將交換機的故障日志作為第一手材料
判斷網絡故障的前提是對網絡的拓撲結構有一個清晰的認識,但是在對一個相對陌生的網絡進行故障排查時,對于網絡的熟悉是一個漸近的過程,如果快速的發現問題,判斷出故障點,查看交換機上面的日志信息是一個行之有效的方法。該單位組網主要使用了華為3500和H3C3100交換機,均支持日志查看功能,為我們快速定位故障原因提供了便利。登錄到華為3500交換機,看到了大量如下所示的信息:
%Nov 11 07:50:10 2010 rcq_3526 SYSM/5/IP MOVE:Rcv src IP packet from port 3 but it's nexthop arp 219.*.*.72 with 000f-e23f-3180 resided in port 26
通過對以上信息的分析,我們大致可以得出結論,有一臺IP地址為219.*.*.72的網絡設備,在華為3500交換機的3端口上進行ARP地址欺騙攻擊,下面我們要做就是判斷這個IP地址位于哪個VLAN,進而進一步定位于這個IP地址位于交換機的哪個端口上,通過dis cu命令進行查找,出現了如下有用信息:
vlan 101
description link to *****
interface Vlan-interface101
description link to *****
ip address 219.*.*.65 255.255.255.240
通過交換機上顯示的描述信息我們可以判斷出這個IP地址是屬于VLAN101的,而且描述信息也可以大致判斷出這個VLAN是連接的單位信息,但是作為網絡管理員我們也了解很多交換機上面的描述信息都是初始配置時寫進去,很多情況下對于網絡連接作了改動但是描述信息并沒有及時做修改,因此下面我們需要做的就是驗證IP地址與網關是否屬于同一網段。該單位的網管已經告訴我們了,即他習慣將網絡中最小的那個地址作為網關地址,按照這個規律看219.*.*.72與219.*.*.65在子網掩碼為255.255.255.240的情況下,應該是屬于一個網段的,但是為了把這個問題說清楚,我們還是詳細介紹一下判斷的方法。
二、充分理解并靈活應用IP地址、子網掩碼與網關的關系
以上面的例子做一個說明,子網掩碼為255.255.255.240,說明這個網段中的IP地址只有第4位是不同的,那么我們先將子網掩碼中的248轉化為二進制數:11110000,然后再分別將65與72轉換為二進制數,再分別與子網掩碼進行一次與運算,如下所示:
十進制數二進制數
6501000001
7201001000
24011110000
65與子網掩碼的與運算結果01000000
72與子網掩碼的與運算結果01000000
與顯示的結果可以看出,65與72與子網掩碼進行與運算后得到的結果是一樣的,則就說明219.*.*.65與219.*.*.72是屬于同一網段。IP地址、子網掩碼、網關的知識是我們學習計算機網絡知識都是學習的基礎知訓,但是熟練并靈活的應用卻是我們判斷網絡故障必不可少的。如果不能正確通過子網掩碼判斷網絡中的IP地址,就會出現將不屬于這個網段的IP地址設置到相應的端口,從而造成網絡不通的問題,好在在這個例子中并沒有出現這個現象。
三、巧妙利用IP地址沖突查找故障網絡所在的結點
再通過dis cu查看配置信息,我們發現端口3設置為TRUNK模式,該端口允許包括VLAN101的多個VLAN通過。如下所示:
interface Ethernet0/3
port link-type trunk
port trunk permit vlan 101 109
端口3下面連接一臺H3C3100交換機,其中有多個端口是屬于VLAN101的,但同時是因為描述信息不完善,我們一時無法知道哪個端口下面的網絡設備地址是219.*.*.72。到放置H3C交換機的設備現場去進行排查是一個方案,但省時省力,我們就采取另外一種方法,即在上級華為3500交換機上面我們將一個空余的端口設置為屬于VLAN101,將自己的筆記本電腦的IP地址設置219.*.*.72,這時馬上會在“事件查看器”中看到IP地址沖突的提示,如圖所示:
這時我們再登錄到H3C3100交換機上,將屬于VLAN101的三個端口全部執行shutdown操作,然后再依次執行undo shutdown的操作,每執行一次undo shutdown的操作,將自己筆記本上的網線插拔一次,如果又出現了IP地址沖突的提示,則說明該端口所連接的網絡中存在219.*.*.72這個IP地址,實際上我們非常幸運,在嘗試第一個端口時就找到有故障的網絡節點,將該網絡端口重新置為shutdown的狀態,其它兩個端口置為undo shutdown的狀態,再登錄華為3500交換機,發現沒有新的告警信息產生了,詢問該交換機下面所聯的各個單位,也都答復沒有丟包的現象了。
這次網絡故障的排除雖然經過一些波折,但最后都順利的解決了,特別是在尋找產生故障的網絡節點時,運用了設置IP地址沖突的方式,通過產生網絡故障的方法來解決網絡故障,這也算是一個對網絡知識的活學活用吧。