故障現象
筆者曾為客戶單位局域網開通DDN專線,但開通后部分用戶抱怨與Internet進行數據交換的速度變慢,且經常有連接中斷的現象。雖經多方查找仍沒有找到原因。
該單位的網絡結構原先是結構比較單純的,共有200個工作站,分布在3層樓面中,每個樓層有60個左石的用戶。配線間設在最上面一層的樓層中,用交換機將各樓層共分成3個網段。以前員工均使用撥號上網萬式實現與Internet的連接,感覺網絡速度還比較快。各工作站、交換機等網絡設備工作也一直很正常。這次只是增加了路由設備,并申請開通了DDN專線。每個樓層用集線器將工作站連接起來,結果最低樓層的員工反映有時上網速度很慢,并常有莫名其妙的中斷現象,但是在局域網內傳輸數據不受影響,只在上Internet網時才有麻煩。
診斷過程
網絡原來是10Base-T局域網,此次只增加了DDN設備和路由器,其他配置基本不變。故筆者將網絡測試儀F683從最低樓層的某個用戶端接入網絡進行觀察,平均流量為1.5%,末發現異常。改用流量發送功能作流量逐級遞增的測試,也末發現任何異常。表面上看,該網段似乎沒有什么問題。為快速定位網絡故障,將流量發送到其他網段,同時觀察網絡狀況。隨著發送流量的增加,1min后發現錯誤幀,幀類型為FCS錯誤幀,并指示FCS幀來自中間層的某個用戶。顯然,只據此現象就判斷故障原因為該工作站的網卡損壞或網卡驅動程序錯誤,似乎顯得"證據不足",因為整個最低樓層的用戶反映的故障現象是相同的。繼續觀察到5min,發現FCS錯誤幀數量增加為15個用戶左右,由此可以斷定不是某個工作站的問題。為了驗證這個想法,筆者讓其他樓層多個用戶與故障樓層用戶交換數據(比如拷貝文件),結果發現多個FCS幀錯誤。打開交換機端口工作表觀察,本樓層的記錄中也顯示FCS幀錯誤,而其他的交換機端口工作表中沒有FCS錯誤記錄(交換機為非切發型交換機),這說明是木網段內存在著線纜超長的鏈路。筆者再試著向Internet上某個已知用戶發送流量,并且進行ICMP Ping測試,結果發現損失率為95%左右。由于剛才本網段內的體能測試未發現異常,所以只能是本樓層的集線器與交換機連接的這條鏈路有問題。測試該電纜,長度指示為145m,超過了規范長度。故障原因找到,在中間增加集線器后故障解決。
排除心得
根據網絡規范,以太網是以碰撞偵聽共享介質方式工作的。每個工作站到集線器的網線長度不應超過100m,方可保障無延遲碰撞(同軸電纜)或FCS幀錯誤。由于145m超長鏈路在集線器和交換機之間,所以本網段內的用戶在交換數據時可以順利進行,但與其他網段的用戶交換數據時就可能出問題。
雖然在整個局域網內存在FCS幀錯誤,但對低流量局域網內的數據交換而言,其對速度的影響甚微。當同時有多個用戶通過DDN進行WAN數據交換時,FCS幀錯誤將導致DDN專線的64Kb/s出口流量浪費加大。這是因為64Kb/s比10Mb/要的速度要低得多,流量中錯誤幀的比例較高,進入WAN鏈路時可能要經過多次重發才能實現遠程數據交換,感覺網絡速度明顯變慢。且由于經常有FCS錯誤幀,較容易引起WAN鏈路聯結時因錯誤而中斷,其綜合表現就是故障樓層的所有用戶都抱怨速度變慢且時常中斷。