最近網絡故障臺經常報告用戶普遍反映玩《傳奇》特別慢,用戶維護人員奔波于用戶之間,但是收效甚微。于是我們網管人員來分析解決這次軟故障,從而開始了為期半月的艱苦診斷歷程。
網絡結構圖
在我們企業(yè)局域網中,A、B兩個網絡各自主干核心速度均為千兆,桌面速度均為百兆,內部A、B兩個網絡是通過RouterA和RouterB兩個路由器的廣域網接口連接,主要應用的服務器在A網絡,因此B網絡用戶通過Router的5個端口(10M)訪問位于A網絡的企業(yè)主頁及內部網絡應用的服務器。
故障分析
在出現軟故障前,最近系統沒有修改任何數據,而傳奇是我們新增加的網絡應用服務;只是最近B網絡個人用戶增加比較多,而大多喜歡玩A網絡的傳奇,但是我們分析這絕不是游戲運行緩慢的主要原因,因為用戶反映上內部網和外部Ineternet速度都不慢。
1)經過現場實驗,得到如下結果:
A網絡用戶作為本地用戶玩?zhèn)髌鎰t速度正常,說明了A網絡本地網絡和傳奇服務器本身正常;
B網絡用戶訪問A網絡的其它應用,如Web、E-mail、OA速度都比較快;
B網絡用戶訪問B網絡的本地服務器和通過B網絡上Internet速度比較快。說明B網絡本地網絡正常;
2)使用工具軟件對系統的測試
通過HPOpenview網管軟件分析各個設備之間沒有發(fā)現異常的流量;
通過協議分析儀沒有發(fā)現大量的ARP廣播查詢報文、CRC錯誤和FCS幀錯誤,證明AB網絡間的2M鏈路正常。
通過端口檢測發(fā)現A、B兩個網絡之間的廣域網接口的每個2M口數據量均達到飽和,接近80%.
問題在哪兒呢,僅僅是B網絡增加了傳奇用戶嗎?不是,我們判斷問題在于A、B網絡的連接通道,路由器的廣域網接口是B網絡用戶訪問A網絡傳奇服務器的傳輸瓶頸??磥鞟、B兩個網絡之間的廣域網接口重負荷很可能是游戲速度緩慢的主要原因,經過我們長期監(jiān)測,該鏈路一直比較忙。由于各種原因,這個傳輸瓶頸不能從根本上解決,本次故障需從其它方面入手解決。
要根本解決這個問題,看來還得具體來分析傳奇游戲報文的發(fā)送過程:
我們聯系了一個正在玩?zhèn)髌娴挠脩?,使用Sniffer軟件進行跟蹤抓包,捕獲的數據流報文如下:
SourceAdressDestAdressSummaryLength 192.168.82.252192.168.8.190tcp:d=7200s=2353ack-1809293876wins=63266 192.168.8.190192.168.82.252tcp:Expert:FastRetransmission d=2353d=7200ack-577334120SEQ=1803135 192.168.82.252192.168.8.190tcp:d=7200s=2353ack-1809293957wins=63260 192.168.8.190192.168.82.252tcp:d=2353d=7200ack-577334120SEQ=1803107 192.168.82.252192.168.8.190tcp:d=7200s=2353ack-1809294010wins=63260 |
分析捕獲的傳奇數據報文,發(fā)現傳奇游戲使用的是TCP/IP協議,服務器端口為7200,數據包很小,發(fā)送為100bit左右,收為60bit左右,而且我們發(fā)現它發(fā)的數據包一旦丟失就會重傳,我們分析這就是導致玩?zhèn)髌嫠俣嚷闹匾颉?/p>
我們知道,大部分流媒體數據報文是基于UDP協議的數據包,它不需重傳,對網絡傳輸精度要求不是特別嚴格,只是保證它的帶寬等如視頻點播等即可。在A、B兩個網絡的廣域網傳輸中包含各種協議的不同大小的數據流,因此在網絡傳輸中,數據包一旦發(fā)生碰撞或擁塞,基于TCP的數據量小的傳奇數據包由于比較小而沒有優(yōu)勢容易被其它大包堵塞而丟失,必須重傳。所以我們的傳奇數據包在傳輸中沒有優(yōu)勢,這就是傳奇游戲速度慢的根本原因。
故障解決
通過以上網絡測試和分析得到了故障的主要原因,但是完全依賴拓寬路由器之間的廣域網是不現實的,因此本次故障需從其它方面入手解決。
能不能讓傳奇報文優(yōu)先發(fā)送和接受呢?于是我們咨詢了位于A、B網絡之間的核心路由器廠家并得到了他們的大力支持,結果是肯定的。我們通過對路由器的軟件升級,利用A、B兩個網絡之間的兩個路由器高品質的QOS對通往傳奇服務器的數據流進行優(yōu)先傳輸考慮,做了一個訪問控制列表,啟動系統的限速功能,提高傳奇服務器數據流的優(yōu)先權,問題得到解決。
具體設置如下:
ipmultipathmodepacket priority-list10protocoliphighlist100 rate-limitenable access-list100permitip192.168.8.190/32any interfaceserial2/0:0(至serial2/0:0) priority-group10 |
總結
網絡問題和網絡故障在網絡應用中隨著網絡結構、網絡技術、網絡容量的變化,會不斷出現一些新的問題,但是不管怎么變,它都有自己的特點,只要我們認真分析各個方面,總會找到解決辦法的。