設(shè)計一個較大規(guī)模的計算機網(wǎng)絡(luò),除了在技術(shù)先進性和高效靈活性方面考慮以外,還要考慮網(wǎng)絡(luò)故障管理方面的問題。在網(wǎng)絡(luò)拓撲設(shè)計方面,要求網(wǎng)絡(luò)層次簡潔清晰,主干和接入之間、各個子系統(tǒng)之間界限分明;在可靠性設(shè)計方面,應(yīng)考慮冗余設(shè)計,其中包括鏈路冗余、設(shè)備冗余、部件冗余等;在網(wǎng)絡(luò)設(shè)備選用要求方面,網(wǎng)絡(luò)設(shè)備必須支持通用的網(wǎng)絡(luò)管理協(xié)議和網(wǎng)絡(luò)管理技術(shù),如SNMP、RMON和端口鏡像等功能;在網(wǎng)絡(luò)故障分析和定位的實施方法方面,要求有確定網(wǎng)絡(luò)故障的分析定位流程。網(wǎng)絡(luò)故障管理系統(tǒng)在設(shè)計上應(yīng)該掌握以下原則。
1.分層檢查網(wǎng)絡(luò)故障的定位分析原則
網(wǎng)絡(luò)故障的分層檢查包括物理層、鏈路層、網(wǎng)絡(luò)層、傳輸層及上層應(yīng)用等。
物理層主要是指綜合布線系統(tǒng),包括骨干光纖系統(tǒng)及樓層雙絞線系統(tǒng),此外還包括各個連接節(jié)點等。物理層的故障主要表現(xiàn)在線路及節(jié)點的物理連接方式是否正確,設(shè)備的物理連接方式是否正確,設(shè)備的配置及操作是否正確等方面。
數(shù)據(jù)鏈路層的故障查找和排除,需要檢查路由器的配置,檢查連接端口的工作狀況。鏈路層故障分析內(nèi)容包括:數(shù)據(jù)鏈路層的運行狀況,流量狀況;鏈路層數(shù)據(jù)包的丟包,重發(fā)及包碰撞情況;網(wǎng)絡(luò)計算機設(shè)備的鏈路層驅(qū)動程序的加載等。
網(wǎng)絡(luò)層故障分析包括各種網(wǎng)絡(luò)設(shè)備的網(wǎng)絡(luò)層協(xié)議的加載,網(wǎng)絡(luò)層地址和網(wǎng)絡(luò)層路由的設(shè)置等。在進行網(wǎng)絡(luò)層故障分析時,首先應(yīng)檢查路由器接口的IP地址配置,然后可以沿著從源到目標的路徑,查看路由器路由表。如果路由沒有在路由表中出現(xiàn),應(yīng)該檢查是否已經(jīng)輸入適當(dāng)?shù)撵o態(tài)路由、默認路由或者動態(tài)路由。發(fā)現(xiàn)問題后,可以手工配置一些丟失的路由,或者排除一些動態(tài)路由選擇過程的故障,包括RIP或者IGRPl路由協(xié)議出現(xiàn)的故障等。
傳輸層分析主要包括上層應(yīng)用或協(xié)議在網(wǎng)絡(luò)層協(xié)議上的捆綁狀況等內(nèi)容。
應(yīng)用層分析包括服務(wù)器CPU運行狀況,系統(tǒng)核心進程的運行狀況,系統(tǒng)資源使用情況,應(yīng)用程序?qū)ο到y(tǒng)資源的占用和調(diào)度,以及系統(tǒng)管理等方面的內(nèi)容。
2.分段檢查網(wǎng)絡(luò)故障的定位分析原則
網(wǎng)絡(luò)故障的分段檢查包括用戶端、接入設(shè)備、主干交換設(shè)備、中繼設(shè)備等之間的鏈路連通及相應(yīng)端口的狀態(tài)檢查。
鏈路連通檢查的內(nèi)容,包括物理線路的介質(zhì)類型、物理線路的連通、物理線路的質(zhì)量(線路的距離、衰耗、終端設(shè)備的電氣特性等)、物理線路的最大數(shù)據(jù)承載能力和收發(fā)線路的對應(yīng)等。
相應(yīng)端口狀態(tài)檢查的內(nèi)容,包括兩端設(shè)備對應(yīng)的端口類型的統(tǒng)一性檢查、速率匹配檢查、雙工設(shè)置檢查、收/發(fā)時鐘的時鐘源檢查、數(shù)據(jù)收/發(fā)的線路接通情況檢查和數(shù)據(jù)流控制與擁塞控制檢查等。DTE和DCE之間的連接檢查還包括停止位、端口類型的轉(zhuǎn)換等參數(shù)的設(shè)置檢查。
3.采用縱向和橫向逐級分析的原則
縱向分析為從下到上按物理層、數(shù)據(jù)鏈路層、網(wǎng)絡(luò)層、傳輸層、應(yīng)用層等應(yīng)用的次序分析故障原因。橫向分析為從端到端按數(shù)據(jù)終端設(shè)備、網(wǎng)絡(luò)接入設(shè)備、網(wǎng)絡(luò)主干設(shè)備、網(wǎng)絡(luò)中繼設(shè)備、網(wǎng)絡(luò)主干設(shè)備、網(wǎng)絡(luò)接入設(shè)備、數(shù)據(jù)終端設(shè)備的次序分析故障原因。