亚洲成精品动漫久久精久,九九在线精品视频播放,黄色成人免费观看,三级成人影院,久碰久,四虎成人欧美精品在永久在线

掃一掃
關注微信公眾號

SAN網絡故障排除
2007-10-08   網絡

在介紹SAN網絡故障排除之前,我們先來介紹兩個應用技巧。

交換機的LED

我們在討論SAN故障排除之前先看一下故障診斷工具,其中最重要的是交換機的LED顯示屏。

圖1是一個典型的SAN存儲網絡構架,其中包括Fbric線纜、主機、工作站、服務器、交換機、RAID陣列等設備。交換機處于主機和存儲設備之間的網絡中間位置,既能看到存儲設備,也能看到主機。得益于對存儲網絡兩端的可見性,您可以使用交換機確定SAN中所有故障的原因,通過查看交換機的LCD就能收集到大量的信息。可以通過查找“快閃黃燈”,確定設備發生了故障,或是它仍未處于聯機狀態。如果交換機置于異地,可以使用Web工具直觀、實時地了解LED的狀態。快速閃爍的綠燈是SAN正常運行的信號。通過實際觀察組成SAN的交換機,可以檢測模式,并確定處于邊緣狀態或是有故障的組件。例如,如果您處于需要確定在聯機和脫機兩種狀態間重復切換的設備的情況,此時就可以使用交換機的LED。

在觀察運行的Fabric線纜時,正常情況是該端口依次處于脫機狀態(沒有LED燈)、發光(保持為黃色)、進入聯機狀態(保持為綠色),然后循環進行同樣的步驟—無色、黃、綠。LED保持黃燈或黃燈閃爍,表明SAN中存在問題。LED由黃燈轉為綠燈,則沒有問題。邊緣設備斷電或未處于聯機狀態,都可能導致交換機的LED黃燈閃爍。如果交換機電源的LED開始慢速閃爍,則表明交換機的加電自檢(POST)過程存在故障,無法實現聯機。

將SAN視為虛擬線纜

當對SAN進行故障診斷時,可以通過將其分解為主機、SAN虛擬線纜及存儲設備來解決問題,這時將SAN視為一條虛擬線纜。對于操作系統來說,SAN是一條通往磁盤的鏈路,這正是傳統的小型計算機系統接口(SCSI)連接所實現的目標。

在剛開始進行故障診斷時,請將SAN視為一條虛擬線纜。傳統的存儲方式就是通過一條SCSI線纜將SCSI磁盤連接到主機。在這種情況下,您會關注4個組件:存儲設備、主機總線適配器(HBA)、主機的操作系統以及Fbric線纜。SAN故障診斷與傳統的存儲故障診斷過程有許多不同之處。在診斷直連SCSI設備的故障或是以太網故障時,采用的是排除法,可以將這一方法用于對SAN進行故障診斷。從宏觀層面講,如果將SAN作為一條虛擬線纜來考慮,問題有可能出在三個地方:主機、Fbric線纜或是存儲設備。采用類似于對分查找的故障診斷方式開始對這些領域進行研究,從中間部分著手,確定是處于問題的“上方”還是“下方”,然后繼續對可疑路徑進行對分,直到解決問題為止。

與傳統的存儲故障診程相比,對SAN進行故障診斷更為復雜。從SAN網絡的組成來看。它的故障主要分為:

◆ Fabric線纜故障

◆ 設備丟失故障

◆ 邊緣鏈路故障

◆ 輸入輸出(I/O)故障

Fabric線纜故障

Fabric線纜故障經常會嚴重地影響多個設備。由于SAN對邊緣情況的冗余補償,Fabric線纜故障在一個冗余的SAN上發生時,可能不會影響SAN的功能。但是這些“軟”故障能夠引起企業應用性能的降低,因此也應引起注意。大型Fabric線纜指包含10個或更多交換機及上百邊緣設備的Fabric線纜,它們更易于發生Fabric線纜故障。

Fabric線纜故障排除方法如下:

(1)Fabric線纜故障影響眾多設備。分段等邏輯性交換機中斷或物理性交換機中斷,能夠引起許多設備脫離Fabric線纜。ISL初始化故障也是需要考慮的問題之一。

(2)縮小Fabric線纜故障診斷范圍的最佳途徑,是對比基準SAN配置文件和當前SAN配置文件,并研究其差異。

(3)SAN配置文件的內容包括每個交換機上設備的數量、Fabric線纜中設備的數量、Fabric線纜中交換機的數量等。errShow命令和switchShow命令對于追蹤Fabric線纜故障也非常有用。

(4)一些Fabric線纜故障由Fabric線纜服務超時變量和邊緣設備超時設置的不匹配引起。必須仔細分析Fabric線纜和邊緣設備來解決這種復雜問題。

(5)從圖1中可以發現,SAN網絡設備中使用最多的是Fabric線纜。由于線纜通過墻角和門縫處,有可能被壓壞,因此,需要注意線纜是否截斷、線纜過度扭曲變形等。  

設備丟失故障

設備丟失的故障,一般會導致主機不能訪問某個SAN設備。這是常見的故障,一般使用交換機的switchShow命令和nsShow命令能夠很快找到設備丟失的原因。丟失設備問題通常只限少數一些設備。如果有許多設備丟失,則可能是Fabric線纜故障。因為SAN構架中Fabric線纜的使用數量最多,所以出現故障頻率也最多。

設備丟失的故障排除方法如下:

(1) 使用交換機的switchShow命令查看是否與SAN存在邏輯連接。

(2) 使用nsShow命令查看該設備是否在名字服務器中。如果設備不在服務器中,它對于Fabric線纜中的其它設備就是不可見的。

(3) 檢查Fabric線纜。

處于邊緣狀態的鏈路的故障

處于邊緣狀態的端口的影響非常大。例如,大型存儲設備(如RAID陣列)可能會被幾十個主機、服務器訪問。于是,存儲設備的邊緣行為可能會影響訪問該存儲設備端口的所有設備。處于邊緣狀態的鏈路涉及到交換機和邊緣設備之間的連接。確定鏈路處于邊緣狀態的原因,需要分析和測試組成鏈路的許多組件,包括交換機端口、交換機GBIC(千兆比特接口轉換器)、線纜、邊緣設備GBIC(千兆比特接口轉換器)以及邊緣設備等。

處于邊緣狀態的鏈路的故障診斷如下:

(1) 使用交換機的portErrShow命令確定是否存在大量的錯誤,例如CRC錯誤等。查找持續增加的錯誤數量來確認是否存在處于邊緣狀態的鏈路。

(2) 檢查處于邊緣狀態的鏈路的設備狀況,例如,處于邊緣狀態的鏈路共享的存儲設備故障能夠導致所有訪問該共享存儲設備的設備發生通信故障。

(3) 檢查組成鏈路的任何組件,包括交換機端口、交換機GBIC(千兆比特接口轉換器)、線纜、邊緣設備GBIC(千兆比特接口轉換器)及邊緣設備等。

I/O(輸入輸出)暫停的故障

和一般的PC和服務器一樣,I/O故障比較常見。所以I/O暫停發生時,SAN和邊緣設備都能夠承受。I/O暫停如同主機或存儲設備掉電一樣麻煩,它會導致I/O停止。可能有兩種原因,一種是較低級別端口的RSCN不能勝任,這可能是應用軟件和對存儲轉發時間敏感引發的問題。另外,Fabric線纜故障也能夠暫停I/O。

總結

與傳統的存儲故障診程相比,對SAN進行故障診斷更具復雜。在診斷直連SCSI設備的故障或是以太網故障時,采用的是“經過實踐檢驗”的排除法,可以將這一方法用于對SAN進行故障診斷。從宏觀層面講,如果將SAN作為一條虛擬線纜來考慮,問題有可能出在三個地方:主機、線纜或存儲設備。另外充分利用交換機的LED(液晶顯示屏)也是很重要的。筆者這里提供一個網址:www.syngress.com/solutions,這里有許多SAN故障診斷排除的案例可供參考。

表一:交換機各端口LED和定義

端口 LED定義

黃色 接收到燈或是信號的載波,但是尚未聯機

緩慢變黃 禁用(診斷、switchDisable命令的結果)

快速變黃 端口故障

綠色 聯機(通過線纜與外部設備相連)

緩慢變綠 聯機,但是已分段(Fabrlc參數不兼容)

快速變綠 正在進行內部環回

綠燈閃爍 正常聯機,有幀流量通過端口

熱詞搜索:

上一篇:StorMagic發新品進軍IP SAN
下一篇:中小企業存儲市場的缺口

分享到: 收藏