分簇RAID解決RAID存儲技術生存難題 - 數據中心

RAID存儲技術所面臨的挑戰之一就是重建故障磁盤所需的時間越來越長，這增加了數據丟失的風險，并威脅著那些歷史悠久的數據存儲技術的生存。

磁盤密度的增長速度遠遠超過了性能和可靠性方面的改善，一些存儲網絡行業人士甚至質疑RAID能夠足夠快地恢復故障磁盤以維持企業數據存儲領域的相互關聯性。

但是一些數據存儲廠商選擇了一種古老的方法來維持RAID的：分簇RAID（Declustered RAID），或者Parity Declustering，這是RAID先驅者Garth Gibson和Mark Holland在1992年的一份文件中提出的理念。

StorageIO Group創始人、高級分析師Greg Schulz表示：“我發現有趣的一點，如今RAID所面臨的一些難題與十幾年前是類似的。”

Schulz表示，這些問題包括：大容量磁盤驅動器的重建、分布式數據保護、可用性、性能和易用性。

分簇RAID的定義

分簇最早是針對鏡像磁盤推出的，之后在卡內基梅隆大學的Gibson實驗室中針對RAID 5陣列開發的。

高性能存儲公司Panasas共同創始人、首席技術官卡Gibson表示：“分簇技術將小簇磁盤集群的一個RAID控制器替代成多個RAID控制器的集合，每一個都可以通過光纖通道或者iSCSI SAN訪問所有磁盤。”

分簇技術因RAID的替換而有所不同，這樣每個校驗計算只涉及少數幾個磁盤，這些磁盤的設置會根據每個磁盤的字位而有所變化。結果是，分簇RAID 5中的每對磁盤都涉及相同數量的RAID替換。

不同的RAID有不同的分簇技術，因此每個校驗計算只涉及少數幾個磁盤，

Gibson表示：“當一個磁盤發生故障的時候，每個磁盤都承擔一部分恢復工作，分散到所有RAID控制器，而不是由一個RAID控制器和幾個磁盤做所有恢復工作，而其他磁盤和RAID控制器不參與恢復工作。”

因為分簇技術還會將在線冗余空間分配給所有磁盤——而不是有幾個在線冗余空間處于空閑狀態，因此即使是在恢復故障磁盤過程中的寫入操作也是分配到整個陣列的。

Gibson表示：“最終結果是，從一臺計算機上的一個應用，到所有磁盤和所有控制器的并行計算和分布式計算，RAID都會有所變化。計算會完成的更快，或者它在恢復期間對用戶性能的影響越來越小，或者兩者兼有。”

解決RAID重建難題

存儲、策略和系統資訊服務公司Silverton Consulting總裁Ray Lucchesi表示，驅動器重建時間的難題在于，重建一個1TB或者更大的磁盤驅動器所需的時間是按小時計算（如果不是按天的話），并且取決于存儲系統和RAID組是否繁忙。

不過，通過創建更大的單校驗RAID組（RAID條帶中有更多磁盤盤片）、交錯耦合RAID組或者使用擁有更多盤片的RAID 6等方法可以縮短重建時間。

但是對于一個大型RAID組來說，問題是數據覆寫可能會引發校驗磁盤上的性能瓶頸，因此RAID用戶所面臨的難題就是如何將大型RAID組更短的驅動器重建時間與小型RAID組更小的寫懲罰兩個特點結合起來。

Lucchesi認為，可以把校驗分簇作為一種解決方案，因為它會在多個磁盤驅動器之間分布校驗和數據，因此不會有一個磁盤來承擔所有驅動器的校驗。

這么做可以消除熱驅動器現象，而這一般審核通過使用更小的RAID組來實現的。

Gibson表示：“問題的核心是，讀取整個磁盤所花費的時間越來越長，每年增加大約20%。磁盤數據速率的增長速度逐漸落后于容量的增長，因此讀取容量更大的磁盤就要花費更長的時間。”

由于磁盤容量越來越大，所以RAID系統恢復一個故障磁盤就需要更長時間。傳統RAID系統通過從頭到尾讀取所有剩余磁盤、將缺失數據寫入到在線冗余磁盤中來實現磁盤恢復。

Gibson表示，需要更長時間恢復故障磁盤和被取代磁盤是一件糟糕的事，這有兩方面的原因。

首先，這意味著會危險期——更換故障磁盤和恢復其中內容的一段時間——變得越來越長。在這期間，可能會有更多故障導致數據丟失。而危險期的加長意味著數據可靠性降低。

其次，恢復是一項繁重的工作。這期間，有用的磁盤訪問減少，用戶工作負載的磁盤性能降低。恢復期越長，用戶“事倍功半”的時間就越長。

結果就是，RAID系統需要更長時間恢復到全面保護狀態，發生其他故障的幾率和數據丟失的可能性也有所增加。

Gibson表示，Panasas的校驗分簇技術將RAID從一個控制器和幾個磁盤的本地操作轉變成使用存儲池中所有控制器和磁盤的并行算法。

通過由上萬個單個磁盤陣列所組成的存儲池，校驗分簇技術能夠將恢復速度提高十幾倍甚至幾百倍。它將工作細微地分配到每個磁盤中，減少恢復流程對并發用戶工作的干擾。

將所有數據分布到多個磁盤中的方法并非Panasas獨有的。其他掌握這項技術的廠商還包括EMC、Google、日立、惠普、IBM和 Isilon。

IBM XIV和RAID-X

IBM XIV是一款基于網格、不使用傳統RAID的存儲系統。

IBM系統存儲高級存儲咨詢師Tony Pearson表示：“數據被分布到松散連接的數據模塊中，這些模塊被當作是獨立的構建塊。”

他說：“XIV將每個LUN分割成1MB的塊，將每個塊的兩個副本保存在彼此分開的模塊中的單獨驅動器上。我們稱其為RAID-X。”

有趣的是，描述這種分簇技術的術語五花八門，例如RAID-X、寬條帶、metavolume、區間池、條帶間條帶（stripes across stripes）、格條帶（plaid stripes）和RAID 500，每一種叫法都證明了RAID持續創新的獨特方式——即使每種創新并不都命名為RAID。

亚洲成精品动漫久久精久,九九在线精品视频播放,黄色成人免费观看,三级成人影院,久碰久,四虎成人欧美精品在永久在线