大數據往往來自全新的數據源,其中非結構化數據是絕對的主力軍。非結構化數據是指那些不方便使用數據庫二維邏輯表來表現的數據,包括所有格式的辦公文檔、文本、圖片、XML、HTML、各類報表、圖像和音頻/視頻信息等。IDC報告指出,全球數據量每18個月就要翻一番,每年全球產生的數據量已經高達40EB(1EB=1000PB),而這些瘋狂增長的數據則主要來自于非結構化數據。
隨著大數據研究的不斷深入,非結構化數據的作用日益凸顯。據凱捷咨詢與《經濟學人》信息部聯合研究顯示,有58%的高管人員依賴非結構化數據分析做出業務決策。然而,非結構化數據早已超出傳統數據庫的存儲和處理極限,目前很多廠商將其作為單獨的技術挑戰來對待。
為了進一步幫助企業處理不斷增長的非結構化數據,全球最大的開源技術廠商紅帽公司,面向非結構化數據推出開源存儲軟件解決方案——Red Hat Storage Server 2.0,也稱紅帽存儲2.0。
紅帽存儲2.0:大數據管理利器
紅帽是全球知名的開源解決方案提供商,使用社區驅動的方式提供可靠和高性能的云、虛擬化、存儲、Linux和中間件技術。作為第一家收入突破10億美元的開源廠商,紅帽認為開源的商業模式具有無限潛力。紅帽公司總裁兼首席執行官衛赫士在去年訪華時曾表示,紅帽在未來五年內銷售收入將突破30億美元。
紅帽最受歡迎的產品當屬紅帽企業Linux,這是全球應用最廣的Linux產品,也是造就紅帽影響力的巔峰之作。然而紅帽的發展不限于此,其產品策略緊隨IT趨勢不斷發生著變革。近幾年,隨著云計算產業的不斷深入,紅帽提出以云計算為突破口,以虛擬化為著力點,構建混合云生態系統的產品策略。伴隨2013大數據元年的到來,紅帽的產品策略也似乎開始向大數據傾斜,據衛赫士預測,在未來的20年里,大數據將會成為主流技術,將改變很多企業的核心價值。
存儲2.0就是紅帽進軍大數據的突破口。紅帽存儲2.0是一款可向外擴容的開源存儲軟件解決方案,主要用于海量非結構化數據的管理,是行業中首個能和對象存儲輕松整合在一起的文件存儲解決方案,有效擴展以滿足非結構化數據暴增的需求。它可以配置在預設平臺中,也可以配置在私有云、公有云或者混合云環境中,用來優化存儲密集型企業級工作負載。
追本溯源,這款開源存儲軟件來自于紅帽2011年10月收購的Gluster——這是一家專注于橫向擴展存儲的開源軟件初創公司,其開發的GlusterFS開源文件系統和Gluster存儲平臺軟件堆棧作為核心技術,為大數據的存儲管理與訪問提供支持。其中,GlusterFS開源文件系統是一套可擴展的開源集群文件系統,并能夠輕松為客戶提供全局命名空間、分布式前端以及高達數百PB級別的擴展性。
GlusterFS類似于Hadoop中的HDFS,但其相較于HDFS的最大優勢在于:它通過使用其自有的彈性Hash算法,實現了網絡附加存儲的大規模擴展,而沒有借助元數據實現這一過程。元數據是用來描述數據的數據,在某些情況下可能成為HDFS失敗的元兇,抑或線性可擴展性的阻礙。GlusterFS的這一特點極大的提升了數據尋址訪問的速度,同時消除了其他大數據系統常見的單點故障,數據冗余負荷與無限擴展的瓶頸。
此外,紅帽存儲2.0還能夠與Apache Hadoop完美兼容,存儲2.0提供大數據的存儲管理與訪問,Hadoop提供技術框架。GlusterFS既可以Hadoop HDFS整合在一起,也可以作為HDFS的替代產品,實現更加快速的文件訪問。紅帽存儲的Hadoop插件為企業提供了一種全新的存儲選擇,在為用戶提供企業級存儲特性的同時,還能保證API兼容和本地數據對Hadoop的訪問。

紅帽大數據解決方案:將開源做到極致
紅帽存儲2.0在大數據的存儲管理和數據訪問層面為用戶提供高性能和可擴展的解決方案。除了存儲,紅帽的大數據解決方案還包括Linux、JBoss中間件、企業虛擬化等產品家族,并通過開放式混合云模式來滿足用戶對企業級大數據的需求。具體來說,包括以下解決方案:
• 紅帽企業Linux:作為紅帽的旗艦產品,企業Linux是管理大數據最佳平臺。由于紅帽企業Linux擅長利用分布式體系解決大數據的關鍵需求,用戶可以將紅帽存儲構建在企業Linux系統上,獲得經濟劃算的、高可擴展的、高可用性的配置。與此同時,基于紅帽企業Linux還能開發出各種安全可靠、易于擴展的大數據應用,有理由將數據進一步轉化為商業價值。
• 紅帽企業虛擬化:紅帽企業虛擬化(RHEV)是一款針對服務器和桌面虛擬化的完整虛擬化管理解決方案,是第一個成熟的、完全開源的企業虛擬化平臺。RHEV較之專有虛擬化供應商,為尋求更佳總體擁有成本、更快投資回報率、迅速收支平衡和避免供應商鎖定的企業提供了真正的策略虛擬化替代方案。企業虛擬化與存儲的結合,能夠使用戶更加安全的訪問由紅帽存儲管理的共享存儲池,還能夠為企業降低運營成本、提高可擴展性和可用性,以及更高的性能。
• 紅帽開放混合云:開放混合云是紅帽的云計算產品策略,能夠實現大數據工作負載在公有云和私有云之間的輕松遷移。云計算和大數據兩者關系緊密,云計算為大數據的存儲和處理提供了良好的平臺,可以在短時間內調動眾多資源處理大數據;大數據處理將更多的應用帶到云上,也在推動云計算市場的發展。
• 紅帽JBoss中間件:紅帽JBoss中間件是一款適用于面向服務架構(SOA)的開源平臺,為創建和部署新的大數據應用提供強大技術支持,并能夠與Hadoop、MongoDB等大數據技術進行互動和整合,幫助企業抓住大數據機遇,應對大數據帶來的挑戰。
紅帽存儲結合企業Linux、企業虛擬化、JBoss中間件和開放混合云組成完整的大數據生態系統,為用戶提供靈活、安全的大數據解決方案,以滿足企業現在和未來對大數據的需求。
總結
總的來說,紅帽產品的最大特點就是“開源”,并將開源做到極致。開源是大數據的靈魂,憑借開源優勢,紅帽大數據解決方案發揮著巨大的潛力。未來,隨著紅帽在大數據領域的發展不斷深入,以紅帽存儲為主的生態系統,將提供一站式的大數據解決方案。屆時,紅帽云計算和大數據產品策略將雙管齊下、相輔相成,共同打造開源技術創新平臺。