在英特爾的推動下,IT系統通信帶寬和計算能力遵循摩爾法則不斷創下歷史新高,保持了每12-18個月翻一番的發展速度。與此同時,IDC最新“數字宇宙”研究預測:數據增長速度將超過摩爾定律,2011年將達到1.8ZB;未來10年,企業將管理50倍于現在的數據量,文件量將增加75倍。在數字宇宙飛速膨脹的背景下,“大數據”的概念也應運而生。
詳解Big Data
其實,大數據和云計算是兩個相生相伴的概念,盡管業界暫時并沒有關于大數據的官方定義,但其實,各廠商對大數據的理解已經達成共識。
EMC信息基礎設施產品部總監兼首席運營官Pat Gelsinger認為:大數據應該包括三個要素,首先,大數據是大型的數據集,一般在10TB規模左右,有時候多個數據集集合在一起會形成PB集數據量。其次,這些數據集往往來自于不同的應用和數據源,要求系統能夠把半結構化、非結構化和結構化的數據很好地融合起來;最后,大數據還具有實時、可迭代的特點。
IDC全球存儲及大數據項目副總裁Benjamin Woo則提出,大數據有四個基本要素,Volume、Variety、Velocity、value。首先,數據在容量上是海量的;其次,大數據是由大量的人提供的龐大數據集,具備多樣性特征;此外,無論是企業還是遍布世界各地的個人用戶提供數據,這些數據的價值是非常高的,此外,從系統要求來說,希望獲得數據的速度是非??焖俚?。所以用四個V來概括大數據特點。
此外,EMC對大數據和云之間的關系做了更為深入的詮釋:大數據和云是兩個不同的概念,但兩者之間有很多交集。支撐大數據以及云計算的底層原則是一樣的,即規?;?、自動化、資源配置、自愈性,因此實際上大數據和云之間存在很多合力的地方。
“當我們打造云設施的時候,就會想云設施上應該跑什么樣的應用,大數據就是在云上跑的、非常典型的應用。例如盡管電子郵件也是云上的應用之一,但也可以脫離云架構,但是大數據應用必須架構在云設施上。這就是兩者的關系——大數據離不開云。” Pat Gelsinger如是說。
原文鏈接:http://storage.it168.com/a2011/1128/1280/000001280114.shtml