在英特爾的推動(dòng)下,IT系統(tǒng)通信帶寬和計(jì)算能力遵循摩爾法則不斷創(chuàng)下歷史新高,保持了每12-18個(gè)月翻一番的發(fā)展速度。與此同時(shí),IDC最新“數(shù)字宇宙”研究預(yù)測(cè):數(shù)據(jù)增長(zhǎng)速度將超過(guò)摩爾定律,2011年將達(dá)到1.8ZB;未來(lái)10年,企業(yè)將管理50倍于現(xiàn)在的數(shù)據(jù)量,文件量將增加75倍。在數(shù)字宇宙飛速膨脹的背景下,“大數(shù)據(jù)”的概念也應(yīng)運(yùn)而生。
詳解Big Data
其實(shí),大數(shù)據(jù)和云計(jì)算是兩個(gè)相生相伴的概念,盡管業(yè)界暫時(shí)并沒(méi)有關(guān)于大數(shù)據(jù)的官方定義,但其實(shí),各廠商對(duì)大數(shù)據(jù)的理解已經(jīng)達(dá)成共識(shí)。
EMC信息基礎(chǔ)設(shè)施產(chǎn)品部總監(jiān)兼首席運(yùn)營(yíng)官Pat Gelsinger認(rèn)為:大數(shù)據(jù)應(yīng)該包括三個(gè)要素,首先,大數(shù)據(jù)是大型的數(shù)據(jù)集,一般在10TB規(guī)模左右,有時(shí)候多個(gè)數(shù)據(jù)集集合在一起會(huì)形成PB集數(shù)據(jù)量。其次,這些數(shù)據(jù)集往往來(lái)自于不同的應(yīng)用和數(shù)據(jù)源,要求系統(tǒng)能夠把半結(jié)構(gòu)化、非結(jié)構(gòu)化和結(jié)構(gòu)化的數(shù)據(jù)很好地融合起來(lái);最后,大數(shù)據(jù)還具有實(shí)時(shí)、可迭代的特點(diǎn)。
IDC全球存儲(chǔ)及大數(shù)據(jù)項(xiàng)目副總裁Benjamin Woo則提出,大數(shù)據(jù)有四個(gè)基本要素,Volume、Variety、Velocity、value。首先,數(shù)據(jù)在容量上是海量的;其次,大數(shù)據(jù)是由大量的人提供的龐大數(shù)據(jù)集,具備多樣性特征;此外,無(wú)論是企業(yè)還是遍布世界各地的個(gè)人用戶提供數(shù)據(jù),這些數(shù)據(jù)的價(jià)值是非常高的,此外,從系統(tǒng)要求來(lái)說(shuō),希望獲得數(shù)據(jù)的速度是非常快速的。所以用四個(gè)V來(lái)概括大數(shù)據(jù)特點(diǎn)。
此外,EMC對(duì)大數(shù)據(jù)和云之間的關(guān)系做了更為深入的詮釋:大數(shù)據(jù)和云是兩個(gè)不同的概念,但兩者之間有很多交集。支撐大數(shù)據(jù)以及云計(jì)算的底層原則是一樣的,即規(guī)模化、自動(dòng)化、資源配置、自愈性,因此實(shí)際上大數(shù)據(jù)和云之間存在很多合力的地方。
“當(dāng)我們打造云設(shè)施的時(shí)候,就會(huì)想云設(shè)施上應(yīng)該跑什么樣的應(yīng)用,大數(shù)據(jù)就是在云上跑的、非常典型的應(yīng)用。例如盡管電子郵件也是云上的應(yīng)用之一,但也可以脫離云架構(gòu),但是大數(shù)據(jù)應(yīng)用必須架構(gòu)在云設(shè)施上。這就是兩者的關(guān)系——大數(shù)據(jù)離不開云。” Pat Gelsinger如是說(shuō)。
原文鏈接:http://storage.it168.com/a2011/1128/1280/000001280114.shtml