亚洲成精品动漫久久精久,九九在线精品视频播放,黄色成人免费观看,三级成人影院,久碰久,四虎成人欧美精品在永久在线

掃一掃
關注微信公眾號

理解大數據的真正含義 去除泡沫善用真實價值
2013-08-06   中國IT運維網

  被新聞媒體和學術會議宣傳得近乎神化的大數據,最近也頻頻被潑冷水。2013年年初,美國知名大數據分析公司Avasid聯合創始人兼CEO Gurieet Singht就暗示大家“大數據”可能并沒有那么靠譜。他指出,從查詢開始分析數據本身就是一個死胡同,目前,研究人員還只是從收集到的數據中提取1%進行分析,而這1%被分析的數據卻用來支配企業的革新和形成某種見解,這顯然是不科學的。2013年5月,阿里集團王堅的一篇“大數據,你們都理解錯了”的講話,立刻抓牢人們的眼球,也值得讓我們反思,大數據到底是什么?一直以來真的都沒有抓住要點嗎?

  我們沒有理解大數據的真正含義嗎?

  Gurjeet Singht的觀點有很扎實的依據。面對數據宇宙規模爆炸式的增長,科技發展的速度并沒有與之相匹配。根據IDC最近的報告,當前人們每天可以收集的數據約1qB,而數字宇宙的規模已經達到了2.8ZB的數據量。IDC預計,到2020年數字宇宙的規模將高達40ZB。移動技術、傳感技術的發展,讓人們采集數據的能力不斷增強,但識別數據的技術發展速度卻沒那么樂觀。比如,在當前數據宇宙中很多有價值的數據,都是基于文檔的未被標記的非結構化數據,人們對這類數據的識別、處理技術的研究剛剛起步。但市場中所謂成熟的大數據分析方法,卻普遍是基于有效數據標識來采集用于分析的數據。根據這種方法,有些數據因為無法識別所以不能被標記,因而不能被視為有效數據,在用于分析前,它們就會被拋棄。這一問題導致大量有價值的數據就這樣丟失了,完全沒有被利用。

  王堅的論述也有相當豐富的例子作為佐證,大數據很早以前就有,然而,數據僅有“大”是完全不夠的,即便是擁有全世界最多數據的歐洲對撞實驗室,只要他的數據與互聯網不沾邊,那么他對大眾來說就變得沒有意義。所以,今天我們對數據本質的研究不應該是大,而應該是“在線”。在線讓數據搜集變得容易,比如,以前美國要大選總統時,需要做蓋勒普民意調查,抽取2000人進行調查問卷的填寫,而現在,只需要在Twitter上分析每個人發布的狀態,就可以推斷出總統是誰,并且能夠快速影響社會。但是,要讓產品和數據結合得很好,還需要一個漫長的過程。

  磨刀不誤砍柴工——玩轉大數據

  紐約創業公司Media6Degrees首席科學家克勞迪婭·珀利徹也給正走在被神化道路上的“大數據”重重的一擊,“你可以用數據來欺騙自己,但我擔心大數據出現泡沫。”

  珀利徹擔心許多人將自己稱為“數據科學家”,但實際上卻并未做足功課,反而給該領域抹黑。 珀利徹認為,大數據似乎將面臨勞動力瓶頸,因為現有大數據專家們技能提升的速度遠遠不夠數據的增長速度。麥肯錫全球學會在2012年發布的一份報告也顯示,美國需要14萬名至19萬名具有“深度分析”經驗的工作者,以及150萬名更加精通數據的經理人,無論是已退休人士還是已受聘人士。這個數字無疑是龐大的。

  管理大數據要比搜集大數據意義重大的多,如何問問題,如何定義問題,從哪里提取數據?這都需要專業數據分析人士的技能,如果個人數字世界的算法過于簡單,就不會達到預期描繪的那般智能。試想,如果沒有挖掘出數據背后真正的價值,那么,再龐大的數據量也只是空彈,無法擊中要害。所以,大數據專家們都應該意識到大數據技術的局限和不足,培養經驗和敏銳的直覺,不能僅把聽取數據放在重要的位置。

  也許現在大多數應用大數據的企業,還只邁步在1.0、2.0版本上,但真正意義上的大數據時代,也許要到3.0版才能實現。

  ——電子科技大學互聯網科學中心主任、教授、博士生導師周濤

  善用數據,讓版本升級

  在新一次可能的第三次工業革命中,數據、計算將扮演材料、能源和先進工藝技術這樣的角色,如果把計算看成能源,能夠允許它像電力一樣進入大眾的生活并流動起來,以一種統一的收費方式,不在乎計算從何而來,就像我們不知道今天我們用的5度電是來自大亞灣還是三峽。可以想象,在未來云計算以及其他的計算能力將成為一個國家非常至關重要的核心戰略之一。數據就是其中一種戰略材料,每一個企業、科研團隊、都有責任通過一些計劃,有目的的搜集、處理、分析和索引數據。然而,未來的大數據如果想要成就偉大的企業,真正先進的工藝技術來自于更深入的分析,需要更聰明的頭腦,不再等同以前工業革命時期的工業技術,而在于擁有更聰明的頭腦。

  當然,大數據時代和以前的工業革命不同的是,它的特征是個性化的,并且帶來巨大的理念上的改變,同時也帶來商業模式的變化。電子科技大學互聯網科學中心主任、教授、博士生導師周濤將大數據在商業中的應用概括為1.0、2.0和3.0版本。“也許現在大多數應用大數據的企業,還只邁步在1.0、2.0版本上,但真正意義上的大數據時代,也許要到3.0版才能實現。”周濤說。

  1.0版所表現的,是企業通過自身的業務需求產生大量的數據,然后利用這些數據,通過深入分析,來優化相關的業務。在這個時候,數據起到了指導決策的作用。

  大數據的2.0版和1.0版的理念發生了變化。2.0強調數據的外延,數據除了從自身的業務產生并解決自身問題外,數據本身還有能力解決其他的問題,更有能力把其他數據聚集在一起解決自身問題。這里要求企業搜集與目標業務直接或間接關聯的大量異質數據,建立復雜的分析和預測模型,產生針對目標業務的輸出,這時候數據本身就是決策。

  3.0版也許會帶領大家進入真正的大數據時代。3.0版更加關心數據的質量價值,數據好不好,有多大價值,交換如何付費等問題,尤其是數據的隱私安全。在這個時候,會有類似于電信運營商的數據運營商出現,讓所有的學術團體、企業、政府,都能夠使用大數據,這才是真正的大數據時代的來臨。

熱詞搜索:

上一篇:Virident:用閃存打造高性能的現代數據中心
下一篇:保護企業的重要數據 網絡安全意識你有多少?

分享到: 收藏