昨天,由中國電子學會主辦,中國電子學會云計算專家委員會、中國云計算技術與產業聯盟承辦的“中國電子學會大數據與云計算專題研討會”在京西賓館召開。原信息產業部部長、中國電子學會名譽理事長吳基傳,工業和信息化部總經濟師、中國電子學會副理事長周子學等領導,以及中國科學院院士李未、中國電子學會云計算專家委員會主任委員、中國工程院院士李德毅等專家,圍繞大數據挖掘、大數據與云計算的關系、大數據帶來的技術和產業變革等話題展開討論。
吳基傳部長在發言中表示:“有人說云計算和大數據是一對孿生兄弟,我認為不要把這兩者等同,云計算和大數據在我國的發展都處在發展初期,用戶對其認知度還有一個過程。”
李未院士向與會嘉賓介紹了其牽頭的非結構化數據四面體模型課題,該課題已經歷時三年半,正在申請國際專利。所謂非結構化數據的四面體模型,即將非結構化數據分為原始數據、基本屬性、底層特征、語義特征四個方面,目前課題組已經建立500萬個非結構化數據樣列,通過語義關聯的方式進行數據查詢和檢索的實驗。他認為非結構化數據標注與處理的工程量十分浩大,大數據的加工必須有群體的介入。
李德毅院士在發言中表示:“當前云計算的落地極為迫切且至關重要,可以先從關乎民生的五大應用入手,這五大應用包括位置云、教育云、健康云、安全云、社保云。而無論大數據還是云計算,其應用前提都是帶寬的支持。”
作為企業代表,百度技術委員會理事長陳尚義也向與會嘉賓介紹了百度大數據面臨的挑戰及應對方法。據他介紹:“百度擁有的數據總量上百PB,且呈現高速增長的態勢。這些數據中非結構化數據占據絕大份額,此外還包括百度自己產生的日志。”
現在用戶對降低PUE(數據中心總設備能耗)的急迫性越來越高,據介紹,每降低0.1PUE,數據中心成本每年將節省1000萬元。據陳尚義介紹:“百度PUE是1.3,我們的數據中心建設極其重視綠色、節能、降耗,而且自建的數據中心考慮了眾多軟硬件的配合問題,并且將資源進行動態調度和重新分配。”
友友CEO姚宏宇在發言中表示:“大數據分析具有較為典型的行業特征,其專家將產生于行業內部。”