亚洲成精品动漫久久精久,九九在线精品视频播放,黄色成人免费观看,三级成人影院,久碰久,四虎成人欧美精品在永久在线

掃一掃
關注微信公眾號

陳尚義:提升用戶體驗是大數據最主要價值
2012-11-24   財經網

嘉賓介紹:陳尚義,百度技術委員會理事長,國家科技重大專項03專項總體組專家,中國電子學會常務理事,云計算發展與政策論壇副理事長,云技術與產業聯盟常務理事。兼任北京航空航天大學教授、合肥工業大學教授、中科院研究生院碩士生導師,IEEE-CS授權培訓機構高級講師。

財經網:大數據的概念,其實不是單純這三個字的字面組合,它是完全全新一個大數據的定義,您是怎么來理解大數據的?

陳尚義:像你剛才說的一樣,大數據現在已經引起了工業界和學術界高度重視,有人試圖給它下一個定義。但是從我們的工作實踐來講,我個人的體會,大數據應該具備幾個非常關鍵的要素才可以稱為“大數據”。第一,毫無疑問,它必須要大,要有一定的規模,但是(究竟多達規模才稱得上大)業界對這一點沒有共同的認識;第二,它的復雜性。復雜性就意味著結構化和非結構化數據的大量并存,而且更多的是非結構化的數據;第三,它的動態變化性,也是構成大數據的必要要素,動態變化性表現在數據的持續變化。還有一個,業界普遍認為價值稀疏的問題,就像沙子一樣,里頭有很少量的金,大數據里頭真正有價值的數據確實是不多的。這就是構成大數據全部四個要素。我們也認同這四個要素,但是作為搜索引擎公司,我們的數據規模應該是業界最大的,數據變化、復雜性、價值的稀疏性等等,這四個要素我們都全部具備。除了這個之外,其實百度的數據還有更多的特點,業務對它的要求更多、更嚴格,包括對它的一致性要求等等,使得我們的數據比傳統意義上的大數據還要復雜。

財經網:為什么說百度的數據更復雜,具體復雜在哪?

陳尚義:首先對數據處理的時效性要求非常高,比如像新聞搜索、新詞學習,這些功能的推出,早了不行,比如新詞的學習,早了它沒有這個詞。大家都用這個詞的時候,這個詞才變成了熱詞,比如說我在搜索框里面輸入最近發生的一些熱門的事件,早了這個事件沒有發生,這個新的詞我不會提示你;晚了也不行,如果說這個時間拖得太久了的話,那個詞已經不再熱了,就是說對數據處理的時效要求很高。

第二,一致性要求。面對大量的數據,有些一致性要求極高,有些一致性要求不那么高。比方說百度因為有做推廣服務,客戶的數據,那里頭就是一些錢的數據,這個要求是一致性極高的。另外有些數據,比方說搜索,在搜索結果里頭,有些(次要的)內容沒有完全出來,這樣用戶也是能夠接受的,所以從這里講,數據的一致性要求不是那么強,所以,形成了數據一致性要求的強弱反差,有的很高,有的不高。所有這些因素使得百度的數據,跟傳統意義上或者大家目前討論的大數據相比,百度的數據更復雜,這還不包括百度數據的規模是罕見的。

財經網:海量的。

陳尚義:是海量的,是比傳統行業,甚至比互聯網行業的其他企業數據規模還大。

財經網:但是海量的另一面其實也是我們可發掘的內容就更多,這其實也是一個雙面的東西。

陳尚義:對。數據小了就沒什么價值了,數據越大,發現價值的可能性就越多。

財經網:大數據究竟為我們的行業帶來的怎樣的變化和影響?

陳尚義:大數據對技術或產業帶來了很多的變革。首先它對技術方面的變革,它直接拉動了數據中心規模不斷的增長。過去的數據量小,數據中心的規模也小,現在大數據年代,數據的中心規模會越來越大。它表面上表現的是大,其實不僅是大,背后蘊藏了很多技術的變革,比方說出于成本的考慮,數據中心越大,希望它能節能降耗,希望服務器的密度越高越好,希望服務器的部署的速度越快越好,所有的這些技術都在不斷的挑戰新的極限,創造一個又一個新的突破,這是大數據所帶來的必然結果。同時,大數據對我們的學術研究,或者是技術的開發也帶來了一些新的變革。過去在學術研究方面,我們在技術領域里面,更多的是依靠模型的方法,現在有大量的數據,我們可以借用這個數據,基于統計的方法,比如說語音識別、機器翻譯這樣的領域里面,可以更加容易的突破傳統技術所存在的困難,在大數據年代有望取得新的進展。

同時,大數據年代,大數據對商業模式也產生了影響。大數據年代,數據的擁有方,就是運營商,它具有大量的用戶行為習慣的各種數據,開發者他了解用戶的需求,他有開發能力,在大數據年代,運營商和開發者互利共贏的模式,已經取得了一定的共識。可以說大數據對社會生活、經濟、技術全方位形成影響。

財經網:剛才您也提到了大數據現在在百度也是有了很多的應用,其實我們也知道奧巴馬的團隊也是在拉選票的過程中也是應用很多大數據方面的成果,對于這個大數據應用的廣泛性已經是很受認可了,就您所了解的,包括可能在咱們企業之中,或者企業之外的,您覺得現在大數據已經應用到了什么樣的程度,或者是普及到了什么樣的程度?

陳尚義:程度不好說,但我更想說的是大數據同其他任何事物一樣,它本身是中性的,看誰在利用,就產生什么樣的效果。大選的時候,他就利用大數據做對大選有所幫助的事情。在其他領域里面,比如在交通、能源這些領域,對大數據的利用,可以使交通變得更加智能,我早上一出門就規劃出行路線,或者以節省時間為目的,或者以節省能源為目的。

我還聽說過一個例子,一家能源公司擁有豐富的資料,這些資料是以圖紙的形式存在的,他們要找石油或者是礦藏,通過對這些數據的加工整理和分析利用,應能準確地找到礦藏的所在地、油井的所在地,公司內部產生很劇烈的反應,有人說自己能利用大數據,自己發現這個金礦、油礦,屬于我自己開采的。另外有人說你自己處理不了,應該交給社會上去做。這個例子說明大數據促成了一種開放的心態,讓全社會來參與。

有的用來找油、有的用來規劃路線,有的為了提高生活質量、生活品質,有些人用作大選,還有些人用來做一些不正當的行為。比如說可以通過你留下的各種各樣的用戶行為的數據,發現你運動的軌跡,然后推測你是一個什么樣的人,你是什么樣的背景,你有什么樣的愛好,你家庭背景怎么樣,這樣就很容易造成個人隱私的泄露,大數據的利用看你怎么去用,可以從提高整生活品質,提高經濟效率的目的出發來利用大數據,反過來也可以被一些不正當的手段所利用。

財經網:其實現在大數據已經成為一個概念性的東西,行業的廣度已經覆蓋到了一定程度,因為它不局限在企業本身應用,它可以應用到各個行業和領域。

陳尚義:因為大數據是必然的,過去我們受制于存儲能力、計算能力還有人們采集數據的能力,各種各樣的能力限制,所以我們沒有辦法用大數據,像過去我們對數據進行人工錄入,錄入的數據是經過好幾道處理的數據,之后進去的都是精華的數據了,所以用傳統的數據庫就能夠存儲起來了,這是數據很小量的一部分,其實實際上有很多大量的數據,圖片、音頻、視頻的材料,還有各種各樣的圖紙,比方說醫院里頭的各種各樣的膠片,隨著設備的廉價和設備的先進性提高,還有傳輸的速度提高、存儲的能力提升,以及包括存儲的成本降低等因素,都促成了大數據時代的到來。大家都知道,每18個月存儲性能提高一倍,同時成本降低一半,所以這種趨勢是非常明顯,大數據鋪天蓋地而來,它不限于IT企業,也不限于企業內部,各行各業都是一樣的,全社會都是一樣的。

財經網:剛才您也談到了對于產品本身的應用,比如說搜索上,其他的領域有沒有一些拓展?

陳尚義:我們也分析行業的趨勢發展,然后形成發展報告,供我們的客戶,甚至供全社會免費下載使用,比如我們一直在發布一個報告《移動互聯網趨勢發展報告》,這是根據我們后臺的數據統計,形成的一個報告,給移動互聯網年代的開發者去參考,比如說哪款手機現在正在流行,哪種操作系統現在占比例多大等等。#p#副標題#e#

財經網:目前我們有沒有應用大數據來挖掘一些可以創新的點,或者是一些盈利的點,因為前一段時間也有一些新聞來報道,現在京東也在運用大數據的基礎上,它開始做客戶的信貸之類這樣一些業務,它是發掘出來一些新的盈利點,或者是一些創新的點,這方面百度目前有沒有做,或者是說未來會不會做?

陳尚義:百度現在是以搜索為主營業務的公司,我們一直在很專注地做一件事情,那就是持續不斷地提高用戶體驗,用戶的搜索體驗。去年我們也推出了百度的個人首頁,個人首頁是什么意思呢?就是說你不用搜索,就能夠得到你想要的結果,用我們的話講叫“不搜即得”。就是在搜索框里面,你還沒有輸入,就得到想要的結果,就是不搜即得,因為百度知道了你過去對什么東西感興趣,從后臺的一些數據記錄和日志里頭知道,通過挖掘分析這些數據知道用戶對什么樣的東西感興趣,然后實行了自動的推送。

財經網:推薦算法

陳尚義:對,推薦算法。這是我們在大數據利用方面很好的一個例子。另外一個例子,我們在機器翻譯和語音識別上面,我們也利用了大數據的基礎,通過統計的方法,不斷的提高翻譯的準確率,不斷的提高語音的識別準確率,這個也給用戶帶來新的體驗。現在大家都說,尤其在移動互聯網手機這個年代,由于它鍵盤輸入的限制,通過語音這樣跟它交流起來可能更加容易,這個方面我們的成果應該達到了業界最先進的水平,翻譯和識別的準確率都達到了業界最先進的水平。

財經網:您剛才談到的主要是用戶體驗的方面,對于百度這樣的搜索企業來說,大數據它的價值,您覺得最大的價值是在用戶體驗這方面嗎?

陳尚義:用戶體驗是最主要的方面,包括我們說推廣外界說是廣告,我們這個專業術語叫搜索推廣,或者是搜索營銷,我們的客戶在我們的搜索結果里頭發現推廣信息,這個推廣信息,要是做到好的話,用戶是喜歡的,而不是討厭這些廣告,這一點也依靠大數據,就是要提高廣告或是搜索推廣跟搜索內容的相關性,這個背后是大數據的技術,就是要不斷學習用戶的興趣點在什么地方,不斷地學習你這次搜索與什么廣告相關,如果真正做到這一點,用戶不僅不反感廣告,而且是喜歡的。這點來講,也可以說是用戶的搜索體驗,同時也是提高百度收入的一個方法。

財經網:也是相輔相成的。

陳尚義:對,相輔相成的。我們只有不斷的提高搜索體驗,我們才能夠取得相應的經濟回報。

財經網:剛才您也談到了很多百度在大數據的挖掘和應用,在您的切身感受之中,在挖掘的過程中,或者是應用的過程中,都遇到了哪些問題,對您印象比較深刻的?

陳尚義:我們在不斷地應對這種大數據帶來的挑戰,其中的第一個挑戰就是存儲,做搜索引擎的公司,要把全網的數據 “爬”過來,存到我們的數據中心里頭,這個工作不僅是單純地給它存起來,而且有很強的時間要求,你要不斷的更新。要是更新不快,我們提供的搜索結果就是過時的,用戶也不高興,這個體驗不好。我們要在非常有限的時間里頭把這些數據爬過來,存起來,要更新,這是我們不斷遇到的挑戰。相對應的就是我們的存儲體系也要不斷更新,或者是不斷的創新,才能夠滿足剛才我講的,數據量大和快速更新的挑戰。實際上我們公司從成立以來,不斷的受到這種挑戰,很多東西業界沒有給你參考的,也無法給你提供參考,更無法給你提供經驗和教訓,因為別人沒有遇到過這種架勢。

財經網:第一個吃螃蟹的人。

陳尚義:對,因為互聯網公司在不斷接受一些新的挑戰,因為同樣的互聯網兄弟公司,比如像Google可能有類似的經驗和技術,但是它絕對不會告訴你,所以從這一點講,百度應該在大數據的各個方面,存儲處理,還有加以利用各個方面,應該是說具有國際競爭力的核心技術。

財經網:因為現在已經出現了一些專業的做大數據分析這樣的一些公司,或者是說咨詢公司,但實際上在握有數據的主體的,他其實考慮到數據的私密性,可能會并不是特別愿意跟這樣的專業分析公司來合作,您覺得這樣合作的前景,它會有一個比較好的前景嗎?

陳尚義:隨著這個產業不斷的發展壯大,分工的精細化是一個必然的趨勢。剛才你說的那些問題可能是在發展之中都會得到解決的問題。

財經網:但是您說數據的私密性,所以說未來可能還是會打破這個壁壘,會有一個全面合作的格局是嗎?

陳尚義:我是這么看,因為這種分工的精細化肯定是一個趨勢,至于說隱私問題,還有商業機密的問題,這個可以通過很多種渠道去解決,比如說這個行業越來越規范,國家出臺一些相應的保護措施等等。

財經網:剛才您也是談到了大數據對于一些技術上的革新和變化,會帶來一些給人非常好的變化。隨著大數據時代的到來,一些握有大數據的這樣一些公司,或者說這樣的產業,在未來,在它的比如說產業鏈或者是產業分工的格局上,會有怎么樣的變化?

陳尚義:這個問題過去也跟一些業內人士探討過,人家問我是不是像您百度這樣的企業,握有大數據,會不會很霸道,話語權是不是很大。其實我覺得不是這樣的。擁有大數據的企業,它在數據的處理能力方面,肯定有先天的優勢,但是在現在移動互聯網,特別是云計算,或者是移動云計算的年代,用戶的要求是豐富多彩的,大家都說現在是應用為王的年代,而應用是豐富多彩的。作為一家企業,哪怕你是百度這樣巨大的企業,也滿足不了所有用戶的要求,只有貼近社會、貼近用戶這樣的一些中小開發者,甚至是一些個體的開發者,他們才能了解用戶的需求,開發出豐富多彩的、很多、很小的應用,有些是你大公司想不到的。在這種情況下,百度跟開發者之間其實在大數據上也有很好的結合點。比如說一個小的開發者在開發他的應用,他如果調用了百度的這種大數據的處理能力,比如說地圖的API,我們大家都知道百度地圖,包括定位這個技術已經做的非常好的,用戶也非常多,我們把這個技術開放給開發者,哪怕他是一個個體的開發者,他實際上站在百度的肩膀上,他開發那個小的應用也具有定位的能力,用百度地圖的這種能力,這樣實際上他站在百度的肩膀上,使他開發的應用功能更強大,更好地滿足用戶的需求,像這樣的地方其實還有很多,包括百度的翻譯,包括百度很多的大數據處理能力、統計分析報告,他都可以去用。這樣建立一種互補的關系,一種合作的關系。實際上我可以這樣講,擁有大數據的企業,它對整個產業鏈的拉動應該發揮了更大的作用。

財經網:但是還是會有一些合作的模式會發生一些變化?

陳尚義:合作的模式會發生一些變化。過去,不是在大數據能力基礎之上給這些中小企業開發者提供這種服務,而是大企業利用大數據給自己的業務服務。現在大家都講開放,實際上我剛才講一點,不知道你有沒有留心,大數據這個年代實際上是促進了開放,為什么這樣講?因為首先握有大數據的這種企業,由于它的業務,專注的業務方面所受限制,大數據的很多價值它沒有利用起來,這是一個。另外,我講了,在應用開發方面,應用大數據,你滿足用戶的多姿多彩的需求,你必須跟開發者進行合作。剛才我還講一個例子,那個找石油的企業,他們內部這種數據的處理和發掘問題的能力,由于受到這個限制,所以它很久都沒有根據大數據找到他所需要的礦藏資源,它對全社會開放了,利用全社會的力量去找,很快就能達到它的目的,實現了多方的共贏,促進了合作的方式。

財經網:開放也是有風險的。

陳尚義:當然。什么事情都是有它的兩面性。

財經網:您剛才談到的開放這一面,可能它的另一點很重要的,就是如何掌控這樣的隨時而來的風險?

陳尚義:目前,我們也嘗試做一些開放。比如我們的開放研究計劃,就是把我們的數據交給研究者、學者去研究,在這個開放過程中,我們其實也積累了一定的經驗,有一些提前的規劃,比如說我們對用戶開放數據,我們不能暴露用戶的注冊信息,這個我們開放之前我們是一定要經過處理的,為了保護用戶的隱私,在初始的時候,不可避免的可能有用戶ID的信息,還有一些其他的信息,這些要經過清洗,還有跟開發者、研究者簽署協議,這些風險都可以依靠安全措施得到解決的。

財經網:謝謝您。

 

 

熱詞搜索:

上一篇:大數據時代地圖服務商的選擇——堅守數據
下一篇:IDC:大數據不是簡單的定義 隨時間而改變

分享到: 收藏