只要遇到無法理解的事情,我們就會說那是偶然,似乎這種表面上的偶然行為推動了歷史的演進(jìn),而事情發(fā)展之迂回曲折似乎如擲骰子一般。但這種偶然真正意味著什么?
而法國數(shù)學(xué)家泊松指出,一旦我們承認(rèn)人類行為是最隨機(jī)的,它突然之間就可以被預(yù)測了。
悖論嗎?其實(shí)有一個最適合說明的例子,正是擲骰子:雖然每次擲的點(diǎn)數(shù)無法預(yù)測,但整體是有規(guī)律可循的。也就是,大約每擲5到7次就會出現(xiàn)一次6,而擲100次都不出現(xiàn)6的可能性幾乎為零。
泊松的理論即為概率論中著名的泊松分布,而著名物理學(xué)家巴拉巴西則在《爆發(fā)》一書中進(jìn)一步將觀點(diǎn)明確為“人類行為93%是可以預(yù)測的”。
那么,當(dāng)我們的電子郵件都在服務(wù)商的日志中;我們的通話記錄、行蹤都在運(yùn)營商的存儲上;我們買了什么東西、品味以及支付能力都在信用卡記錄里;我們所有的微博、空間、個人主頁,干脆展示在網(wǎng)站上……
這些記錄的存在引爆了個人隱私危機(jī),但它同時也創(chuàng)造了前所未有的歷史機(jī)遇——它第一次毫無偏見地為我們提供了成千上萬人、而不是少數(shù)人的詳細(xì)行為記錄。借助這些數(shù)據(jù)和強(qiáng)大的計算技術(shù),物理學(xué)家、心理學(xué)家以及經(jīng)濟(jì)學(xué)家得以對某些問題仔細(xì)研究。他們有充分的證據(jù)證明,人類的大部分行為都受制于規(guī)律,而且它們的可重現(xiàn)性和可預(yù)測性與自然科學(xué)不相上下。
這些發(fā)現(xiàn)并不只是科學(xué)家在紙上談兵,其中一些模型和原理已經(jīng)價值數(shù)億,像谷歌和雅虎這樣以追蹤人類行為為商業(yè)模式的公司都身價不菲。可以說,它們顛倒了乾坤。在過去,如果想了解人類的行為和想法,你必須去考個心理學(xué)家證書,但現(xiàn)在,你可能需要先拿到計算機(jī)專業(yè)的學(xué)位。
推而廣之,“無論什么事,如果不斷收集材料,積之十年,總可成一學(xué)者”,每天進(jìn)行的事情將成為這種“爆發(fā)”的基礎(chǔ)。這意味著,時間是我們最寶貴的不可再生資源,如果我們尊重它,就必須剔除無關(guān)緊要的事;只有優(yōu)先清單確定,冪律規(guī)律和你所期待的爆發(fā),才會不可避免的出現(xiàn)。
同樣,“歷史不會重演,卻自有其韻律”,如果能洞悉其中的規(guī)律,那么我們的未來,或許就掌握在大數(shù)據(jù)的手中。

本文后半部分為書摘,節(jié)選自湛廬文化《爆發(fā)——大數(shù)據(jù)時代預(yù)見未來的新思維》,作者為全球復(fù)雜網(wǎng)絡(luò)研究權(quán)威、馮·諾依曼獎獲得者艾伯特·拉斯洛·巴拉巴西。
作者或許并不為廣大讀者熟知,電信市場營銷專家王煜全甚至在微博上發(fā)問:格拉德威爾的《引爆點(diǎn)》人人能懂,成了超級暢銷書;凱文凱利的《失控》多數(shù)人讀不懂,但人人奉為經(jīng)典;巴拉巴西才是真正理解復(fù)雜網(wǎng)絡(luò)的專家,他的《鏈接》同樣系統(tǒng)而宏大,卻沒什么名氣,這是為什么呢?有網(wǎng)友解釋為網(wǎng)絡(luò)時代的快餐文化,亦有人認(rèn)為這是因?yàn)榘屠臀鞯膶懽魈攸c(diǎn):大量舉例描述,甚至看起來像小說,結(jié)論則需要概括才能得出。
@創(chuàng)事記 在此將書中主要觀點(diǎn)列于以上,并附書中內(nèi)容精選:
泊松的悖論
泊松指出,一旦我們承認(rèn)人類行為是最隨機(jī)的,它突然之間就可以被預(yù)測了。
這似乎是個悖論:如果不可預(yù)測性是指偶然性,那么偶然性又怎么能預(yù)測呢?答案很簡單:泊松所謂的預(yù)測跟我們?nèi)粘I钪凶非蟮挠兴煌8了固胤?middot;泰勒格迪對教皇十字軍的未來所做的預(yù)言不同,他的手法更像愛因斯坦推導(dǎo)原子運(yùn)動規(guī)律。愛因斯坦知道推測出單個原子的運(yùn)動軌跡是不可能的,所以轉(zhuǎn)而假設(shè)原子的運(yùn)動是隨機(jī)的,然后推導(dǎo)出原子離釋放點(diǎn)的距離遵循擴(kuò)散理論。
同樣,泊松根本沒去想陪審員是否做出了正確裁定,而是假設(shè)每個陪審員都像擲骰子那樣投票:他們大部分時間是對的,但偶爾會出錯,而且我們永遠(yuǎn)無法知道他們什么時候是對的,什么時候是錯的。在這一假設(shè)的前提下,泊松利用定罪率的統(tǒng)計數(shù)據(jù)推導(dǎo)出了整個陪審系統(tǒng)的可靠性。
雖然下次擲的點(diǎn)數(shù)是個謎,但在這種偶然性中還是存在某種神奇的規(guī)律。盡管存在明顯的規(guī)律,但泊松過程實(shí)際上是一個再隨意不過的過程了,因?yàn)樗褪且幌盗信既皇录睦塾嫛R蚨x泊松預(yù)測常常代表某種隱藏的秩序,它們揭示了一種有待發(fā)現(xiàn)的更深層次的規(guī)律或模型。
誠然,我們觀察到的很多現(xiàn)象都絕非偶然,比如行星運(yùn)動、亙古不變的日夜交替等。但另外一些現(xiàn)象,比如天氣,看起來似乎純粹是偶然。不過,正如理查森極力指出的,大氣受制于一系列規(guī)律和方程式。現(xiàn)在,各地的氣象學(xué)家都能通過計算成功預(yù)測天氣情況。此前,人們認(rèn)為很多現(xiàn)象,如日食、洪災(zāi)、旱災(zāi)都是受神秘的造物主支配。但現(xiàn)在這些現(xiàn)象都能夠被人類預(yù)測。這告訴我們,偏離了隨機(jī)性通常意味著某種基本規(guī)律有待人類發(fā)現(xiàn)。
大數(shù)據(jù)時代的大機(jī)遇
我們正處于一種不斷變化但卻日趨精密的被監(jiān)視狀態(tài)中。事實(shí)上,現(xiàn)在我們的一舉一動都能在某個數(shù)據(jù)庫中找到線索。
我們的電子郵件都保存在電郵供應(yīng)商的日志文件中;我們的通話記錄都被加上時間標(biāo)記備份在電話公司的大容量硬盤上;我們何時何地買了什么東西,我們的喜好、品味以及支付能力都被信用卡提供商編目歸檔;我們所有的個人網(wǎng)頁、空間以及Facebook文件,還有博客的信息都被保存在多個服務(wù)器上;我們的即時行蹤完全被手機(jī)供應(yīng)商掌握;我們的長相和穿著打扮都被安裝在各大商場和街角的攝像頭捕捉并記錄。雖然我們通常選擇不去多想,但事實(shí)上我們的生活完全能被這些雨后春筍般出現(xiàn)的數(shù)據(jù)庫所記錄的信息串聯(lián)起來。
毫無疑問,正是這些記錄的存在引爆了個人隱私危機(jī),而這一問題的嚴(yán)重性再怎么夸大也不為過。然而,它同時也創(chuàng)造了一個歷史機(jī)遇——它第一次毫無偏見地為我們提供了成千上萬人,而不是少數(shù)人的詳細(xì)行為記錄。在過去幾年里,這些數(shù)據(jù)庫為各大實(shí)驗(yàn)室提供了不少幫助,使很多計算機(jī)學(xué)家、物理學(xué)家、數(shù)學(xué)家、社會學(xué)家、心理學(xué)家以及經(jīng)濟(jì)學(xué)家得以在強(qiáng)大的計算機(jī)和新技術(shù)的支持下對某些問題進(jìn)行仔細(xì)研究。
實(shí)驗(yàn)的結(jié)果令人振奮。他們有充分的證據(jù)證明,人類的大部分行為都受制于規(guī)律、模型以及原理法則,而且它們的可重現(xiàn)性和可預(yù)測性與自然科學(xué)不相上下。這些發(fā)現(xiàn)并不只是科學(xué)家在紙上談兵,其中一些模型和原理已經(jīng)價值數(shù)億,像谷歌和雅虎這樣以追蹤人類行為為商業(yè)模式的公司都身價不菲。可以說,它們顛倒了乾坤。在過去,如果想了解人類的行為和想法,你必須去考個心理學(xué)家證書,但現(xiàn)在,你可能需要先拿到計算機(jī)專業(yè)的學(xué)位。
爆發(fā),生命奇跡的必要因素
生命遠(yuǎn)不是流暢或隨機(jī)的,而是在所有時間尺度內(nèi)都具有爆發(fā)式的——從幾毫秒到幾小時的細(xì)胞活動;從幾分鐘到幾周的人類活動;從幾周到幾年的疾病來襲;還有從幾千年到幾百萬年的進(jìn)化過程。爆發(fā)式是生命奇跡的必要因素,顯示出生物為了適應(yīng)和存活會進(jìn)行不懈的斗爭。
在美國,任何一個65歲或者更高齡的老人不管什么時候去診所或醫(yī)院就診,都需要將就診的詳細(xì)記錄,包括時間、地點(diǎn)以及診斷情況,遞交給醫(yī)療保險計劃處。在尼古拉斯·克里斯塔斯基的幫助下,我的研究小組拿到了10年的記錄并匯總了200萬個病人看醫(yī)生的時間。
我們會在何時得什么樣的病取決于眾多因素,從我們的遺傳基因到飲食、運(yùn)動、抽煙以及喝酒的習(xí)慣,再到我們的工作性質(zhì)以及環(huán)境等都有影響。所以,疾病降臨的那一天應(yīng)該是隨機(jī)的、不可預(yù)測的。
如果你接受人類所有的行為都不是隨機(jī)而是具有爆發(fā)式的,那我們對病史的發(fā)現(xiàn)也許就不那么令人吃驚了。不過,我們確實(shí)吃了一驚。你知道,疾病的緊急程度絕對不是依靠優(yōu)先級清單做決定的。如果我們真能按照意愿給疾病設(shè)置優(yōu)先級的話,我敢肯定大家都會直接將他們放在“待辦事宜清單”的最底部。通過給疾病設(shè)置低優(yōu)先權(quán),我們就能保證自己永遠(yuǎn)不生病,一生都過得充實(shí)健康。遺憾的是,事實(shí)并非如此——疾病會“攻擊”我們,會隨心所欲、出其不意地將我們這些受害者撂倒。
一般情況下,基礎(chǔ)科學(xué)轉(zhuǎn)化成實(shí)際應(yīng)用需要走的路很長。20世紀(jì)的科學(xué)奇跡量子力學(xué)在近半個世紀(jì)以來都沒有發(fā)揮什么實(shí)際作用,直到發(fā)明了晶體管才打破了這種僵局。同樣,盡管人類基因組的解碼引發(fā)了醫(yī)學(xué)革命,但10年后市面上的所有藥品還是通過基因組發(fā)現(xiàn)之前所使用的試錯法研制出來的。
基于此,當(dāng)看到爆發(fā)式那么快就從基礎(chǔ)科學(xué)轉(zhuǎn)為實(shí)際應(yīng)用的時候,我頗為吃驚。實(shí)際上,即使沒有獲得博士學(xué)位,你也能理解這一發(fā)現(xiàn)的潛在影響。不說別的,它們至少促進(jìn)了一種簡單而不受干擾的抑郁診斷方法的產(chǎn)生。你覺得情緒低落,而且所有癥狀都顯示出一種潛在的情緒紊亂嗎?那么就戴上能追蹤你一舉一動的腕表吧,醫(yī)生馬上會給出診斷結(jié)果,幫你趕走即將來臨的抑郁感。
普遍適用的爆發(fā)式
我們越是發(fā)現(xiàn)自己的身體細(xì)胞容易出現(xiàn)問題,就越覺得我們能經(jīng)常保持健康是個奇跡。但一想到兩個蛋白質(zhì)找到彼此的可能性要比你和最好的朋友在紐約市閑逛時奇妙的相遇的可能性小得多,你可能不禁會問我們的基因?yàn)楹螘龅萌绱顺晒δ兀?/p>
你并不是唯一一個想不通的人。生物學(xué)家一直對細(xì)胞協(xié)調(diào)眾多基因、蛋白質(zhì)、代謝物以及構(gòu)成組織的RNA分子的能力感到不可思議。我們之所以對這個過程知之甚少,主要是因?yàn)橐胍桓Q細(xì)胞的內(nèi)部世界真的很難。
在另外一個完全不同的時代和領(lǐng)域里,達(dá)爾文猜測每個新物種的出現(xiàn)都是一個漸進(jìn)的過程,現(xiàn)有物種孕育出多少有些差異的后代需要經(jīng)歷一個漫長的過程。但這種連續(xù)變化的證據(jù)不僅過去少有,就算是現(xiàn)在也很少見,因而達(dá)爾文稱它是“對我的理論的最有利的反駁”。
實(shí)際上,幾百萬年前的化石幾乎沒有顯示出進(jìn)化改變。大致上每隔幾萬年就會出現(xiàn)一種新物種,這跟進(jìn)化的時間相比簡直猶如一瞬。進(jìn)化具有爆發(fā)式,這在一代又一代的化石中都有記錄。在頗感奇妙的同時,這些發(fā)現(xiàn)也引出了一系列難解的謎題。首先,如果不是決定和優(yōu)先級設(shè)定產(chǎn)生了爆發(fā)式,那么為什么爆發(fā)式會出現(xiàn)在這么多系統(tǒng)中?我們能夠解釋這種普遍性嗎?
最近,系統(tǒng)生物學(xué)家研制出了基因活動模型,用以捕捉人類細(xì)胞內(nèi)部的爆發(fā)點(diǎn)。
知識似乎也具有爆發(fā)式,一個靈感的火花可能照亮幾個世紀(jì)以來都未明了的混沌。一旦我們找到了一個解決辦法,我們真能解決所有問題,還是僅僅引發(fā)了更多問題?這兩個問題不矛盾,因?yàn)楹芏嗨枷牖蚩茖W(xué)上的大變革帶給人的啟迪總是多于禁錮。
轉(zhuǎn)載鏈接:http://news.watchstor.com/stor-age-139949.htm