• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      內(nèi)特·希爾

      2013-04-29 00:44:03JonGertner
      快公司 2013年7期
      關(guān)鍵詞:希爾預(yù)測

      Jon Gertner

      當(dāng)停下來說我覺得……時(shí),內(nèi)特·希爾(Nate Silver)正咬著芝士漢堡,喝著第三杯可口可樂。然而,剛說了這么幾個(gè)字,他又停下來,伸手拿起一根薯?xiàng)l。談話,暫停,咀嚼。談話,暫停,咀嚼。這就是希爾的用餐模式。時(shí)間悄然流逝,在他整理思緒的空隙,你會(huì)留意起飄蕩于空氣中的環(huán)境音樂。你甚至發(fā)現(xiàn)餐館的通風(fēng)系統(tǒng)開了,又關(guān)了。

      攤開討論的問題是大數(shù)據(jù)——即大量信息的累積和處理——能改變我們的世界嗎?抑或這只是個(gè)被過分美化,但并不靠譜的技術(shù)。希爾是解讀體育和政治領(lǐng)域數(shù)據(jù)的天才。起初,他針對棒球數(shù)據(jù)統(tǒng)計(jì),開發(fā)了名為PECOTA的數(shù)據(jù)模型,分析那些有可能在大聯(lián)盟賽中異軍突起的小球會(huì),其預(yù)測結(jié)果之準(zhǔn)令人驚嘆。之后,他在Five Thirty Eight.com博·客上,以自己的數(shù)據(jù)模型預(yù)測2008年的總統(tǒng)大選(全美50個(gè)州中,49個(gè)州的結(jié)果正確)和2012年的總統(tǒng)大選(50個(gè)州全中)。此后,他還陸續(xù)預(yù)測了奧斯卡獲獎(jiǎng)?wù)?、NCAA(美國大學(xué)生體育協(xié)會(huì))籃球聯(lián)賽冠軍,以及同性婚姻支持者的地理分布。盡管在過去五年里,他的方法和模式備受質(zhì)疑和嘲諷,但是,他以幾乎百發(fā)百中的準(zhǔn)確率,向懷疑者證明,一個(gè)擁有大數(shù)據(jù)系統(tǒng)和殺手級算法、瘦不拉嘰的超級極客,也可以是個(gè)戰(zhàn)無不勝的劍客。現(xiàn)在,希爾的維基詞條已多達(dá)6.100字——是報(bào)道水門事件的傳奇記者鮑勃。伍德沃德(Bob Woodward)的將近兩倍。從來沒有新聞?dòng)浾吣苋绱酥斓爻擅?,更別提還如此精通統(tǒng)計(jì)分析。

      你可能因此認(rèn)為,內(nèi)特一希爾會(huì)對數(shù)據(jù)科學(xué)的非凡可能性,以及超強(qiáng)計(jì)算和分析能力聯(lián)袂打造的新時(shí)代欣喜若狂。但真沒有。

      吃完薯?xiàng)l,希爾金口重開:“我覺得……”,接著又停了下來。他就像在細(xì)細(xì)咬嚼關(guān)于大數(shù)據(jù)的數(shù)據(jù)一樣?!帮@然,”他終于做出了評論,“我認(rèn)為這是一門重要的技術(shù)。”他清楚計(jì)算機(jī)愈變愈強(qiáng),并記起谷歌主席埃里克·施密特(Eric Schmidt)曾經(jīng)的宣言,在某一天內(nèi),現(xiàn)代社會(huì)產(chǎn)生的信息會(huì)比2003年前所產(chǎn)生信息的總和還多。但希爾充滿警覺地補(bǔ)充了一句:數(shù)據(jù)洪流會(huì)帶來更多的“噪聲”(如無用信息),卻不一定能帶來更多“信號”(如真相)。有一次在飛機(jī)上,希爾看到雜志廣告在大肆渲染大數(shù)據(jù)非凡的預(yù)測能力。那些廣告無非是在表明,大數(shù)據(jù)將會(huì)協(xié)助商家事先了解消費(fèi)者的行為?!拔也⒉徽J(rèn)為這算什么模式轉(zhuǎn)變,”希爾說。“有時(shí),人們會(huì)天真地以為,只要你在機(jī)器里輸入數(shù)據(jù),按個(gè)鍵,就會(huì)出來各種奇思妙想,不是幫你每年提高10%的利潤率,就是讓股價(jià)翻一番。”

      他并不是悲觀論者,他補(bǔ)充道?!拔沂侵?jǐn)慎的樂觀主義者,而不是天真的樂觀主義者。說實(shí)話,獲得大量數(shù)據(jù)的方式很多,用它們胡搞瞎搞,提些愚蠢的問題,就能使自己陷入一團(tuán)亂麻中?!贝_實(shí)如此。但內(nèi)特-希爾的信徒們恰恰忘記了——希爾堅(jiān)信數(shù)據(jù)和預(yù)測無法超越人類的能力。不過,也正是由于希爾在數(shù)據(jù)解析方面的長處,他才脫穎而出,成為人類擁有“極限能力”的表率。我們是個(gè)容易犯錯(cuò)、帶有偏見、粗心馬虎的群體(尤其在政治領(lǐng)域)。我們住在一個(gè)缺乏真理的復(fù)雜世界里。很多時(shí)候,我們對電腦奢望太多,對自己卻期望過低?!叭藗冎粫?huì)責(zé)怪?jǐn)?shù)據(jù),”他跟我說,“但其實(shí)是他們該提出更好的問題?!?/p>

      大數(shù)據(jù)會(huì)改變世界嗎?希爾說:“回顧過去,那些我們事后發(fā)現(xiàn)的變革,通常都不是我們事先所預(yù)測的?!彼菍Φ模澜缫琅f如此,但他回避了這個(gè)問題。他放聲大笑,拿起芝士漢堡咬了一大口,開始細(xì)細(xì)咀嚼。

      這種說法似乎有點(diǎn)古怪:我們已經(jīng)走到這一時(shí)刻,即數(shù)據(jù)和創(chuàng)造力被捆綁于同個(gè)職業(yè),甚至同個(gè)人身上。希爾對這點(diǎn)倒沒啥意見,“我覺得存在兩種類型的創(chuàng)造力”。第一種就是他所說的“純粹表達(dá)”——用來描述音樂家、詩人、演員、舞者等藝術(shù)家的詞語?!傲硗庖环N,就是找出不同的方法看待并解決問題?!庇捎谒跀?shù)學(xué)領(lǐng)域工作(更確切地說,是數(shù)學(xué)、文字、信息圖表這些構(gòu)成他的博客和新書《信號與噪聲》[The Signal and the Noise]的模塊),因此這代表了在一個(gè)信息超載的年代,他為了能夠提出多種創(chuàng)造性的解決方案,找到了既適合個(gè)人又全然現(xiàn)代化的模式。

      希爾絕非從大數(shù)據(jù)系統(tǒng)中挖掘有趣結(jié)論的第一人,同時(shí),他也不是第一個(gè)因?yàn)榘逊治瞿P彤?dāng)創(chuàng)新工具使用而出名的人。大數(shù)據(jù)早就存在。它是追蹤早期傳染病模式(如1600年代倫敦爆發(fā)的黑死?。?,以及美國人口普查(開始于1800年代末期)的關(guān)鍵因素,你甚至可以將諾曼底登陸乃至阿波羅號登陸月球,都視為大數(shù)據(jù)的勝利。1970年代初,一群學(xué)者出版了《增長的極限》(The Limits to Growth)一書,書中使用復(fù)雜精細(xì)的分析模型檢驗(yàn)了地球的可持續(xù)性(程序得出的結(jié)論是,地球和人類社會(huì)很可能將面臨世界末日)。

      在他的新書和對話之中,希爾迅速指出最熟悉,同時(shí)可以說對大數(shù)據(jù)最成功的應(yīng)用,其中包括國家氣象局(National Weather Service)的天氣預(yù)測和颶風(fēng)警報(bào),這些都依賴于超大數(shù)據(jù)系統(tǒng)和神奇模型,并已變得越發(fā)精準(zhǔn)。也有很多常見的例子。多年來,華爾街的數(shù)量分析一直在幫對沖基金解析復(fù)雜的交易數(shù)據(jù);贏得“危險(xiǎn)邊緣”(Jeopardy?。┲橇τ螒?、現(xiàn)被用于醫(yī)療和財(cái)務(wù)策劃的IBM超級計(jì)算機(jī)系統(tǒng)“沃森”(Watson),則是某種大數(shù)據(jù)的成功范例——IBM喜歡稱其為“非結(jié)構(gòu)化數(shù)據(jù)”,以自然語言描述信息而非以數(shù)字的方式呈現(xiàn);而以國家安全的名義運(yùn)算大數(shù)據(jù)、故意保持低調(diào)的Palantir公司則是另外一個(gè)例子。更別提亞馬遜、Facebook、谷歌和Twitter,它們早已因?yàn)閺目蛻魯?shù)據(jù)中獲取信息情報(bào)而成為最重要的大數(shù)據(jù)從業(yè)者。通過挖掘網(wǎng)絡(luò)用戶的數(shù)據(jù)信息,這些公司在效率、潮流定位、銷售——至少就谷歌而言——在利于社會(huì)而非僅造就企業(yè)優(yōu)勢的研究調(diào)查方面,都取得了非凡的收獲?!氨绕鸺膊》乐沃行模–DC),谷歌能更好地預(yù)測流感,”前Linkedln首席數(shù)據(jù)科學(xué)家D.J.帕蒂爾(D.J.Patil)說,他現(xiàn)在就任于風(fēng)險(xiǎn)投資公司格雷洛克合伙企業(yè)(Greylock Partners)。

      希爾以個(gè)體數(shù)據(jù)分析家接受了這些挑戰(zhàn),雖然他更多地將其工作定位在“中間數(shù)據(jù)”的領(lǐng)域——這包括了成千上萬個(gè)數(shù)據(jù)點(diǎn),而非谷歌和亞馬遜研究員挖掘的數(shù)百萬甚至數(shù)十億的海量數(shù)據(jù)。但與數(shù)據(jù)的多寡無關(guān),它們所產(chǎn)生的清晰度更有意義。成長于密歇根東蘭辛市的希爾,雖然并沒有什么運(yùn)動(dòng)的天分,但從小就是個(gè)狂熱的體育迷。“我踢足球一直踢到八年級,”他跟我說?!斑@是我最不糟糕的運(yùn)動(dòng)項(xiàng)目?!痹谥ゼ痈绱髮W(xué)(University of Chicago)獲得經(jīng)濟(jì)學(xué)學(xué)士學(xué)位后,他進(jìn)入一家咨詢公司工作,結(jié)果卻只落得灰心喪氣和郁郁不得志。因此,他開始在夜間開發(fā)自己的PECOTA統(tǒng)計(jì)系統(tǒng),選擇棒球?yàn)閷ο?,純屬偶然。棒球是最富于?shù)據(jù)統(tǒng)計(jì)和分析的運(yùn)動(dòng)項(xiàng)目(在邁克爾·劉易斯[Michael Lewis]所寫《魔球》[Moneyball]一書中,就記錄了比利·比恩[Billy Beane]的預(yù)測運(yùn)算)。因精準(zhǔn)地預(yù)測棒球賽果聲名鵲起后,希爾想知道,自己是否能比華盛頓的專家更好地預(yù)測政治選舉。2007年,他開始篩選投票數(shù)據(jù),最初化名Poblano在Daily Kos博客上發(fā)表自己的分析(由于超愛墨西哥食物,他曾創(chuàng)建了一個(gè)評論芝加哥玉米煎餅的網(wǎng)站)。最后希爾才公布說自己是真正作者,然后創(chuàng)建起個(gè)人博客Five Thirty Eight(以總統(tǒng)選舉團(tuán)的投票人數(shù)命名),正式成為獨(dú)立于棒球統(tǒng)計(jì)世界之外的小小明星。幾年之后,《紐約時(shí)報(bào)雜志》(The New York Times Magazine)編輯在波士頓的火車站臺上偶遇希爾,誠邀他將其高流量博客帶進(jìn)《紐約時(shí)報(bào)》網(wǎng)站,直到現(xiàn)在。

      隨著他愈加出名,希爾在粉絲眼中更像是神,而不是一位數(shù)據(jù)分析家。不過,他的成功倒有不少耐人尋味之處,其中之_便是他從未真正成為,或試圖成為21世紀(jì)的時(shí)事評論員。這不僅是因?yàn)樗莻€(gè)不喜歡大肆宣揚(yáng)的低調(diào)的中西部人,也不僅只是因?yàn)樗矚g以不甚確定的措辭談?wù)撐磥?,而且總是坦承其預(yù)測中的不確定性。

      更關(guān)鍵的原因在于,他的預(yù)測不是反直覺的。希爾覺得,許多暢銷書聲稱將揭示“深藏其中”的問題,類似這樣的市場營銷很可笑——如《魔鬼經(jīng)濟(jì)學(xué)》(Freakonomics)和《黑天鵝》(The Black Swan)等?!案杏X就像將揭示什么神秘真理一樣,”他語帶諷刺地說道?!拔腋鼉A向于去簡化事物,而魔鬼就藏于細(xì)節(jié)中:他承認(rèn)他更喜歡尋找人們經(jīng)常忽視的‘房間里的大象(即刻意回避的事實(shí))?!庇袝r(shí)候它們存在于預(yù)測者的偏見之中——比如,他認(rèn)為,地方天氣預(yù)報(bào)員致力于講述跌宕起伏的故事,因此總是夸大下雨的可能性(所以說早上,你最好還是多看國家氣象局的數(shù)據(jù))。然而,還有一些顯而易見的錯(cuò)誤。在希爾看來,信貸機(jī)構(gòu)之所以在次貸危機(jī)前低估了美國房產(chǎn)市場的崩塌概率,正是因?yàn)樗麄兊念A(yù)測基于大量數(shù)據(jù),而這些數(shù)據(jù)都來自于景氣年代房地產(chǎn)統(tǒng)計(jì)——錯(cuò)得有點(diǎn)離譜。“他們有許多資料,”希爾說,“但卻沒能顯示不同狀況下房產(chǎn)體系走向的分析?!?/p>

      若要評估希爾數(shù)學(xué)模型的獨(dú)創(chuàng)性,那工程可就大了。不過,我們很容易就能領(lǐng)會(huì)他精準(zhǔn)的預(yù)測和精明的領(lǐng)域選擇?!拔覈L試挑選競爭不甚激烈的領(lǐng)域,”他笑著說。他是說真的。當(dāng)選擇預(yù)測政治時(shí),他確實(shí)感到幾個(gè)強(qiáng)力對手的存在,比如說,斯坦福大學(xué)的西蒙·杰克曼(Simon Jackman)和埃默里大學(xué)的德魯·林茨(Drew Linzer)。但通過棒球“點(diǎn)石成金”的實(shí)戰(zhàn)經(jīng)驗(yàn)——統(tǒng)計(jì)極客們倡導(dǎo)理性,而職棒大聯(lián)盟探子們則固守經(jīng)驗(yàn)和直覺勝于一切——希爾發(fā)現(xiàn)大多數(shù)政治專家們不僅對統(tǒng)計(jì)很無知,而且他們還極端封閉和排外。他經(jīng)常攻擊新聞機(jī)構(gòu)“政客”(PoIitico),在他看來,“政客”極為愚蠢、八卦、僵化,有時(shí)甚至不可救藥。正如希爾跟我說的,“政治新聞長久以來都是個(gè)懶惰的行業(yè),而在懶惰的大背景下,擁有創(chuàng)意想法的人就更容易成功?!?/p>

      當(dāng)我問他是否有興趣預(yù)測股市走勢時(shí),希爾聽起來似乎并沒什么熱情。股市預(yù)測已經(jīng)擁擠飽和,而且這也并非他擅長的領(lǐng)域?!敖^大多數(shù)時(shí)間我都買指數(shù)基金,”他承認(rèn)道。不過最近他破了一次例,因?yàn)樵诠墒兄行岬揭还善姾头抢硇缘奈兜?。“我曾?jīng)買了一些Facebook的股票,因?yàn)楫?dāng)時(shí)華爾街的朋友們都在賤賣。我覺得這更多是由于他們對Facebook首次募股形勢過好、對股票股價(jià)過高而感到憤怒?!边@個(gè)故事告訴我們:無論哪個(gè)領(lǐng)域,只要希爾覺得別人的決定是基于錯(cuò)誤原因之上,他就樂于利用這點(diǎn)進(jìn)行投資這個(gè)故事還沒完他幾乎在Facebook股價(jià)跌至最低點(diǎn)時(shí)買進(jìn)股票,而自那時(shí)起,股價(jià)就一路飆升。

      希爾聲名大噪之時(shí),他所處的領(lǐng)域正在激烈爭辯,最新統(tǒng)計(jì)工具是否真的將改變世界,或者對大數(shù)據(jù)已有的高度期待只不過是夸大其詞。這也影響著希爾??纯茨切╊I(lǐng)先的數(shù)據(jù)科學(xué)家們,包括希爾在內(nèi),你就會(huì)大致發(fā)現(xiàn)該領(lǐng)域確實(shí)處在變化之中。但為什么呢?正如希爾所說的,“某些方面已取得驕人進(jìn)展,但大多數(shù)領(lǐng)域僅稍有起色。”

      如今我們能獲得的數(shù)據(jù)如此之多,部分得歸功于手機(jī)、傳感器以及網(wǎng)絡(luò)流量產(chǎn)生的信息、記錄和測量值。我們擁有更強(qiáng)大的計(jì)算機(jī)運(yùn)算能力,成本也在降低。同時(shí),不同類別數(shù)據(jù)庫之間的相互作用愈發(fā)堅(jiān)穩(wěn)強(qiáng)勁,有利于揭示關(guān)于消費(fèi)、政治、運(yùn)動(dòng)、疾病、市場、媒體等領(lǐng)域過去難以覺察的模式。而且,實(shí)時(shí)以及正確獲取具體數(shù)據(jù)的能力也在逐漸提升。

      與此同時(shí),數(shù)據(jù)從業(yè)者也意識到限制和可能性所在。作為2012年奧巴馬競選的首席科學(xué)家,雷伊迪·加尼(Rayid Ghani)不再指望通過大數(shù)據(jù)去預(yù)測未來?!叭藗兤谕?,只要有足夠的數(shù)據(jù),我就能預(yù)測世間萬事?!彼赋?,有些東西是天生就不可預(yù)知的——比如,提前一年預(yù)測颶風(fēng),就像一位潛在客戶提出的要求。盡管如此,加尼仍親眼目睹了總統(tǒng)競選期間,他的分析工作在多個(gè)領(lǐng)域所起到的深遠(yuǎn)影響,即便分析本身并非什么靈丹妙藥。他的分析可更好地鎖定選民(通過找出可能會(huì)投給奧巴馬的選民,并引導(dǎo)他們進(jìn)行投票)、協(xié)助競選更好地分配資源(確定錢是更好地花在說服選民或用于集會(huì)),以及促進(jìn)資金的籌集(找到更好地號召選民的方式)?!拔覀兒芸赡軒退麄兌嗷I集了20%的資金,”他說。

      而有些在大數(shù)據(jù)里暢游的人卻更加狂熱,認(rèn)為數(shù)據(jù)將全然改變世界。其倡導(dǎo)者首推新書《大數(shù)據(jù)》(Big Data)的兩位作者,維克托-邁爾一舍恩伯格(Viktor Mayer-Schonberger)和肯尼斯·庫克耶(Kenneth Cukier)?!霸谀撤N程度上,現(xiàn)在擁有過去開發(fā)的各種數(shù)據(jù)技術(shù),”邁爾-舍恩伯格說?!拔覀儾槐卦倩ㄉ?0億巨資和長達(dá)十年的時(shí)間;反之,只需要一周或者一天,或者不用任何成本。”他指出,人類基因編碼的破解就是一個(gè)極好的例子。他的搭檔,《經(jīng)濟(jì)學(xué)人》雜志(The Economist)數(shù)據(jù)編輯庫克耶認(rèn)為,我們并不能因?yàn)榇髷?shù)據(jù)一開始被應(yīng)用于電子商務(wù),就認(rèn)為其最大乃至最具顛覆性的影響力只發(fā)生在商務(wù)領(lǐng)域。他認(rèn)為,技術(shù)之所以先在商務(wù)領(lǐng)域大量使用,是因?yàn)樯虡I(yè)擁有動(dòng)機(jī)以及所需的數(shù)據(jù),而且,也沒什么東西去阻止他們以創(chuàng)新的方式使用數(shù)據(jù)。庫克耶也看到大數(shù)據(jù)在衛(wèi)生保健和社會(huì)服務(wù)領(lǐng)域的重要應(yīng)用。“將其只看作唯利是圖的商業(yè)方式,”他說起即將到來的大數(shù)據(jù)時(shí)代,“完全是偏離重點(diǎn)?!?/p>

      除了追蹤如流感的傳染病之外,谷歌還用海量數(shù)字創(chuàng)造了先進(jìn)的翻譯程序;IBM應(yīng)用數(shù)字運(yùn)算能力預(yù)估早產(chǎn)兒的健康風(fēng)險(xiǎn),這在以前是無法實(shí)現(xiàn)的;通用電氣(General Electric)正開發(fā)帶有傳感器的新噴射引擎,可以收集和傳輸令人訝異的海量性能數(shù)據(jù),因而可協(xié)助發(fā)現(xiàn)潛在問題。與此同時(shí),眾多名氣較小的公司也都加入這座礦山的挖掘之中。硅谷初創(chuàng)企業(yè)Osito便開發(fā)了一個(gè)應(yīng)用,通過收集用戶地理位置和每日模式的數(shù)據(jù),該應(yīng)用每天都為用戶提供有用信息(如果交通路況不佳,Osito可能會(huì)提醒你及早趕赴下個(gè)約會(huì))。還有Kaggle公司,發(fā)現(xiàn)企業(yè)和非營利機(jī)構(gòu)存在的“數(shù)據(jù)挑戰(zhàn)”之后,公司就推動(dòng)成千上萬名數(shù)據(jù)科學(xué)家競相解決問題。最近,為響應(yīng)康奈爾大學(xué)和海洋地理大數(shù)據(jù)公司Marinexplore提出的挑戰(zhàn),Kaggle邀請用戶想出提高浮標(biāo)系統(tǒng)的運(yùn)算法則,以防止船艦撞上瀕臨絕種的鯨魚物種(獎(jiǎng)金為1萬美元)另一項(xiàng)競賽則要求用戶創(chuàng)造可分析病人健康記錄的運(yùn)算公式,以預(yù)測他們來年會(huì)在醫(yī)院呆上幾天(獎(jiǎng)金高達(dá)300萬美元)。

      這些努力都表明,大數(shù)據(jù)在某些技術(shù)較不成熟(以及資金相對不足)的社會(huì)領(lǐng)域——尤其是教育和醫(yī)療——的應(yīng)用具有極其廣闊的發(fā)展前景。其中某些前景必將由谷歌和IBM等私營公司來實(shí)現(xiàn);他們以創(chuàng)新的方式使用數(shù)據(jù),將為公益事業(yè)做出貢獻(xiàn)。

      另外,還有許多顛覆性影響來自個(gè)人,就像內(nèi)特·希爾這樣,用才華創(chuàng)造性地解決問題的自由數(shù)據(jù)科學(xué)家。今年夏天,奧巴馬競選數(shù)據(jù)科學(xué)專家加尼開始任職芝加哥大學(xué),為學(xué)生講解有關(guān)民生方面的數(shù)據(jù)科學(xué)應(yīng)用?!巴咛幷f,”加尼說,“使用技術(shù)預(yù)測采購行為,與預(yù)測你是否將從高中輟學(xué),是否染上疾病或犯罪,并不存在什么區(qū)別?!奔幽嵝Q那些在谷歌、Facebook和華爾街對沖基金工作的數(shù)據(jù)極客,都可以很容易地幫我們找到答案,比如,為何貧困社區(qū)的優(yōu)秀學(xué)生總是難以找到或申請到合適的大學(xué)?;蛘咚麄円部梢苑治龀鰞和逝趾湍芰肯牡哪J健!斑@些問題都非常相似,”加尼說?!瓣P(guān)鍵就在于有能力解決問題的人,并不一定意識到問題的存在。而且他們也不知道到哪兒幫助有需要的機(jī)構(gòu)?!弊詈?,加尼的目標(biāo)是搭起私營公司與未來用于公共目的大數(shù)據(jù)使用之間的橋梁。碰巧的是,他已經(jīng)有了不少同伴。2011年,一位名為瑞克·博威(Jake Porway)的數(shù)據(jù)科學(xué)家厭倦于自己沒能為世界做多少貢獻(xiàn)——事實(shí)證明,從事與大數(shù)據(jù)相關(guān)的工作,也不過是追蹤廣告點(diǎn)擊率,或者為消費(fèi)者創(chuàng)造推薦引擎?!拔耶?dāng)時(shí)想,要不試試看能不能聚集起一批人,找個(gè)周末黑黑醫(yī)療數(shù)據(jù),”他回憶道。“因此我向朋友發(fā)了個(gè)博客帖子:‘如果你是紐約數(shù)據(jù)社區(qū)的一份子,我想知道你是否有興趣加入?!毕⒑芸炝鱾鏖_來?!拔也┛偷淖x者群并不多,”博威說,“所以我沒想過會(huì)有人真當(dāng)回事。但到了周末,世界各地已有300人報(bào)名參加,并詢問著,‘我有興趣,該怎么加入呢?我甚至還接到白宮的電話!這實(shí)在太令人驚訝了。也就是這時(shí),我開始意識到這不僅僅只是我和朋友間的集會(huì),而是一場潛在的運(yùn)動(dòng)?!?/p>

      當(dāng)年七月,博威和幾位同事在布魯克林創(chuàng)辦了Datakind機(jī)構(gòu),充當(dāng)起急需數(shù)據(jù)分析協(xié)助并肩負(fù)使命的社會(huì)機(jī)構(gòu)與樂于貢獻(xiàn)才華的數(shù)據(jù)科學(xué)家之間的橋梁。這通常是無償公益貢獻(xiàn),而且一般不用于商業(yè)目的。他們一直處于繁忙之中:為非洲格萊珉基金會(huì)(Grameen Foundation)工作,與美國的陽光基金會(huì)(Sunlight Foundation)合作探討政治說客對立法者的影響。這類型的工作以前也做過,但通過梳理和比較海量數(shù)據(jù)庫——關(guān)于國會(huì)投票募捐人、黨派、捐贈(zèng),以及追溯至1800年代前期所有眾議院資料副本——分析家們具有更巨大的潛力,可深入探索(以及披露)這些問題。與此同時(shí),Datakind還與多家醫(yī)療機(jī)構(gòu)攜手共事,以發(fā)現(xiàn)所謂“冷鏈”——亦即接種疫苗與器官移植的運(yùn)輸路線——中的薄弱環(huán)節(jié)。目前,他們正致力于解析通過綁在運(yùn)貨車上Android手機(jī)收集而來的溫度數(shù)據(jù)。

      不僅如此,Datakind的幾個(gè)分支機(jī)構(gòu)亦已在世界其他城市涌現(xiàn)?!斑@有多酷呀!”博威說。

      內(nèi)特·希爾正努力想著下一步要做什么。今年他36歲。他那出于理性而非情感的政治興趣,已經(jīng)被選舉季給消磨光了?!拔覍?shí)在厭倦政治了,”他跟我說。“至少目前是這樣。政治界中有許多反社會(huì)分子和瘋狂之人,他們的瘋狂因子被這個(gè)奇怪職業(yè)激發(fā)出來。只是少了些……”希爾停下來,伸手拿了一根薯?xiàng)l,邊吃邊想。“我的意思是,因?yàn)槿绱穗S意,所以壓根不可能有真實(shí)性?”這與其作為追求真理數(shù)據(jù)科學(xué)家的理念背道而馳。“你知道的,”他繼續(xù)說,“比起無道德原則的商業(yè)領(lǐng)域,那政治根本就是道德敗壞。有些人問我是否要從事競選工作,我都會(huì)說,‘絕不。為對沖基金集團(tuán)做事能賺的錢多得多,而且工作性質(zhì)還沒那么邪惡。至少不是試圖操縱別人的信仰?!?/p>

      但他也不計(jì)劃進(jìn)入華爾街。雖說他也曾為好萊塢電影制片廠和ESPN(娛樂體育電視網(wǎng))做過商業(yè)顧問,但他似乎也不想沿著這條路發(fā)展下去。他寧愿寫作或發(fā)博客,就他所說,或者偶爾來個(gè)或有或無報(bào)酬的演講?!澳壳?,”他說,“對我來說重要的是,能做些有意義的創(chuàng)造性工作。過去十年間,有好幾年我基本沒賺到錢,比如我玩撲克那時(shí);而又有幾年賺進(jìn)了大把錢。”他的意思是,他不想以發(fā)家致富的名義妥協(xié)讓步。此時(shí),他將大多數(shù)可支配收入都用在餐館上,偶爾才會(huì)想體驗(yàn)奢侈生活。比如說,他正考慮買尼克斯隊(duì)的部分季票套餐,不過得先看看自己是不是還在為球隊(duì)失去了林書豪而感到憤怒。“增加收入確實(shí)不錯(cuò),”他總結(jié)地說,“但若我賺的錢是現(xiàn)在的十倍多,那必是源于某種邊際改進(jìn)?!?/p>

      他認(rèn)為,他的下本書可能會(huì)以信仰為題材?!皬哪撤N程度上講,意識形態(tài)是人們創(chuàng)造并深信的一系列設(shè)想,”他解釋說。“有時(shí)它非常深刻,但它又可以異常膚淺,尤其在政治領(lǐng)域?!彼苁呛闷?,人們是如何形成這些信仰,而又是為何如此強(qiáng)烈地深信著。他同時(shí)還想在教育領(lǐng)域做些分析工作,因?yàn)樗J(rèn)為這是另外一個(gè)預(yù)測未被充分利用和執(zhí)行的領(lǐng)域。教育數(shù)據(jù)倒是不少,希爾說,但許多都不過只是“噪聲”。那么他是否能找到“信號”呢?他也同意,這是一個(gè)好的分析能造就深遠(yuǎn)影響的領(lǐng)域?!熬褪秋L(fēng)險(xiǎn)太大了?!?/p>

      作為內(nèi)特·希爾,他也有深受困擾之時(shí)。人們總是通過打電話、發(fā)郵件、發(fā)短信,請他預(yù)測他并沒有興趣預(yù)測的東西,比如彩票?!斑@并不是我想要傳遞的信息,”他說。如預(yù)測下位教皇或奧斯卡獲獎(jiǎng)?wù)邥r(shí),他確實(shí)樂在其中,而且他也會(huì)為了好玩而設(shè)計(jì)出漂亮的數(shù)學(xué)模型。不過他似乎也擔(dān)心玷污了他所說的“Five Thirty Eight招牌”,使其變得過于唯利是圖或者微不足道。“大多數(shù)時(shí)候我都在說,聽著,事實(shí)上,這個(gè)世界是非常難以捉摸的,或者至少我們?nèi)祟惒⒉皇悄敲瓷瞄L預(yù)測這個(gè)世界,”他跟我說。他真正想做到的,是使世界認(rèn)真嚴(yán)肅地探討起統(tǒng)計(jì)科學(xué),并意識到信仰和偏見是如何發(fā)揮影響的。至于說大數(shù)據(jù)可以完全預(yù)測人類行為——或者至少絕大多數(shù)時(shí)候可以?在希爾看來,這個(gè)想法不僅大錯(cuò)特錯(cuò),更令人感到不快?!皻v史表明,人總是會(huì)犯錯(cuò)誤,”他說。“好的一點(diǎn)就是,富有創(chuàng)造力、敢于冒險(xiǎn)、創(chuàng)意無限的人,如果他們能做出與眾不同之事,便總能為自己贏得名聲,或者為所在公司賺進(jìn)大把金錢。”在某一刻,他似乎沉浸在想象中,為沒有錯(cuò)誤沒有偏見的完美社會(huì)而感到不安——再也沒有自以為是的政治專家,在電視上喋喋不休地宣揚(yáng)不容錯(cuò)過的總統(tǒng)候選人;再也沒有依據(jù)趣聞軼事和直覺感知,對NFL(全國橄欖球聯(lián)盟)比賽結(jié)果進(jìn)行預(yù)測的運(yùn)動(dòng)黑客?!拔铱偸怯X得烏托邦非常無聊,”他停頓片刻后說道,“不過這很可能是我根深蒂固的偏見?!?/p>

      你可以看到,他并不清楚該從什么角度去看待一個(gè)完美世界?!盀跬邪顚?huì)非?!麐尩摹瓱o聊,”他再次說道,這一次還加上了強(qiáng)調(diào),“因?yàn)檎麄€(gè)世界壓根就沒有棱角?!薄狫.J.McCorvey和Jilian Goodman。

      猜你喜歡
      希爾預(yù)測
      無可預(yù)測
      黃河之聲(2022年10期)2022-09-27 13:59:46
      選修2-2期中考試預(yù)測卷(A卷)
      選修2-2期中考試預(yù)測卷(B卷)
      選修2—2期中考試預(yù)測卷(A卷)
      一棵活了200 歲的樹(二)
      一顆活了200歲的樹(一)
      不可預(yù)測
      捉月亮的網(wǎng)
      閣樓上的光
      羅伊·希爾的散文詩
      散文詩(2017年15期)2018-01-19 03:08:04
      浙江省| 丹寨县| 丹巴县| 章丘市| 高平市| 苗栗县| 山西省| 阿巴嘎旗| 昆明市| 河源市| 云林县| 莱西市| 桐乡市| 林口县| 靖安县| 巴青县| 开鲁县| 同江市| 安丘市| 哈尔滨市| 崇文区| 万源市| 清流县| 三穗县| 泽库县| 山西省| 亳州市| 绍兴县| 巨野县| 广西| 旬阳县| 哈密市| 裕民县| 万宁市| 泸州市| 青龙| 郴州市| 灵川县| 黑水县| 柳林县| 大邑县|