文/程實 編輯/張美思
人類一思考,上帝就發(fā)笑;世界杯一來到,上帝笑得血壓也升高。倒不是足球踢得多精彩,而是“預(yù)(xia)測(cai)”世界杯太惡搞。我略微總結(jié)了一下,剔除掉貝利著名的反向指標(biāo),能夠納入世界杯預(yù)測的方法大致有五類:
一是實力決定論。以高盛和德銀等投行為代表,將FIFA排名、過往戰(zhàn)績、近期表現(xiàn)、球員身價、賭球賠率、國家經(jīng)濟(jì)等一系列綜合反映球隊實力的數(shù)據(jù)作為預(yù)測依據(jù),用計量模型計算出看似精確至極的概率。但這并不能掩蓋“地域”的傾向性和“分析師偏好”。比如,讓我寫世界杯預(yù)測報告,無論數(shù)據(jù)和模型怎么變,結(jié)論肯定是阿根廷奪冠。
二是條件決定論。以不久前駕鶴西去的霍金教授為代表,將包括對球場、球衣、陣型和交通工具的選擇,及裁判國籍在內(nèi)的各種影響球隊的客觀條件,揉到一個預(yù)測公式里。但這種公式的預(yù)測有效期很短,所以在遠(yuǎn)離決賽的開賽前是預(yù)測不出最后冠軍歸屬的。
三是流言決定論。以雅虎和微軟Bing為代表,將以億為單位的網(wǎng)絡(luò)噪音轉(zhuǎn)化為清晰的結(jié)果信號。雖然這種互聯(lián)網(wǎng)魔術(shù)看上去既科學(xué)又玄妙,甚至可以用經(jīng)濟(jì)學(xué)的“預(yù)期自我實現(xiàn)”理論來解釋,但總讓人聯(lián)想到古時候無論中國還是西方,帝王對童謠和吟游詩人作品的關(guān)注。
四是宿命歸屬論。四年前巴西世界杯的時候就有一則關(guān)于1966年和2014年的時空重疊熱帖:1966年與2014年有許多重要賽事的冠軍結(jié)果相同。按照這一理論,1966年的世界杯冠軍英格蘭問鼎2014年世界杯應(yīng)不在話下,但最后卻被無情的現(xiàn)實打臉了。
五是動物先知論。以章魚保羅為代表,在2008年預(yù)測歐洲杯6場5勝,2010年預(yù)測南非世界杯8場全勝。不過,早已作古的保羅無緣2018年俄羅斯世界杯,而作為其后繼者的烏龜、大象、熊貓等,再未能復(fù)制保羅的輝煌。
當(dāng)然,所有這些世界杯預(yù)測或多或少都有惡搞的成分,不能當(dāng)真。不過冷靜、細(xì)致地分析這五種方法論,除了最后一種,剩下四種都用到了大數(shù)據(jù),這恰是時下大數(shù)據(jù)熱的一種表現(xiàn)。從世界杯預(yù)測看大數(shù)據(jù)熱,三個誤區(qū)值得警醒。
一是大數(shù)據(jù)并不能解決所有問題。大數(shù)據(jù)是很有用的,幾乎每一個環(huán)節(jié),包括產(chǎn)品設(shè)計、市場定位、目標(biāo)選擇、銷售策略和模式修正,都離不開大數(shù)據(jù),甚至連各種和商業(yè)無關(guān)的問題也能從大數(shù)據(jù)中找到答案。但大數(shù)據(jù)并非萬能:大數(shù)據(jù)能解決的都是客觀問題,而不是主觀問題。就拿世界杯預(yù)測來說,誰能奪冠取決于多種因素。而各種預(yù)測只不過是對不同的決定要素賦予了不同權(quán)重,本質(zhì)上并無區(qū)別,說到底是一個主觀問題,因而只能說明客觀狀態(tài)的大數(shù)據(jù)是無法給出直接答案的。
二是并不是數(shù)據(jù)越大越好。數(shù)據(jù)分析早就存在,而大數(shù)據(jù)火爆則是最近的事情。其中的區(qū)別就在一個“大”字。從道理上講,數(shù)據(jù)種類越多、序列越長,包含的信息就越豐富。但同樣值得關(guān)注的是,有的時候信息越多反而越不利于獲知。特別是像世界杯預(yù)測這樣核心信息不突出的事情,信息之間很容易形成無邏輯的沖突,這也是預(yù)測方法眾多,但誰都不靠譜的原因。此外,數(shù)據(jù)越大,數(shù)據(jù)處理過程中的選擇就越多,而選擇總難以回避道德風(fēng)險:每一個分析者都會面對為特定目標(biāo)而選擇的誘惑,“有選擇的選擇”往往是大數(shù)據(jù)反而模糊了真相的潛在原因。
三是大數(shù)據(jù)搞不定“薛定諤的貓”。在盒子打開前,薛定諤的貓既是活的,又是死的,只有打開盒子這一行為,才能導(dǎo)致狀態(tài)疊加的坍塌,不確定性才會消失。也就是說,在世界杯真正開始前,32支球隊都是冠軍,又都不是冠軍,只有踢起來才能見分曉。大數(shù)據(jù)分析基于的是既成事實,更擅長說明世界是怎樣的,而不是世界應(yīng)是怎樣和將是怎樣的。在不確定性面前,大數(shù)據(jù)是無力的。究其根本,就在于大數(shù)據(jù)不是用來預(yù)測的。大數(shù)據(jù)能帶給我們的是知識、是獲知,而不是判斷,更不是武斷。而尊重不確定性,則是正確使用知識的一部分。
從世界杯預(yù)測看大數(shù)據(jù),誤區(qū)是存在的,這與概念熱炒不無關(guān)聯(lián)。數(shù)據(jù)分析一直都是非常有用的,但濫用大數(shù)據(jù)作為噱頭,就沒意思了。所以,看世界杯遠(yuǎn)比預(yù)測世界杯更有趣,不是嗎?