編譯 喬琦
盡管自由意志和生活環(huán)境變幻莫測,人類行為總體上還是要比我們想象的可預(yù)測得多。
在艾薩克·阿西莫夫的《基地》(Foundation,1951)系列小說中,數(shù)學(xué)家哈里·謝頓(Hari Seldon)運(yùn)用心理史學(xué)預(yù)言了銀河帝國的崩潰。小說中的所謂心理史學(xué),就是一種對人類大眾回應(yīng)社會(huì)及經(jīng)濟(jì)事件模式的計(jì)算。謝頓起初因叛國罪受審,理由是他的預(yù)言助長了所謂的帝國崩潰,后來他獲準(zhǔn)在一顆與世隔絕的行星上組建了一個(gè)研究小組。在那里,謝頓研究了如何將帝國崩潰造成的破壞最小化,并將后續(xù)出現(xiàn)的無政府狀態(tài)從3萬年之久縮短到僅僅1 000年。
阿西莫夫知道,實(shí)際上我們不可能預(yù)測上千年尺度的大規(guī)模政治事件。然而,當(dāng)我們閱讀這本小說時(shí),這種懷疑并沒有縈繞在心頭。簡·奧斯汀的讀者也不會(huì)因?yàn)橹酪聋惿住ぐ鄡?nèi)特和達(dá)西先生并不存在而感到難過不安。阿西莫夫是個(gè)聰明人,他知道不論這類預(yù)測有多準(zhǔn)確,都會(huì)受到意料之外的大型擾動(dòng)的嚴(yán)重影響,更別提那些涉及原則的變動(dòng)了。他也明白,那些愉快接受心理史學(xué)這個(gè)設(shè)定的讀者也一定會(huì)意識(shí)到這點(diǎn)。在《基地》系列的第二卷中,就有這樣一個(gè)“黑天鵝”事件徹底打亂了謝頓的計(jì)劃。不過,謝頓還準(zhǔn)備了一個(gè)應(yīng)急計(jì)劃,這個(gè)計(jì)劃為后續(xù)小說內(nèi)容帶來了諸多驚喜。
阿西莫夫的《基地》系列最為人稱道之處在于把重點(diǎn)放在了關(guān)鍵人物集團(tuán)的政治陰謀上,而不是一頁又一頁地重復(fù)描寫全副武裝的龐大太空艦隊(duì)的戰(zhàn)斗。主角們會(huì)定期收到此類戰(zhàn)斗的消息,但對這類消息的描繪與好萊塢的處理手法大相徑庭。正如阿西莫夫自己所說,《基地》系列的故事情節(jié)是根據(jù)愛德華·吉本的作品《羅馬帝國衰亡史》(1776—1789)改編的?!痘亍废盗凶髌肥轻槍Σ淮_定性進(jìn)行史詩級規(guī)劃的大師之作。每一位高級部長以及公務(wù)員都應(yīng)該好好看看這部小說。
為了取得戲劇性的效果,小說中提到的預(yù)測人類未來的方法,也即心理史學(xué),把假設(shè)的數(shù)學(xué)技巧運(yùn)用到了極致。然而,我們其實(shí)每天都會(huì)在不那么宏偉的任務(wù)中用到這種基本思想,例如當(dāng)超市經(jīng)理估算要擺多少袋面粉到貨架上時(shí),又例如當(dāng)建筑師在設(shè)計(jì)建筑時(shí)估算會(huì)議室可能的大小。謝頓這個(gè)角色在某種程度上是受到了阿道夫·凱特萊(Adolphe Quételet )的啟發(fā)。凱特萊1796年出生于低地國家根特,也就是現(xiàn)在的比利時(shí),他是第一批將數(shù)學(xué)應(yīng)用到人類行為上的人之一。如今我們對“大數(shù)據(jù)”和人工智能前景和危險(xiǎn)的癡迷都是凱特萊智慧成果的直系后代。當(dāng)然,凱特萊并不把由此衍生出的這門學(xué)科叫作心理史學(xué),他稱其為社會(huì)物理學(xué)。
統(tǒng)計(jì)的基本工具和技巧誕生于物理學(xué)科(尤其是天文學(xué))之中。它們起源于一種系統(tǒng)方法。這類方法的主要目的是從不可避免地會(huì)出現(xiàn)誤差的觀測結(jié)果中提取信息。隨著人們對概率論的認(rèn)識(shí)不斷加深,一部分先行者把這種方法拓展到了其原始邊界之外。自此之后,統(tǒng)計(jì)學(xué)方法就成了生物學(xué)、醫(yī)學(xué)、政治學(xué)、人類學(xué)乃至藝術(shù)中不可或缺的一種研究手段。因此,當(dāng)你知道這門學(xué)科的奠基人本來是位純粹的數(shù)學(xué)家,后來改攻天文,最后又臣服于社會(huì)科學(xué)的塞壬之歌時(shí),估計(jì)也不會(huì)太過驚訝,甚至?xí)X得恰如其分。
凱特萊把自己的這個(gè)思想認(rèn)識(shí)饋贈(zèng)給了后代,那就是:盡管自由意志和生活環(huán)境變幻莫測,人類行為總體上還是要比我們想象的可預(yù)測得多。無論怎么說,這種認(rèn)識(shí)都還不夠完美,但正如他們常說的,“對政府工作來說,已經(jīng)足夠好了”。凱特萊還給我們留下了兩條具體思路:一是“平均人”的概念;二是正態(tài)分布的普遍性,也就是如今眾所周知的鐘形曲線。這兩個(gè)概念都是非常有用的工具,提供了全新的思考方式,但同時(shí),如果太過刻板或是太過寬泛地應(yīng)用它們,也會(huì)出現(xiàn)非常嚴(yán)重的缺陷。
凱特萊的第一個(gè)博士學(xué)位是當(dāng)時(shí)剛成立不久的根特大學(xué)頒發(fā)的。他的博士論文是關(guān)于圓錐截面的。這個(gè)問題也是古希臘幾何學(xué)家們的鐘愛,他們用平面切割圓錐構(gòu)建出了這些重要曲線——橢圓、拋物線、雙曲線。凱特萊在大學(xué)里教了一段時(shí)間數(shù)學(xué),直到1820年被選入布魯塞爾皇家學(xué)院。這也開啟了他長達(dá)50年的比利時(shí)科學(xué)界核心人物的學(xué)術(shù)生涯。
大約就在那個(gè)時(shí)候,凱特萊加入了一場建立新天文臺(tái)的運(yùn)動(dòng)。當(dāng)時(shí),他對天文學(xué)還所知不多,但他天生就是一位實(shí)干家并且對政府里的那些彎彎繞一清二楚。凱特萊的第一個(gè)動(dòng)作就是確保政府能夠?yàn)檫@個(gè)項(xiàng)目提供資金支持。接著,他又采取措施彌補(bǔ)了他本人對天文臺(tái)研究項(xiàng)目知之甚少的弱點(diǎn)。1823年,在政府資助下,凱特萊前往巴黎從當(dāng)時(shí)頂尖的天文學(xué)家、氣象學(xué)家和數(shù)學(xué)家那兒取經(jīng)問道。弗朗索瓦·阿拉戈和亞歷克西斯·布瓦爾教他天文,約瑟夫·傅里葉則教他概率論。
當(dāng)時(shí),天文學(xué)家是應(yīng)用概率論的先行者,他們利用這種方法改善必定會(huì)出現(xiàn)誤差的行星軌道觀測結(jié)果。從專家那兒學(xué)習(xí)這些技巧的經(jīng)歷培養(yǎng)了凱特萊對把概率論應(yīng)用于統(tǒng)計(jì)數(shù)據(jù)的終生癡迷。到了1826年的時(shí)候,凱特萊已經(jīng)是低地國家統(tǒng)計(jì)局的一名區(qū)域通訊員了。
對于國家來說,有一個(gè)基本數(shù)字對現(xiàn)在及未來發(fā)生的事件施加了巨大影響,那就是:人口。如果你不知道自己國內(nèi)究竟有多少人,那就很難做出相應(yīng)規(guī)劃。當(dāng)然也可以進(jìn)行猜測,但這么做到頭來很有可能在不必要的基礎(chǔ)設(shè)施上浪費(fèi)很多錢,或者由于低估了國民的需求而引發(fā)危機(jī)。直到今天,這也是許多國家仍致力于解決的問題。
查明國家人口的最自然的方式就是把他們一個(gè)一個(gè)數(shù)出來。然而,人口普查并不像看上去的那樣簡單。國民會(huì)四處流動(dòng),有些還會(huì)因犯罪或逃稅而藏匿起來。1829年,比利時(shí)政府醞釀了一場新的人口普查行動(dòng),當(dāng)時(shí)一直在歷史人口數(shù)據(jù)方向上工作的凱特萊也加入了這個(gè)項(xiàng)目。
“我們當(dāng)前掌握的數(shù)據(jù)只能說是臨時(shí)的,必須進(jìn)行修正。”他寫道。全面人口普查代價(jià)高昂,因此,估算歷次普查結(jié)果之間的人口變化情況就變得有意義了。然而,這種估算方法并非長久之計(jì),如今通行的做法是每十年進(jìn)行一次大普查。當(dāng)時(shí),凱特萊也督促政府趕緊開展新的人口普查活動(dòng),這樣才能獲取估算未來的準(zhǔn)確基準(zhǔn)。不過,當(dāng)他從巴黎學(xué)成歸來時(shí),產(chǎn)生了一個(gè)有趣的想法。這個(gè)想法來自偉大的法國數(shù)學(xué)家拉普拉斯。如果它能奏效的話,就可以省下一筆大筆錢。
拉普拉斯把兩個(gè)數(shù)字相乘,計(jì)算出了當(dāng)時(shí)法國的人口。第一個(gè)數(shù)字是過去一年的嬰兒出生數(shù),可以在出生登記記錄中找到,準(zhǔn)確性很高。第二個(gè)數(shù)字是總?cè)丝谂c每年出生人數(shù)之比——也就是人口出生率的倒數(shù)。把這兩個(gè)數(shù)字乘起來,就得到了當(dāng)年總?cè)丝诘淖兓闆r。不過,這個(gè)方法要奏效,似乎首先得知道全國總?cè)丝?,畢竟這樣才能知道出生率。對此,拉普拉斯給出的解決方案是采樣:通過完善的采樣方法就能得到一個(gè)合理的估計(jì)值。具體方法是,挑選幾個(gè)具有典型性的人口配置合理地區(qū),在那里開展全面的普查工作,然后再把結(jié)果與這些地區(qū)每年的出生人數(shù)相比較。拉普拉斯還做了相關(guān)計(jì)算,認(rèn)為大約30個(gè)這樣的區(qū)域就足以推算整個(gè)法國的人口。
然而,比利時(shí)政府并沒有使用采樣的方法,而是直接開展了全面的人口普查工作?,F(xiàn)在看來,凱特萊之所以沒有堅(jiān)持使用完善的采樣方法,是因?yàn)楫?dāng)時(shí)的一位國家顧問凱弗伯格男爵(Baron de Keverberg)提出了一項(xiàng)睿智、成熟但也具有誤導(dǎo)性的方法論角度上的批評意見。調(diào)查不同區(qū)域內(nèi)的出生率必然涉及各種令人困惑的因素,因此,這位男爵總結(jié),根本不可能取得這樣一種具有代表性的采樣樣本。各種因素造成的誤差會(huì)累積,導(dǎo)致采樣結(jié)果毫無用處。然而,他犯了兩個(gè)錯(cuò)誤。第一個(gè)錯(cuò)誤是,尋找具有代表性的樣本,并不是找到一個(gè)隨機(jī)樣本就完事了。第二個(gè)錯(cuò)誤是,他只想到了可能出現(xiàn)的最壞情況(各種誤差不斷累積),卻沒想到最有可能出現(xiàn)的情況(大多數(shù)誤差會(huì)通過隨機(jī)變化而相互抵消)。值得一提的是,拉普拉斯之前就已經(jīng)提出,對全國人口的最佳采樣方案是預(yù)先挑選那些至少在某些方面能夠代表總體的區(qū)域。這意味著這些區(qū)域要與總體有大致相似的貧富人口比例、受教育人口和非受教育人口比例、男女比例等等。如今,要想從小樣本中得到優(yōu)秀的采樣結(jié)果,我們也會(huì)如此設(shè)計(jì)相關(guān)的民意調(diào)查。不過,統(tǒng)計(jì)學(xué)家最終發(fā)現(xiàn),足夠大的隨機(jī)樣本,效果就和精挑細(xì)選的代表性樣本一樣好,而且前者的獲取難度還低得多。不過,這些道理都是我們現(xiàn)在發(fā)現(xiàn)的了,無論如何,當(dāng)時(shí)的比利時(shí)政府決定挨個(gè)統(tǒng)計(jì)每個(gè)國民。
凱弗伯格男爵對凱特萊計(jì)劃的批評最終促成了比利時(shí)政府于1829年開展全面人口普查工作,但這也產(chǎn)生了一個(gè)有益影響:凱特萊在這項(xiàng)龐大的工作中收集了大量數(shù)據(jù),正是這些數(shù)據(jù)讓他研究、分析了一輩子。很快,凱特萊的工作重點(diǎn)就從“數(shù)人頭”發(fā)展成了測量人口。在整整8年的時(shí)間里,他收集了大量國民數(shù)據(jù),其中包括出生率、死亡率、結(jié)婚率、預(yù)計(jì)妊娠期、身高、體重、健康狀況、成年人口率、飲酒率、發(fā)瘋率、自殺率、犯罪率,等等。凱特萊還研究了這些數(shù)據(jù)隨年齡、性別、職業(yè)、地點(diǎn)、季節(jié)、入獄、住院等方面的變化。他一次只比較兩項(xiàng)因素,從而繪制出展示這兩者關(guān)系的圖表。最后,凱特萊總結(jié)并出版了自己的研究結(jié)論,形成了他的代表作《論人類及其能力之發(fā)展——社會(huì)物理學(xué)論》(1835)。1842年,這本著作譯成了英文,英文書名為《論人及其能力的發(fā)展》(1842)。
凱特萊每次提到這本書的時(shí)候,都會(huì)用副標(biāo)題“社會(huì)物理學(xué)”。于是,當(dāng)他于1869年修訂本書的新版本時(shí),直接交換了原書的主標(biāo)題和副標(biāo)題,也就是直接用“社會(huì)物理學(xué)”作為主標(biāo)題。凱特萊完全了解自己創(chuàng)造了一門怎樣的學(xué)科,那就是用數(shù)學(xué)分析方法詮釋人類,至少是詮釋那些可以量化的人類特征。
這本書中提到的一個(gè)概念激發(fā)了公眾的想象力,并且令人們心醉神迷,那就是平均人的概念。凱特萊提出的這個(gè)概念在很多領(lǐng)域都有重要意義,他也因此清晰地認(rèn)識(shí)到,還有必要更具體地考慮平均女性、平均孩童等各類人群的平均值。凱特萊很早就注意到,有關(guān)身高、體重這類特征的數(shù)據(jù)(充分限制在同一性別的同一年齡組中)往往會(huì)集中于單個(gè)值附近。如果我們把這類數(shù)據(jù)畫成柱狀圖,就會(huì)發(fā)現(xiàn)最高的那根柱子出現(xiàn)在正中央,兩側(cè)柱子的高度逐漸減小,形成斜坡。這其實(shí)就是鐘形曲線的特征形狀,并且正如凱特萊自己承認(rèn)的那樣,數(shù)學(xué)家早已知曉了這種分布曲線。鐘形曲線的整個(gè)形狀大致對稱,因此,中央峰值——代表最常見的取值——也就是平均值。許多類型的數(shù)據(jù)分布都會(huì)呈現(xiàn)這種模式,而凱特萊第一個(gè)意識(shí)到了這種分布模式在社會(huì)科學(xué)中的重要意義。
圖、表當(dāng)然都是非常好的工具,但凱特萊想要的是一種更簡潔明了的總結(jié)方式,一種用活潑且便于記憶的形式傳遞數(shù)據(jù)主要信息的方式。因此,相較“鐘形曲線顯示,某些階級20歲以上男性的平均身高是1.74米”這種說法,凱特萊更欣賞“(某些群體)男性的平均身高為1.74米”。接著,他就會(huì)對不同群體中的“平均男性”進(jìn)行比較。全比利時(shí)范圍內(nèi)的“平均步兵”和法國“平均農(nóng)民”相比如何?這個(gè)“平均步兵”是更高還是更矮?是更輕還是更重?又或者“他倆”幾乎一樣?“他”與德國“平均軍官”相比又如何?布魯塞爾的“平均男性”和倫敦的“平均男性”相比如何?“平均女性”呢?“平均孩童”呢?哪個(gè)國家的“平均男性”殺人或犯罪的可能性更高?哪個(gè)國家的“平均男性”成為救死扶傷的醫(yī)生概率更高,而不是更傾向于自己了結(jié)自己的性命?對于每一種討論的特征,我們都需要各種平均男性(平均女性、平均孩童)的數(shù)據(jù)。正如斯蒂芬·施蒂格勒在《統(tǒng)計(jì)學(xué)歷史》(1986)一書中指出的那樣,凱特萊認(rèn)為“‘平均人’的概念是一種抹平社會(huì)隨機(jī)變量,展示其‘社會(huì)物理學(xué)’定律的方法”。
1880年之后,社會(huì)科學(xué)開始廣泛使用統(tǒng)計(jì)學(xué),特別是鐘形曲線。弗朗西斯·高爾頓是將數(shù)據(jù)分析應(yīng)用于天氣預(yù)報(bào)的先驅(qū),并且發(fā)現(xiàn)了反氣旋的存在。高爾頓繪制了人類第一幅氣象圖,并于1875年發(fā)表在《泰晤士報(bào)》上。他對真實(shí)世界的數(shù)字?jǐn)?shù)據(jù)以及背后潛藏的數(shù)學(xué)規(guī)律心馳神往。查爾斯·達(dá)爾文出版《物種起源》(1859)后,高爾頓隨即開展了一項(xiàng)人類遺傳學(xué)研究。孩子們的身高與其父母之間有什么關(guān)系呢?體重、智商又怎么樣呢?高爾頓采用了凱特萊的鐘形曲線,把它應(yīng)用在各種人群上。如果數(shù)據(jù)形成的鐘形曲線出現(xiàn)了兩個(gè)峰值,而不是一個(gè),高爾頓就認(rèn)為,數(shù)據(jù)樣本涉及的人群一定包含兩個(gè)區(qū)別明顯的亞群,每個(gè)亞群各自遵守自己的鐘形曲線。
隨著研究的深入,高爾頓越發(fā)相信有許多美好人類特征都是遺傳的,這應(yīng)該是進(jìn)化論的一個(gè)推論,但達(dá)爾文卻予以否認(rèn)。對高爾頓來說,凱特萊的平均人是一種社會(huì)必需,也是一種需要回避的情況。他的作品《遺傳天才》(1869)運(yùn)用統(tǒng)計(jì)學(xué)研究天賦和偉大特質(zhì)的遺傳,以及今日出現(xiàn)的一種平等主義目標(biāo)(即“每個(gè)年輕人都應(yīng)該有機(jī)會(huì)展示自己的能力,而如果他天賦極高的話,就應(yīng)該接受一流教育并就此開啟職業(yè)生涯”)的怪異混合體,還有“種族驕傲”的鼓勵(lì)效應(yīng)。在他的作品《人類能力及其發(fā)展探究》(1883)中,高爾頓創(chuàng)造了一個(gè)叫作“優(yōu)生學(xué)”的術(shù)語,倡導(dǎo)政府提供財(cái)政支持鼓勵(lì)那些高層級或高智商家庭聯(lián)姻、生育。他想通過這種方式培養(yǎng)出擁有超能力的孩子。優(yōu)生學(xué)在20世紀(jì)二三十年代大行其道,但由于過分濫用、強(qiáng)迫精神病患者絕育、納粹的優(yōu)等種族論等現(xiàn)象而迅速失去人心。如今,優(yōu)生學(xué)與種族主義聯(lián)系在一起。它違反了《聯(lián)合國預(yù)防和懲治種族滅絕罪公約》和《歐盟基本權(quán)利憲章》。然而,這種思想從沒有徹底離開我們的視線。
無論我們對高爾頓的性格看法如何,他對統(tǒng)計(jì)學(xué)的貢獻(xiàn)是不容置疑的。1877年,他發(fā)明了回歸分析,這種方法可以計(jì)算不同量之間最可能的相互關(guān)系,還催生了統(tǒng)計(jì)學(xué)中的另一個(gè)核心概念:相關(guān)性,用以評估不同數(shù)據(jù)集間的關(guān)聯(lián)程度——例如,吸煙頻率和肺癌發(fā)病率之間的關(guān)系。高爾頓在1888年討論了一些例子,比如前臂長度和身高間的關(guān)系。隨后,英國數(shù)學(xué)家和生物統(tǒng)計(jì)學(xué)家卡爾·皮爾森將這個(gè)想法轉(zhuǎn)變成了一個(gè)數(shù)學(xué)公式,也就是相關(guān)系數(shù)公式。正如我們經(jīng)常指出的那樣,相關(guān)性并不是因果性,但它常常是潛在因果性的一個(gè)有用指標(biāo)。
1824年,《賓夕法尼亞人報(bào)》開展了一場民意調(diào)查,內(nèi)容為安德魯·杰克遜還是約翰·昆西·亞當(dāng)斯會(huì)成為美國總統(tǒng)。調(diào)查結(jié)果為,335票投了杰克遜,169票投了亞當(dāng)斯。事實(shí)情況也是杰克遜贏得了最后的普選。自此之后,選舉這個(gè)領(lǐng)域就吸引了民意調(diào)查專家的目光。出于實(shí)際操作方面的原因,民意調(diào)查只會(huì)涉及一小部分選民。于是就出現(xiàn)了一個(gè)明顯的數(shù)學(xué)問題:多大的樣本才能給出準(zhǔn)確的結(jié)果?這個(gè)問題在人口普查、新藥測試以及許多其他領(lǐng)域內(nèi)都很重要。
直到最近,民意調(diào)查主要用的都還是隨機(jī)樣本。雅各布·伯努利于1684年左右發(fā)現(xiàn)了大數(shù)定律,并發(fā)表在了他的作品《猜度術(shù)》(1713)上。這個(gè)定律告訴我們,如果樣本足夠大的話,那么這個(gè)樣本的平均值就“幾乎肯定”會(huì)無比接近于我們想要的真實(shí)值。然而,這個(gè)定律并沒有告訴我們所謂的“足夠大”究竟是多大。中值極限定理,這個(gè)更復(fù)雜的定理就運(yùn)用鐘形曲線把樣本均值與實(shí)際均值聯(lián)系了起來,并可以據(jù)此計(jì)算所得結(jié)果能夠奏效的最小樣本容量。
如今,社交媒體的出現(xiàn)改變了許多選舉的開展方式。精心設(shè)計(jì)的互聯(lián)網(wǎng)民意調(diào)查又回到了拉普拉斯的方法。它們以精挑細(xì)選的個(gè)人組成的代表性小組作為統(tǒng)計(jì)樣本。然而,很多此類民調(diào)都只是讓那些想要投票的人參與進(jìn)來——既不隨機(jī)也不具有完全的代表性。這類民調(diào)的設(shè)計(jì)很糟糕,因?yàn)槟切碛袕?qiáng)烈政治觀點(diǎn)的人更有可能參與投票,而很多人甚至都不知道這個(gè)民調(diào)的存在,還有一些人都沒法上網(wǎng)。同理,電話民意調(diào)查也很有可能存在傾向性,因?yàn)楹芏嗳硕疾惶牖貞?yīng)電話那頭冰冷的聲音,甚至?xí)诒粏柤翱捶〞r(shí)拒絕做出回答。在這個(gè)詐騙橫行的時(shí)代,我們甚至沒法確定這通電話是否真的是為民調(diào)而打來的。有一些人沒有電話,有一些人不會(huì)對電話那頭的民意調(diào)查員說真話——例如,他們很可能不太愿意向陌生人透露自己想要把票投給一個(gè)極端黨派。在電話民調(diào)中,同一個(gè)問題的不同表述都會(huì)影響人們的回答。
民意調(diào)查機(jī)構(gòu)為了盡可能地減小這些誤差來源的影響,運(yùn)用了各種各樣的方法。其中許多都是數(shù)學(xué)方向上的,但心理學(xué)和其他方面的因素現(xiàn)在也已納入考量。我們中的大部分人都聽說過這樣的故事:民意調(diào)查中出現(xiàn)了明顯錯(cuò)誤的結(jié)果。而且這樣的故事似乎發(fā)生得越來越頻繁了。有時(shí)可以用一些特殊因素來“解釋”其中的原因,比如民眾的意向突然發(fā)生了轉(zhuǎn)變,或者選民在民調(diào)時(shí)故意撒謊,目的是為了讓對手誤以為自己勝券在握而放松大意。盡管如此,只要能執(zhí)行得當(dāng),民意調(diào)查總體上還是能夠相當(dāng)好地勝任追蹤記錄的工作。它為削減不確定性提供了一件非常有用的工具。出口民調(diào),也就是人們在投出選票后不久就被詢問選了誰的民意調(diào)查,通常準(zhǔn)確率相當(dāng)高,往往能在官方公布結(jié)果前很久就給出正確的選舉結(jié)果,且這類民調(diào)本身并不會(huì)影響選舉結(jié)果。
如今,“社會(huì)物理學(xué)”這個(gè)術(shù)語背后的隱喻意義已經(jīng)少了許多。信息技術(shù)的飛速發(fā)展引發(fā)了“大數(shù)據(jù)”革命。就這樣,我們掌握了獲取并處理海量信息的能力。人類的行為模式可以從信用卡消費(fèi)記錄、電話記錄和電子郵件記錄中提取出來。社交媒體上的消息突然變多了起來,例如2016年美國總統(tǒng)大選期間的“煽動(dòng)事件”就可能成為熱議政治問題的線索。
目前面臨的數(shù)學(xué)挑戰(zhàn)是:找到從大量非結(jié)構(gòu)化信息中提取出有意義模式的有效方法。另外,我們已經(jīng)嘗試了許多新方法——其中某些源于物理學(xué)自身。例如,有關(guān)氣體分子如何互相反彈的理論已經(jīng)改編成了預(yù)測大型建筑或復(fù)雜建筑群(比如奧林匹克公園)中人群移動(dòng)方式的方法。而社會(huì)及政治方面面臨的挑戰(zhàn)則是確保上述這類方法不會(huì)被濫用。在越來越多強(qiáng)大新方法的幫助下,社會(huì)物理學(xué)已經(jīng)從當(dāng)初凱特萊尋求無須挨個(gè)數(shù)人頭就能查明全比利時(shí)人口方法的時(shí)代,往前走了很長一段路。