文/潘綏銘
?
生活是如何被篡改為數(shù)據(jù)的?
——大數(shù)據(jù)套用到研究人類的“原罪”
文/潘綏銘
摘要:目前對于大數(shù)據(jù)已經(jīng)出現(xiàn)了盲目崇拜,“一切皆可量化”是其核心口號和基本理論。但是在量化過程中,不可避免地會(huì)出現(xiàn)四種情況:剪裁現(xiàn)實(shí)生活、忽視社會(huì)情境、抹煞主體建構(gòu)、取消生活意義。這種“原罪”并不能由于數(shù)據(jù)規(guī)模的無限增大而被消除。因此,大數(shù)據(jù)不能質(zhì)疑,更不能取代各種非量化的人文社會(huì)研究。大數(shù)據(jù)只有對其“原罪”進(jìn)行深刻反思,并且予以充分展示,才有資格在人文社會(huì)研究中保留一席之地。
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)崇拜;量化研究
近年來,對于大數(shù)據(jù)已經(jīng)出現(xiàn)了盲目崇拜,就是無質(zhì)疑、不反思地跟風(fēng)頌揚(yáng)和無限拔高。[1]本文不涉及任何自然科學(xué)領(lǐng)域中的大數(shù)據(jù)及其應(yīng)用,僅討論一個(gè)根本問題:大數(shù)據(jù)能夠套用到對于人類的研究中嗎?
對這個(gè)問題,我國學(xué)術(shù)界雖然也出現(xiàn)了一些質(zhì)疑,但是不僅寥若晨星,而且在學(xué)理上也主要是在可操作性的層次上爭論,并沒有擊中要害。其實(shí),大數(shù)據(jù)最值得質(zhì)疑的,既不是其定義,[2]也不是其功能或意義,[3]還不是方法論層次上的“以相關(guān)分析取代因果分析”,[4]而是“一切皆可量化”[5]這個(gè)核心口號和基本理論。它表述了大數(shù)據(jù)的三層意思:其一,沒有量化,就沒有數(shù)據(jù),更不可能有什么大數(shù)據(jù);其二,物質(zhì)世界當(dāng)然是可以被量化的,但是如果僅限于此,那么所謂的大數(shù)據(jù)就僅僅是數(shù)量的增加,性質(zhì)毫無改變,純屬炒作,例如天氣預(yù)報(bào)一直就在分析海量的數(shù)據(jù),卻并沒有以大數(shù)據(jù)自居,更沒有形成崇拜;其三,現(xiàn)在的大數(shù)據(jù)之所以被崇拜,要害其實(shí)只有一點(diǎn):把人類的行為及其結(jié)果,也給量化了,而且號稱無所不包。
這樣一來,大數(shù)據(jù)的性質(zhì)就變了,從自然科學(xué)侵入到人文社會(huì)研究,從科學(xué)蛻變?yōu)椤拔茖W(xué)主義”。這就不僅僅是一個(gè)研究工具的問題,而是一個(gè)認(rèn)識論的根本問題。對此進(jìn)行批評的人文社科著作汗牛充棟,本文不再一一列舉,僅在操作的層次上分析一下,人類無限豐富的生活實(shí)踐,在被“唯科學(xué)主義”改造成“數(shù)據(jù)”的過程中,究竟發(fā)生了什么。
大數(shù)據(jù)崇拜者極力鼓吹“4V”(規(guī)模大、種類多、高速度、高價(jià)值),[6]卻故意回避了一個(gè)根本的問題:在最開始,您收集到的,就是可以用來分析的數(shù)據(jù)嗎?[7]
在社會(huì)學(xué)的問卷調(diào)查中,這是有可能做到的;但是在所謂的大數(shù)據(jù)中,卻絕對不可能。因?yàn)榇髷?shù)據(jù)并不是研究者主動(dòng)去收集的人類行為及其結(jié)果,而是五花八門的所謂“客觀記錄”,是人類生活中微乎其微的那一部分“可獲得信息”,例如上網(wǎng)活動(dòng)所留下的痕跡、監(jiān)控記錄等。
可是盡人皆知,在人類活動(dòng)的全部信息中,可獲得的要遠(yuǎn)遠(yuǎn)少于不可獲得的。后者最典型的就是人類的一切精神活動(dòng)的信息,在可預(yù)見的未來,仍然不但是無法獲得的,而且根本就是無法監(jiān)測的。這樣一來,所謂大數(shù)據(jù)所獲得的信息,首先是極端片面;其次是漫無邊際;第三是支離破碎;第四是毫無意義;根本不可能直接用于任何量化的分析。
那么,這樣的信息怎么才能轉(zhuǎn)化為可分析的數(shù)據(jù)呢?首先是必須加以“界定”,就是保留什么和舍棄什么;其次是進(jìn)行“分類”,就是把什么歸屬于什么;第三步是加以“定義”,就是給某類信息賦予特定的人類意義;最后一步則是“賦值”,就是把不同的定義轉(zhuǎn)換為可計(jì)算的數(shù)值。
以上網(wǎng)活動(dòng)的痕跡為例,大數(shù)據(jù)的生產(chǎn)者,怎么來界定那些痕跡是有意的還是無意的、閑置的還是凝視的、主動(dòng)尋找的還是被引導(dǎo)而來的?界定之后,到底是根據(jù)停留時(shí)間長短還是活動(dòng)的頻率,來制造出“活躍”或者“不活躍”這樣的類別呢?為什么把“活躍”就給定義為“需求”呢?最后,把“需求”賦值成什么?從“不需求”到“強(qiáng)需求”的不同賦值之間,究竟是什么樣的數(shù)量關(guān)系呢?
顯而易見,在這個(gè)四部曲的過程中,完完全全是研究者自己在主觀地、人為地、強(qiáng)制地“整理”那些“可獲得信息”,把人類生活的痕跡,完完全全地篡改為自己的世界觀和價(jià)值觀所能接受的“數(shù)據(jù)”。往好里說,這叫做無可避免地加工;往壞里說,這就是赤裸裸地偽造。
這就是說,所謂的大數(shù)據(jù),其實(shí)一點(diǎn)都沒有超出“小數(shù)據(jù)”原有的局限性:裁剪生活,撕碎人生;非要把整體生存的“人”,視為一堆雜亂的零碎。在實(shí)際生活中,人類絕對不是,也不可能是這樣來“量化地”認(rèn)知和行動(dòng)的。因此,大數(shù)據(jù)其實(shí)并不是幫助人類思考,而是企圖取代和控制人類的生活經(jīng)驗(yàn),是人工智能的噩兆。
有人已經(jīng)發(fā)現(xiàn),大數(shù)據(jù)記錄的都是單獨(dú)個(gè)人的行為,無法發(fā)現(xiàn)不同行為者之間的關(guān)系;[8]于是問題就來了:在這個(gè)現(xiàn)實(shí)世界里,難道真的存在一種與他人毫無關(guān)系的個(gè)人行為嗎?難道個(gè)人的一切行為,不都是在一定的人際關(guān)系中,才會(huì)產(chǎn)生,才會(huì)帶來某種結(jié)果嗎?
社會(huì)不是個(gè)人的簡單集合,而是人們通過各種關(guān)系有機(jī)地組織起來的。同時(shí),人們又是在特定的社會(huì)環(huán)境中做出各種行為的,不可能天馬行空,獨(dú)往獨(dú)來。因此,人類活動(dòng)留下的一切痕跡,必定蘊(yùn)含著無限豐富的社會(huì)內(nèi)容。如果舍棄之,那么不管什么樣的數(shù)據(jù),不僅是浮光掠影,而且必定是盲人摸象。
尤其是,每一個(gè)人都在特定的社會(huì)中,一點(diǎn)一點(diǎn)地成長為“此時(shí)此景中的此人”,然后才會(huì)做出“此因此果的此行為”。這就是每個(gè)人的社會(huì)歷史建構(gòu)過程,其中最重要的就是我們的一切社會(huì)背景、生活狀況和成長經(jīng)歷。
可是這一切,往往僅僅存在于我們自己的經(jīng)驗(yàn)與記憶之中;往往難于言表,更往往無法記錄。從“客觀監(jiān)測”的角度來說,根本就是“風(fēng)過無痕”。那么,就算毫無隱私,就算監(jiān)測可以天羅地網(wǎng),所謂大數(shù)據(jù)的信息源又是從何而來的呢?[9]因此,對于了解人類生活而言,大數(shù)據(jù)其實(shí)根本就是空中樓閣。
如上所述,這樣的批評還是很中肯的:“數(shù)據(jù)不懂社交、不懂背景,會(huì)制造出更多噪音,遺漏真正有價(jià)值的東西。大數(shù)據(jù)無法解決大問題?!盵10]
“大數(shù)據(jù)崇拜者”很可能不知道,或者不敢承認(rèn):在人類生活中還有一種現(xiàn)象,叫做“主體建構(gòu)”。即人們對于自己的行為所做出的解釋,很可能與監(jiān)測者的解釋大相徑庭,甚至背道而馳。最常見的就是,一切人際的誤會(huì),蓋源于此。
那么,無論大數(shù)據(jù)監(jiān)測到多少人類的行為,它究竟是如何分辨出其中主體建構(gòu)的成分呢?首先,以網(wǎng)購的大數(shù)據(jù)為例,即使您收集到全部的上網(wǎng)痕跡,而且全都數(shù)字化地一覽無余,那您怎么知道人家就真的就是這樣想的呢?這種“客觀測定”,離礦物學(xué)很近,可是人卻是有主觀意志的啊,您是怎么監(jiān)測到的?連物理學(xué)還有個(gè)“測不準(zhǔn)原理”呢,何況對于人的主觀意愿?其次,您知道人類還會(huì)“自我呈現(xiàn)”嗎?說不好聽一些,就是表演。如果連測謊儀的結(jié)果,法律都還不予采信,那么您怎么篩除被監(jiān)測對象的表演呢?第三,難道您就不找被監(jiān)測對象去核實(shí)一下?在司法審判中,就連證據(jù)確鑿的罪犯,法官也必須聽取他的說法,才能做出正確的判斷。可是大數(shù)據(jù)崇拜者卻根本漠視主體意愿的存在。這豈不是自欺欺人?第四,您聽說過弗洛伊德嗎?您知道除了“動(dòng)機(jī)”,還有“無意識”嗎?
即使是某些詢問對方意愿而獲得的數(shù)據(jù),也仍然存在著這樣一個(gè)問題:對方是否具有足夠的能力來表述自己的意愿呢?我們不應(yīng)該忘記弗洛伊德,不應(yīng)該忽視無意識行為的廣泛存在,更不應(yīng)該否認(rèn):人類的一切行為痕跡,無論多么海量,其實(shí)并不能容納和表述人類的生活意義。因此,如果行為者自己都搞不清楚自己是怎么回事,那么您還怎么去核實(shí)呢?根據(jù)什么來判斷真?zhèn)闻c程度呢?
總而言之,一切試圖用自然科學(xué)或者數(shù)字化來了解人類及其社會(huì)的嘗試,不是都必然失敗,而是都無法否定人類“主體建構(gòu)”的重要性,結(jié)果都必然是把真實(shí)的生活給削足適履了。
因此,大數(shù)據(jù)所獲得的一切“發(fā)現(xiàn)”,其實(shí)只不過是某些人在描述其他人的生活。其他人既不知道自己已經(jīng)被描述了,也沒有渠道去修正這種描繪。結(jié)果,大數(shù)據(jù)其實(shí)只不過是一幫技術(shù)分子所構(gòu)建起來的新的認(rèn)知霸權(quán),其崇拜者也只不過是急于使用這個(gè)霸權(quán)而已。
人文社會(huì)研究的至少兩千年歷史告訴我們:人類的一切行為,不僅蘊(yùn)含著他們的人生意義,而且是為了追求其人生意義而行動(dòng)的。這是人與物的根本區(qū)別。
可是,大數(shù)據(jù)所謂的一切“可記錄的痕跡”,如果沒有獲得對方的主訴,那么就不可能包含該行為意義的信息。例如一切上網(wǎng)活動(dòng),行為主體都不會(huì)表述自己為了尋求什么才這樣做的,也不可能表達(dá)出這樣做帶來了什么樣的價(jià)值與意義。
以購物網(wǎng)站記錄下來的數(shù)據(jù)為例,它確實(shí)可以容納數(shù)千萬人在購物時(shí)不知不覺地留下的近乎無窮無盡的痕跡;但是,這就能反映出這些人的購物偏愛嗎?難道這些人就再也不在實(shí)體商店中買東西了嗎?難道他們在一時(shí)一事上表現(xiàn)出來的偏愛就永恒不變嗎?難道他們的每一次上網(wǎng)購物都能得到自我滿足嗎?
那么,您怎么能夠確定:他們在不同的渠道中,在不同的情境之中,都會(huì)做出一模一樣的選擇呢?如果您無法證明這一點(diǎn),那么您的“大數(shù)據(jù)”就只能是“大垃圾”,一點(diǎn)兒也不冤。
交通監(jiān)控錄像、醫(yī)療記錄、通訊記錄等等,都足以號稱自己是“大數(shù)據(jù)”。可是,所有這些數(shù)據(jù),都僅僅是記錄下了人們生活中的一個(gè)個(gè)零散的側(cè)面。因此,這樣的“大數(shù)據(jù)”再怎么大,也無法解決以下一系列常識性的問題:首先,人在生活的某個(gè)側(cè)面里的表現(xiàn),與他/她的整個(gè)人格與人生,難道不存在緊密的關(guān)聯(lián)嗎?農(nóng)民工吃20元的盒飯都嫌貴;富豪買上千萬的汽車也不眨眼,這難道僅僅是所謂的“消費(fèi)選擇”嗎?其次,人類生活的各個(gè)側(cè)面之間,難道不是相互影響著的嗎?農(nóng)民工吃20元的盒飯,卻可以搭上200元的禮錢;富豪買上千萬的汽車,卻不肯做一點(diǎn)兒慈善,這也僅僅是所謂“購買習(xí)慣”嗎?第三,任何一個(gè)人的生活,難道不是被社會(huì)、文化、歷史等因素制約著嗎?農(nóng)民工之所以要吃20元盒飯,絕不僅僅是因?yàn)楣べY低,還因?yàn)樗膿狃B(yǎng)系數(shù)、失業(yè)可能性、職業(yè)風(fēng)險(xiǎn)等等都比富豪要高出很多。這,難道也是“可支配資金”嗎?
如此這般,數(shù)據(jù)越大,豈不是錯(cuò)誤越大?
本文所論述的一切,其實(shí)都是來自人文社會(huì)研究中,久已存在的對于“量化研究”的批評。[11]大數(shù)據(jù)崇拜只不過是這種思潮的最新表現(xiàn),只不過是披上了更為光鮮亮麗的外衣而已。
在基督教教義中,原罪不但是與生俱來的,而且是背負(fù)終身的,不能通過人自己的救贖而被消除。很可惜,量化研究也是如此。無論其技術(shù)手段如何發(fā)達(dá),無論其數(shù)據(jù)多么大,一旦應(yīng)用于人文社會(huì)研究,其缺陷與弊病就根本無法避免,充其量也不過是程度的減輕而已。說到底,“大數(shù)據(jù)崇拜”,其實(shí)就是“唯科學(xué)主義”在人類歷史面前一敗涂地后的末日哀鳴。如果科學(xué)沒能阻止希特勒的統(tǒng)治,也沒能預(yù)測出此后人類的一切發(fā)展,那么就絕不是“藝不精”的問題,而是用錯(cuò)了地方,是越界跑到了自己無能為力的領(lǐng)域。
當(dāng)然,這并不是說,量化研究和大數(shù)據(jù)就一定不能用,而是表達(dá)三層意思:首先,它們都不能質(zhì)疑更不能取代各種非量化的人文社會(huì)研究;其次,只有對這些先天缺陷進(jìn)行深刻反思,并且予以充分展示的量化研究,才有資格在人文社會(huì)研究中保留一席之地;第三,兩種研究就像是兩條鐵軌,缺一不可,但又平行延伸,永不交叉。
注釋:
[1]王程韡:《“大數(shù)據(jù)”是“大趨勢”嗎:基于關(guān)鍵詞共現(xiàn)方法的反事實(shí)分析》,《科學(xué)學(xué)與科學(xué)技術(shù)管理》2015 年第1期。
[2]李天柱、王圣慧、馬佳:《基于概念置換的大數(shù)據(jù)定義研究》,《科技管理研究》2015年第12期。
[3]鐘瑛、張恒山:《大數(shù)據(jù)的緣起、沖擊及其應(yīng)對》,《現(xiàn)代傳播》2013 年第 7 期。
[4]張曉強(qiáng)、楊君游、曾國屏:《大數(shù)據(jù)方法:科學(xué)方法的變革和哲學(xué)思考》,《哲學(xué)動(dòng)態(tài)》2014年第8期。
[5]道格拉斯·W. 哈伯德:《數(shù)據(jù)化決策——大數(shù)據(jù)時(shí)代,〈財(cái)富〉500強(qiáng)都在使用的量化決策法》,鄧洪濤譯,廣州:世界圖書出版廣東有限公司,2013年。
[6]Bill Franks:《大數(shù)據(jù):不是技術(shù)難題》,《成功營銷》2013年第4期。
[7]閻光才的《教育及社會(huì)科學(xué)研究中的數(shù)據(jù)——兼議當(dāng)前的大數(shù)據(jù)熱潮》(《北京大學(xué)教育評論》2013年第4期),已經(jīng)哲學(xué)化地論證了數(shù)據(jù)與真實(shí)世界之關(guān)系,但是仍然缺乏具體的分析。
[8]謝然:《大數(shù)據(jù)社會(huì)的具體場景》,《互聯(lián)網(wǎng)周刊》2014年第22期。
[9]有論者提到了這一點(diǎn),但是仍然囿于“數(shù)據(jù)源”,不足為訓(xùn),參見黎爭:《從數(shù)據(jù)源看大數(shù)據(jù)》,《IT經(jīng)理世界》2013年第14期。
[10]轉(zhuǎn)引自劉宏偉、徐翠英:《拷問大數(shù)據(jù)》,《企業(yè)管理》2013年第9期。
[11]潘綏銘:《社會(huì)學(xué)問卷調(diào)查的邊界與限度——一個(gè)對“起點(diǎn)”的追問及反思》,《學(xué)術(shù)研究》2010年第7期。
責(zé)任編輯 劉秀秀
特邀主持人:潘綏銘(中國人民大學(xué)性社會(huì)學(xué)研究所教授、博士生導(dǎo)師)
主持人的話:近年來,對于大數(shù)據(jù)的討論日漸升溫。2015年9月,國務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,系統(tǒng)部署大數(shù)據(jù)發(fā)展工作,表明大數(shù)據(jù)發(fā)展已經(jīng)上升為國家戰(zhàn)略。大數(shù)據(jù)對各個(gè)學(xué)科的發(fā)展都造成了顯著影響。其中,在社會(huì)學(xué)研究方法領(lǐng)域表現(xiàn)得尤為明顯。因?yàn)榇髷?shù)據(jù)坐擁所有數(shù)據(jù),信息的精確性讓位于豐富性、強(qiáng)調(diào)相關(guān)關(guān)系而不是因果關(guān)系,“理論已死”等論調(diào)對社會(huì)學(xué)傳統(tǒng)研究方法造成一定沖擊,學(xué)界對此展開了豐富的討論,但并未達(dá)成共識。本期刊出的四篇文章,針對“大數(shù)據(jù)與社會(huì)學(xué)研究方法”這一爭議性問題,提出了各自的看法。潘綏銘認(rèn)為,大數(shù)據(jù)已經(jīng)出現(xiàn)了盲目崇拜,“一切皆可量化”的核心口號和基本理論需要被質(zhì)疑,所謂大數(shù)據(jù),其實(shí)只是“量化研究”的最新表現(xiàn)形式,仍然有不可克服的“原罪”;孫秀林旗幟鮮明地表示“社會(huì)學(xué)應(yīng)該擁抱大數(shù)據(jù)”,認(rèn)為大數(shù)據(jù)為研究人類行為提供了新的工具,為研究社會(huì)互動(dòng)與社會(huì)交往提供了新的可能,為宏觀層面的社會(huì)測量提供了新的視角,為社會(huì)學(xué)帶來了新的研究方法;鮑雨致力于分析大數(shù)據(jù)的方法論邏輯,并對其方法論困境進(jìn)行了深入剖析,認(rèn)為謹(jǐn)慎使用大數(shù)據(jù)應(yīng)是基本態(tài)度;張旭和唐魁玉在分析了大數(shù)據(jù)對社會(huì)學(xué)的正負(fù)后果之后,認(rèn)為大數(shù)據(jù)為社會(huì)學(xué)研究打開了一扇新的大門,但是這些研究方法只能作為傳統(tǒng)社會(huì)學(xué)研究的補(bǔ)充,而不能完全替代傳統(tǒng)的小數(shù)據(jù)研究方法。這些研究或者大膽推斷,或者小心論證,都在社會(huì)學(xué)領(lǐng)域的大數(shù)據(jù)研究中有所推進(jìn),對未來的大數(shù)據(jù)研究與應(yīng)用大有裨益。
作者簡介:潘綏銘,中國人民大學(xué)性社會(huì)學(xué)研究所教授、博士生導(dǎo)師,北京市,100872。
中圖分類號:C91-03
文獻(xiàn)標(biāo)識碼:A
文章編號:1006-0138(2016)03-0032-04