潘綏銘
再論生活是如何被篡改為數(shù)據(jù)的
——回應(yīng)劉林平教授的質(zhì)疑
潘綏銘
我在《新視野》2016年第3期發(fā)表《生活是如何被篡改為數(shù)據(jù)的?——大數(shù)據(jù)套用到研究人類的“原罪”》后,引起爭論,這是好事,求之不得。其中劉林平教授等撰寫了《大數(shù)據(jù)有“原罪”嗎?——與潘綏銘教授商榷》(以下簡稱“劉文”),對我的觀點(diǎn)提出全面質(zhì)疑。細(xì)讀之后,覺得這些質(zhì)疑未必能夠成立,撰此短文以作答復(fù)。
首先說明,我的文章說的是:在大數(shù)據(jù)產(chǎn)生的過程中,究竟發(fā)生了什么?也就是說,大數(shù)據(jù)究竟是“如何產(chǎn)生的”?其中包含了哪些先天缺陷?應(yīng)該反思什么?其主題是:絕不應(yīng)該認(rèn)為大數(shù)據(jù)天生就是對的,更不應(yīng)該盲目崇拜。可是“劉文”第一部分所質(zhì)疑的卻是大數(shù)據(jù)“能不能產(chǎn)生”,然后反復(fù)論證其“可以產(chǎn)生”。這不僅與我的文章風(fēng)馬牛不相及,而且恰恰是拒不反思的“大數(shù)據(jù)崇拜”的典型表現(xiàn)之一。
還應(yīng)指出,“劉文”忽視了我的結(jié)論:“當(dāng)然,這并不是說,量化研究和大數(shù)據(jù)就一定不能用,而是表達(dá)三層意思:首先,它們都不能質(zhì)疑更不能取代各種非量化的人文社會研究;其次,只有對這些先天缺陷進(jìn)行深刻反思,并且予以充分展示的量化研究,才有資格在人文社會研究中保留一席之地;第三,兩種研究就像是兩條鐵軌,缺一不可,但又平行延伸,永不交叉?!边@就是說,“劉文”實(shí)際上偷換了我的文章的主旨,自己發(fā)明出一個(gè)風(fēng)車,然后與之作戰(zhàn)。為此,我必須把話說得更清楚一些。
其一,生活不是都會主動發(fā)出信息。所謂的大數(shù)據(jù),至少到目前為止,仍然主要是各式各樣的監(jiān)測,也就是收集人類生活的各種各樣的信息。由此,大數(shù)據(jù)的第一個(gè)“元假設(shè)”就是:只要信息收集得足夠多,那么就足以了解生活,也就是“越大越好”。
可是問題就出在這里。人類的某些活動是可以主動地發(fā)出信息的,例如網(wǎng)上購物或者出行等等,但是絕大多數(shù)的其他生活活動,卻不會、也不可能主動地發(fā)出任何信息,例如靜思等等。所以,大數(shù)據(jù)的“原罪”并不是“收集得不夠多或者不夠準(zhǔn)”,而是必然忽略掉那些不主動發(fā)出信息的人類生活。也就是說,數(shù)據(jù)無論多么大,也不可避免地會遺漏生活,甚至可能掛一漏萬。
鑒于“劉文”誤解了我的本意,我在此再強(qiáng)調(diào)一下:我并沒有說過大數(shù)據(jù)不能產(chǎn)生,而是提醒大數(shù)據(jù)崇拜者,是不是意識到這樣的遺漏了呢?
其二,信息不會自己變成數(shù)據(jù)。對于大數(shù)據(jù)已經(jīng)收集到的“信息”來說,從一開始,它們就是可以做出分析的“數(shù)據(jù)”嗎?凡是做過任何一種數(shù)據(jù)處理的人都知道,這絕對不可能??墒谴髷?shù)據(jù)的第二個(gè)“元假設(shè)”卻是“一切皆可量化”。那么無論是誰,他/她/它究竟如何把信息給轉(zhuǎn)化為數(shù)據(jù)的呢?這種量化的過程難道不需要界定、篩選、賦值等等司空見慣的處理工作?
還是針對“劉文”的誤解,我在此再說一遍:這不等于說信息就不能轉(zhuǎn)化為數(shù)據(jù),而是提醒大數(shù)據(jù)崇拜者,是不是意識到這種轉(zhuǎn)化中充滿了人為篡改的成分呢?
其三,加工與偽造,沒有什么可爭的?!皠⑽摹钡牡诙糠?,花了很大篇幅來論證大數(shù)據(jù)是“加工”不是“偽造”。但是這半點(diǎn)意義都沒有,因?yàn)槲业脑氖?“往好里說,這叫做無可避免地加工,往壞里說,這就是赤裸裸地偽造?!币簿褪钦f,我和“劉文”在事實(shí)層面上本無爭論,“劉文”的長篇大論,要說的其實(shí)僅僅是一句話:只許說好,不許說壞!這再次成為大數(shù)據(jù)崇拜的典型表現(xiàn)之一。
最后強(qiáng)調(diào)一下,在我的原文中,我曾說明:“本文所論述的一切,其實(shí)都是來自于人文社會研究中,久已存在的對于‘量化研究’的批評?!币簿褪钦f,我文章中的幾乎所有觀點(diǎn),我都沒有著作權(quán),都是100多年來人文社會科學(xué)的質(zhì)性研究者不斷反思的成果。因此,“劉文”的奇怪邏輯,可能僅僅是出于不熟悉學(xué)科史而已。尤其是,“劉文”所說的“主體建構(gòu)的研究取向”,真的使人感到莫名其妙。我只能提醒一下:這在方法論和認(rèn)識論的層次上叫做“主體間性”,研究成果汗牛充棟,我就不再一一列舉相關(guān)文獻(xiàn)了。
“劉文”反復(fù)提出:社會調(diào)查與大數(shù)據(jù)是同一性質(zhì),而且把這當(dāng)作得意的重大質(zhì)疑。其實(shí)這可真是一個(gè)初級錯(cuò)誤。而且我估計(jì),可能還有不少人沒有意識到這個(gè)初級錯(cuò)誤,因此不得不再多說一些。
在關(guān)于大數(shù)據(jù)的爭論中,其實(shí)早就有很多批判者指出:定量的社會調(diào)查和社會科學(xué)研究都是先有假設(shè),然后收集數(shù)據(jù),最后用統(tǒng)計(jì)學(xué)來檢驗(yàn)這個(gè)/這些假設(shè)是否能夠成立??墒谴髷?shù)據(jù)卻反其道而行之,是沒有任何假設(shè)地去漫無目標(biāo)地收集信息,然后再大海撈針般地去得出結(jié)論。這種區(qū)別,集中起來就是一句話:任何自稱為“科學(xué)”的對于人類的研究,究竟需要不需要“假設(shè)—檢驗(yàn)”這一最基本的研究方法?[1]
這是大數(shù)據(jù)崇拜的另外一個(gè)命門,也是一個(gè)根基式的爭論。但是因?yàn)樗鼪]有涉及我文章中的主題“信息如何變?yōu)閿?shù)據(jù)”,所以我才沒有從這個(gè)方向展開論述,只是提到一句:“在最開始,你收集到的,就是可以用來分析的數(shù)據(jù)嗎?在社會學(xué)的問卷調(diào)查中,這是有可能做到的?!爆F(xiàn)在我也不想給出任何評判,還是希望從根子上挖一挖:與社會調(diào)查相比,大數(shù)據(jù)其實(shí)還有另外一個(gè)“原罪”。
社會科學(xué)中的問卷調(diào)查屬于方法論意義上的實(shí)證主義范疇內(nèi)的科學(xué)主義流派,來源于對于自然科學(xué)基本研究方法之一的“受控條件下的、可重復(fù)的、試驗(yàn)”[2]這三大原則的模仿。[3]也就是說,定量的社會調(diào)查,由于調(diào)查者自己需要進(jìn)行“試驗(yàn)”(實(shí)地調(diào)查),因此不得不主動地追求“受控條件”(例如問卷、調(diào)查方法和操作情境都必須嚴(yán)格統(tǒng)一)與“可重復(fù)”(例如信度檢驗(yàn));結(jié)果客觀上也就達(dá)到了模仿自然科學(xué)的效果,實(shí)現(xiàn)了自己的科學(xué)性。
可是大數(shù)據(jù)卻恰恰相反。由于它一開始就沒打算進(jìn)行“由調(diào)查者來操作的試驗(yàn)”(實(shí)地調(diào)查),而是依賴于對人類行為的監(jiān)測,所以也就不需要“受控條件”和“可重復(fù)”;結(jié)果自然科學(xué)研究方法的三大原則,在大數(shù)據(jù)里就蕩然無存。也就是說,大數(shù)據(jù)絕不是做得不夠,而是根本不需要這三大原則。這就是它的非科學(xué)(不是反科學(xué))的性質(zhì),任何基于科學(xué)性的統(tǒng)計(jì)技術(shù)都無法改善之,因?yàn)閮烧吲n^不對馬嘴。
因此,社會調(diào)查與大數(shù)據(jù)之間的區(qū)別,已經(jīng)超出統(tǒng)計(jì)技術(shù)與調(diào)查方法的操作層次,實(shí)際上是方法論層次上的沖突焦點(diǎn),甚至需要從認(rèn)識論層次上來進(jìn)行分析。[4]
當(dāng)然,為了防止再次被人誤解,我要再說一次:“這并不是說,量化研究和大數(shù)據(jù)就一定不能用……只有對這些先天缺陷進(jìn)行深刻反思,并且予以充分展示的量化研究,才有資格在人文社會研究中保留一席之地。”也就是說,我愿意相信,大數(shù)據(jù)實(shí)際上很有可能去模仿自然科學(xué)方法論的三大原則,也可能朝著檢驗(yàn)自己的信度和效度的方向發(fā)展。問題僅僅在于:如果大數(shù)據(jù)崇拜者連自己的“非科學(xué)性”都意識不到,那還有什么可說的呢?
最后不得不提一句,“劉文”拿出我對性工作者的定性訪談,當(dāng)作質(zhì)疑的依據(jù)。這就使我不得不懷疑,該作者可能不了解定量調(diào)查與定性調(diào)查之間長達(dá)百年的爭論。[5]實(shí)際上,這不僅是兩種方法論之爭,甚至可以說是兩種世界觀的差異。[6]將定性調(diào)查與大數(shù)據(jù)相提并論,顯然混淆了兩者的性質(zhì)。
注釋:
[1]張曉強(qiáng)、楊君游、曾國屏:《大數(shù)據(jù)方法:科學(xué)方法的變革和哲學(xué)思考》,《哲學(xué)動態(tài)》2014年第8期。
[2]金觀濤:《控制論與科學(xué)方法論》,北京:新星出版社,2005年。
[3]參見陳蓉霞:《社會科學(xué)與自然科學(xué):此科學(xué)非彼科學(xué)》,《自然辯證法通訊》2004年第4期。
[4]以上的論說,基本上是引自我本人的論述(參見潘綏銘、張娜、黃盈盈:《網(wǎng)站調(diào)查與實(shí)地調(diào)查的實(shí)證對比研究:樣本偏差程度及其方法論意義》,《江淮論壇》2009年第4期),只是把原文中的批判對象“網(wǎng)站調(diào)查”改為“大數(shù)據(jù)”。
[5]參見張學(xué)廣:《科學(xué)主義、人文主義的演進(jìn)與生存危機(jī)》,《社會科學(xué)》2007年第1期。
[6]參見秦英君:《在科學(xué)與人文之間——百年來科學(xué)與人文思潮評析》,《清華大學(xué)學(xué)報(bào)》(哲學(xué)社會科學(xué)版)2007年第1期。
責(zé)任編輯 劉秀秀
作者簡介:潘綏銘,中國人民大學(xué)性社會學(xué)研究所教授、博士生導(dǎo)師,北京市,100872。