■ 王軍
鑒于傳統(tǒng)現(xiàn)代性概念對當(dāng)前社會(huì)缺乏解釋力,同時(shí)為了回應(yīng)后現(xiàn)代學(xué)者對現(xiàn)代性概念和體系的質(zhì)疑和否定,以哈貝馬斯、吉登斯、貝克、鮑曼等為代表的學(xué)者紛紛提出各自主張,認(rèn)為當(dāng)前社會(huì)雖然展現(xiàn)了不同以往的新的形態(tài)、結(jié)構(gòu)及變化趨勢,但仍屬現(xiàn)代性范疇[1]。比如,貝克在《風(fēng)險(xiǎn)社會(huì)》《全球風(fēng)險(xiǎn)社會(huì)》等一系列著作中提出“第二現(xiàn)代性”,認(rèn)為當(dāng)前社會(huì)正處于從傳統(tǒng)現(xiàn)代社會(huì)向風(fēng)險(xiǎn)社會(huì)的轉(zhuǎn)變過程中[2-3]。其中,風(fēng)險(xiǎn)和階層共同成為形塑社會(huì)的關(guān)鍵力量,公眾風(fēng)險(xiǎn)感知的增強(qiáng)也導(dǎo)致了其對專家系統(tǒng)和專家知識(shí)的重新審視和質(zhì)疑,即“自反性現(xiàn)代性”不斷增強(qiáng)[2]。在這一過程中,自然科學(xué)、社會(huì)科學(xué)等學(xué)科的科學(xué)性成為一個(gè)有待證明的問題,學(xué)科的基本范式、方法論基礎(chǔ)、研究方法和具體技術(shù)等都需要進(jìn)行自身合法性論證,原先的科學(xué)“黑盒子”需要呈現(xiàn)在公眾審視的陽光之下。
與自然科學(xué)相比,社會(huì)科學(xué)在“自反性現(xiàn)代性”過程中遭遇的質(zhì)疑更多,甚至有些學(xué)者稱之為“社會(huì)科學(xué)的危機(jī)”。與自然科學(xué)的研究對象(非生命體、動(dòng)植物等)不同,社會(huì)科學(xué)的研究對象無論是經(jīng)濟(jì)、政治還是社會(huì),其最終載體一般是具有自由意志、自我意識(shí)和思想觀念的個(gè)人,并且個(gè)人經(jīng)過社會(huì)化過程,借助語言和文化傳承的方式與他人發(fā)生互動(dòng)并最終形成社會(huì)。正是由于人作為研究對象最終載體所具有的特殊性,導(dǎo)致了社會(huì)各界長期以來對社會(huì)科學(xué)自身科學(xué)性存在一定程度的質(zhì)疑,認(rèn)為人的思想意識(shí)的主觀性與科學(xué)追求的客觀性之間存在沖突和矛盾,而這將導(dǎo)致社會(huì)科學(xué)的“去科學(xué)化”。國外經(jīng)濟(jì)學(xué)、政治學(xué)等社會(huì)科學(xué)近年來對自身學(xué)科的反思也逐漸增多,反思內(nèi)容包括研究對象的恰當(dāng)性、研究方法的合理性、研究方法和分析技術(shù)的有效性以及研究對于政治決策和公共政策的影響力等諸方面。
人自身和由個(gè)人組成的社會(huì)的復(fù)雜性和特殊性,導(dǎo)致了社會(huì)科學(xué)研究長期分化為量化研究和質(zhì)性研究兩個(gè)主要取向。其中,從19世紀(jì)末到20世紀(jì)中葉,量化研究在社會(huì)科學(xué)中居于絕對主導(dǎo)地位,但從20世紀(jì)中期開始,質(zhì)性研究逐漸增多,并對量化研究的主導(dǎo)地位形成一定挑戰(zhàn)[4]??偟膩碚f,量化研究和質(zhì)性研究在方法論、研究方法和具體技術(shù)方面存在很大不同。其中,量化研究強(qiáng)調(diào)社會(huì)事實(shí)的客觀性和可測量性,其方法論基礎(chǔ)一般為實(shí)證主義或后實(shí)證主義,研究方法多采用實(shí)驗(yàn)、問卷調(diào)查等方式獲得測量數(shù)據(jù),并對所獲數(shù)據(jù)進(jìn)行統(tǒng)計(jì)處理和分析,比如描述性統(tǒng)計(jì)、相關(guān)分析和回歸分析等[4];而質(zhì)性研究則更為強(qiáng)調(diào)人對于行動(dòng)和社會(huì)事實(shí)賦予的主觀意義,其方法論基礎(chǔ)則為社會(huì)建構(gòu)論或參與式行動(dòng)理論,研究方法通常使用深度訪談、田野觀察等方式獲得詳細(xì)資料,研究技術(shù)則更強(qiáng)調(diào)基于具體訪談和觀察資料得出更具普遍性和一般性的結(jié)論,比如扎根理論[5]。
由于歷史、學(xué)科和研究視角等多方面原因,量化研究和質(zhì)性研究基本處于平行發(fā)展的相對封閉狀態(tài),交融機(jī)會(huì)相對較為有限。具體來說,量化研究通常以科學(xué)性、客觀性自居,認(rèn)為質(zhì)性研究更偏向人文學(xué)科,即使存在所謂科學(xué)性也非常有限,因此并不注重和質(zhì)性研究的交流,更不用說向其借鑒。在這一認(rèn)識(shí)基礎(chǔ)上,量化研究基本在自己的方法論、研究方法和分析技術(shù)的體系框架內(nèi)不斷發(fā)展壯大,具體表現(xiàn)為研究技術(shù)和方法的不斷復(fù)雜化和精致化,近年來隨著大數(shù)據(jù)和人工智能的熱潮更是呈現(xiàn)出一定的“方法崇拜”和“技術(shù)崇拜”傾向。質(zhì)性研究同樣對量化研究持一定的質(zhì)疑和否定態(tài)度,認(rèn)為社會(huì)事實(shí)是個(gè)人主觀建構(gòu)的結(jié)果,人的主觀意識(shí)和能動(dòng)性滲透到研究的整個(gè)過程,包括研究問題的選取、研究對象的選擇、研究方法的使用以及研究資料的獲取、分析和闡釋等,都是研究者、被研究者和整個(gè)研究過程各個(gè)環(huán)節(jié)不斷互動(dòng)和反饋的結(jié)果?;谝陨侠碛?,許多質(zhì)性研究者認(rèn)為量化研究如果過于癡迷所謂的客觀性和科學(xué)性,過于追求研究方法和技術(shù)的精致化,所得結(jié)果往往會(huì)適得其反,在越來越遠(yuǎn)離社會(huì)事實(shí)真相的同時(shí),也使得量化分析本身成為一個(gè)自娛自樂的“游戲”,對人類知識(shí)的積累和更新往往并沒有多大意義。
質(zhì)性研究對量化分析的質(zhì)疑并非空穴來風(fēng),近年來量化分析自身的“內(nèi)卷化”愈演愈烈,無論是研究者自身還是社會(huì)公眾對此都深有體會(huì)。首先,傳統(tǒng)量化技術(shù)和分析工具層出不窮,圍繞因果推斷這一核心邏輯,傾向值匹配、工具變量法、中介變量法等統(tǒng)計(jì)技術(shù)儼然給定量分析披上了更為堅(jiān)實(shí)可靠的科學(xué)“盔甲”;其次,大數(shù)據(jù)分析和人工智能等逐漸成為量化分析的“顯學(xué)”,“數(shù)據(jù)至上”和“技術(shù)至上”主義盛行,拿到獨(dú)一無二的數(shù)據(jù)和基于大數(shù)據(jù)、人工智能、區(qū)塊鏈等技術(shù)成為量化分析新穎和沒有落伍的“通行證”。
不過,量化分析在追求數(shù)據(jù)、方法和技術(shù)精致化的同時(shí),離公眾的距離卻似乎越來越遠(yuǎn),并出現(xiàn)了一定程度的信任危機(jī)。以近年來人口政策調(diào)整前后人口學(xué)家對中國人口形勢的判斷和估計(jì)為例,人口學(xué)自認(rèn)為是距離自然科學(xué)最近的社會(huì)科學(xué)之一,其主要看家本領(lǐng)就包括人口預(yù)測和估計(jì)技術(shù),歷經(jīng)上百年發(fā)展日臻完善。同時(shí),中國人口學(xué)自20世紀(jì)70年代復(fù)興以來,已培養(yǎng)了大批人口學(xué)專業(yè)研究者,其理論素養(yǎng)和人口學(xué)量化分析技術(shù)等在發(fā)展中國家中可謂首屈一指,即使跟歐美等發(fā)達(dá)國家相比也不相上下。但是,優(yōu)秀的專業(yè)人才隊(duì)伍、扎實(shí)的專業(yè)素養(yǎng)和日趨精致的量化分析工具在研判和估計(jì)中國人口政策調(diào)整后的人口形勢面前,卻遭遇“滑鐵盧”,除了極少數(shù)學(xué)者之外,中國人口學(xué)者對人口政策的調(diào)整效應(yīng)及政策調(diào)整后的出生人口規(guī)模、低生育形勢等幾乎出現(xiàn)了集體誤判,對人口的實(shí)際決策也可能起到了一定誤導(dǎo)作用。社會(huì)各界對此意見很大,人口學(xué)自身的學(xué)科合法性也曾一度廣受質(zhì)疑。
當(dāng)然,經(jīng)濟(jì)學(xué)、政治學(xué)和社會(huì)學(xué)等學(xué)科同樣存在與人口學(xué)類似的窘境。經(jīng)濟(jì)學(xué)可以稱得上當(dāng)今影響最大的社會(huì)科學(xué),但是,經(jīng)濟(jì)學(xué)同樣對于當(dāng)今全球化的社會(huì)現(xiàn)實(shí)缺乏充分的解釋力。2008年,源自美國后來席卷歐美各國的金融危機(jī),經(jīng)濟(jì)學(xué)不僅沒有起到預(yù)警作用,而且很大程度上是該經(jīng)濟(jì)危機(jī)的推波助瀾者。經(jīng)濟(jì)學(xué)精致的數(shù)學(xué)模型不僅沒有預(yù)測到經(jīng)濟(jì)危機(jī)的發(fā)生,甚至對平時(shí)的股票市場、期貨和期權(quán)市場以及房地產(chǎn)市場等都明顯缺乏預(yù)判能力?!敖?jīng)濟(jì)學(xué)何用”可能是一個(gè)當(dāng)前需要認(rèn)真回答的問題。
量化分析取向的社會(huì)學(xué)也面臨著相似的境況。某種程度上來說,量化社會(huì)學(xué)已深深陷入假設(shè)檢驗(yàn)?zāi)嗵逗痛髷?shù)據(jù)分析陷阱。當(dāng)前量化社會(huì)學(xué)很多研究過于追求所謂的“顯著性”,顯著則喜不顯著則憂,全然不顧數(shù)據(jù)的產(chǎn)生、處理和闡釋的基本過程,數(shù)據(jù)的可靠性和代表性、測量的有效性、描述性統(tǒng)計(jì)的必要性等都成為可以忽視或是只需一筆帶過的背景。大數(shù)據(jù)和人工智能技術(shù)的引入,某種程度上進(jìn)一步加劇了量化社會(huì)學(xué)的技術(shù)化傾向。仿佛隨著數(shù)據(jù)的海量增加以及技術(shù)處理效率的極大提高,不僅傳統(tǒng)量化分析的短板和劣勢可以避而不談,而且其優(yōu)勢包括抽樣方法、測量方法和因果推斷等也已成為明日黃花。在這種樂觀情緒下,量化分析儼然成為一個(gè)“黑盒子”,量化研究過程簡化為數(shù)據(jù)輸入和數(shù)據(jù)輸出兩部分,某種意義上可以說此時(shí)的社會(huì)科學(xué)研究者可能與工廠自動(dòng)化生產(chǎn)線的技術(shù)工人已無太大區(qū)別。
針對量化分析目前存在的諸種問題以及公眾對量化分析表現(xiàn)出的不信任甚至反感情緒,不僅不意味著要否定或拋棄量化分析,而是要迷途知返和正本清源,需要傳統(tǒng)量化分析方法和規(guī)范性的復(fù)興,并重新審視傳統(tǒng)量化分析的方法論基礎(chǔ)、研究方法取向以及關(guān)鍵技術(shù),避免陷入假設(shè)檢驗(yàn)?zāi)嗵逗痛髷?shù)據(jù)分析陷阱。同時(shí),要消除與質(zhì)性研究相互隔絕的狀況,認(rèn)真吸取質(zhì)性研究對量化分析的批評(píng)并充分借鑒質(zhì)性研究的優(yōu)勢。在此基礎(chǔ)上,以研究問題為統(tǒng)領(lǐng),將研究方法和技術(shù)定位為分析和研究問題的手段和工具,即研究方法和具體技術(shù)的選擇由研究問題決定,依據(jù)研究問題的不同可以采用量化、質(zhì)性或者混合研究方法(即量化研究和質(zhì)性研究相結(jié)合)。
基于以上分析,下文將以青年研究為例,集中探討社會(huì)科學(xué)研究中的量化分析范式,反思常見謬誤,并對大數(shù)據(jù)和人工智能時(shí)代傳統(tǒng)量化研究方法的重新定位和未來發(fā)展進(jìn)行了討論和展望。
按照庫恩(Kuhn)的觀點(diǎn),無論量化分析還是質(zhì)性研究都是一種范式[6]。社會(huì)科學(xué)量化分析范式主要包括量化研究方法論基礎(chǔ)、量化研究的基本過程以及學(xué)術(shù)論文或調(diào)查報(bào)告的寫作規(guī)范。其中,方法論屬于知識(shí)論范疇,主要指研究者對于人及其組成的社會(huì)的基本認(rèn)識(shí),其很大程度上決定了研究者針對特定研究問題是采用量化研究還是質(zhì)性研究,以及進(jìn)行研究的基本過程和采用的主要研究方法和技術(shù)[7-8]。
社會(huì)科學(xué)研究的方法論主要包括實(shí)證主義和后實(shí)證主義、社會(huì)建構(gòu)論和詮釋主義認(rèn)識(shí)論[4][9-10]。其中,社會(huì)建構(gòu)論和詮釋主義認(rèn)識(shí)論是質(zhì)性研究的方法論基礎(chǔ)。社會(huì)建構(gòu)論強(qiáng)調(diào)社會(huì)世界由個(gè)人創(chuàng)造,是個(gè)人行動(dòng)和互動(dòng)的結(jié)果,由于個(gè)人是社會(huì)的唯一實(shí)在,因此研究的出發(fā)點(diǎn)和落腳點(diǎn)都應(yīng)是個(gè)人[11]。而詮釋主義認(rèn)識(shí)論則強(qiáng)調(diào)人與非生命體和動(dòng)植物之間存在根本不同,即人會(huì)賦予個(gè)人行動(dòng)和人際互動(dòng)以主觀意義,因此社會(huì)科學(xué)應(yīng)基于被研究者自身視角來看問題,注重對研究者賦予行動(dòng)的主要意義、內(nèi)在動(dòng)機(jī)的挖掘,并注重對整個(gè)研究過程和研究發(fā)現(xiàn)的“深描”以及特別強(qiáng)調(diào)研究的情境性[10]。
量化研究的方法論基礎(chǔ)主要是實(shí)證主義和后實(shí)證主義。實(shí)證主義主要指維也納學(xué)派的邏輯實(shí)證主義,而后實(shí)證主義以波普(Popper)的證偽主義為代表[9]??梢哉f,實(shí)證主義與后實(shí)證主義的方法論決定了社會(huì)科學(xué)量化研究以自然科學(xué)為典范,對社會(huì)事實(shí)主要采取客觀主義視角,首先基于演繹邏輯從理論推演出可操作化的研究假設(shè),然后試圖通過檢驗(yàn)變量之間的關(guān)系來檢驗(yàn)理論[4][7]。
從時(shí)間維度來看,量化研究方法論經(jīng)歷了從實(shí)證主義向后實(shí)證主義的演變。社會(huì)科學(xué)實(shí)證主義思想由來已久,比如社會(huì)學(xué)早期代表人物孔德、涂爾干等都主張社會(huì)學(xué)應(yīng)該采取實(shí)證立場。涂爾干的《自殺論》充分展示了社會(huì)學(xué)需要以社會(huì)事實(shí)這一相比個(gè)人具有“突生性質(zhì)”的客觀實(shí)體為研究對象,并采取科學(xué)客觀立場進(jìn)行統(tǒng)計(jì)分析。不過,實(shí)證主義真正對經(jīng)濟(jì)學(xué)、社會(huì)學(xué)等社會(huì)科學(xué)產(chǎn)生主導(dǎo)性影響則應(yīng)歸功于20世紀(jì)20年代和30年代興起的維也納學(xué)派的科技哲學(xué)思想,其直接導(dǎo)致了邏輯實(shí)證主義的產(chǎn)生。邏輯實(shí)證主義的鮮明特點(diǎn)是主張演繹推理和經(jīng)驗(yàn)觀察并重,認(rèn)為社會(huì)科學(xué)應(yīng)該通過理論演繹出可檢驗(yàn)的假設(shè),然后采用經(jīng)驗(yàn)觀察來證明這些理論假設(shè)[9]。
20世紀(jì)30年代開始,波普對邏輯實(shí)證主義驗(yàn)證事實(shí)的觀點(diǎn)進(jìn)行了尖銳批評(píng),并提出對理論假設(shè)的經(jīng)驗(yàn)檢驗(yàn)并不能有效驗(yàn)證事實(shí),而只能做到“證偽”[9][12]。以波普為代表的后實(shí)證主義與實(shí)證主義一樣堅(jiān)持首先要通過理論演繹推演出可操作化的研究假設(shè),不過隨后與實(shí)證主義分道揚(yáng)鑣,認(rèn)為接下來應(yīng)該通過收集經(jīng)驗(yàn)證據(jù)來試圖“證偽”研究假設(shè),從而拋棄已被“證偽”的假設(shè)而暫時(shí)保留未被“證偽”的研究假設(shè)。
科技哲學(xué)后續(xù)的范式理論等對后實(shí)證主義提出了一定的批評(píng)[6]。但不可否認(rèn),實(shí)證主義尤其是后實(shí)證主義仍然是當(dāng)前社會(huì)科學(xué)量化研究占絕對統(tǒng)治地位的方法論基礎(chǔ),經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、人口學(xué)等社會(huì)科學(xué)學(xué)科概莫能外。某種程度上也可以說,范式理論和研究項(xiàng)目理論等并未對后實(shí)證主義的核心論點(diǎn)產(chǎn)生顛覆,而且恰恰相反,這兩種理論使得后實(shí)證主義更加穩(wěn)健。
此外,質(zhì)性研究者一直對量化研究提出尖銳批評(píng),認(rèn)為實(shí)證主義和后實(shí)證主義對人及其社會(huì)與自然世界區(qū)別視而不見、忽略了人對自我行動(dòng)和周圍世界的主觀詮釋、變量統(tǒng)計(jì)關(guān)系與人們?nèi)粘I畹拿摴?jié)等[10]。當(dāng)然,量化研究和質(zhì)性研究由于歷史、方法論和方法技術(shù)等多方面原因,相互攻伐一直存在并且異常尖銳。量化研究也同樣猛烈批評(píng)質(zhì)性研究經(jīng)常過于主觀性、研究往往很難復(fù)制、從具體案例研究推論一般理論層面存在很大困難甚至不可能做到、研究過程缺乏公開性和透明性等問題[10]。不過,實(shí)證主義和后實(shí)證主義也在積極采納質(zhì)性研究對其批評(píng)的建設(shè)性方面意見,例如混合研究方法便是量化研究和質(zhì)性研究開始嘗試走出隔絕狀態(tài),試圖互相取長補(bǔ)短的一種有益嘗試。
實(shí)證主義和后實(shí)證主義的方法論,決定了社會(huì)科學(xué)量化研究的實(shí)證取向。通常來說,社會(huì)科學(xué)量化研究包括確定研究問題、基于理論演繹出可操作化研究假設(shè)、數(shù)據(jù)收集和清理、基于數(shù)據(jù)進(jìn)行統(tǒng)計(jì)推斷、對數(shù)據(jù)結(jié)果進(jìn)行解釋和詮釋這五個(gè)關(guān)鍵環(huán)節(jié)。按照所用數(shù)據(jù)是研究者自己收集(即一手?jǐn)?shù)據(jù))還是使用已有數(shù)據(jù)庫(即二手?jǐn)?shù)據(jù)),量化分析的基本過程會(huì)有所不同。
首先,無論量化研究還是質(zhì)性研究,都要準(zhǔn)確界定研究問題??梢哉f,找到一個(gè)有價(jià)值的研究問題是成功的一半,而無價(jià)值的研究問題則無論其后的量化研究過程如何科學(xué)和精彩也是在做無用功。研究問題應(yīng)該由研究者基于自身日常經(jīng)驗(yàn)、專業(yè)知識(shí)或已有研究文獻(xiàn)提出,并且應(yīng)具有重要理論價(jià)值或現(xiàn)實(shí)意義或二者兼而有之。比如,研究者對于當(dāng)下大城市青年晚婚甚至一直不結(jié)婚這一社會(huì)現(xiàn)象很感興趣,并且基于已有研究、新聞報(bào)道等途徑得知大城市的高房價(jià)是影響青年晚婚或不婚的重要因素。與此同時(shí),研究者也非常希望通過對大城市高房價(jià)與青年晚婚或不婚現(xiàn)象關(guān)系的分析找到一些能夠緩解高房價(jià)對青年婚姻負(fù)面影響的政策途徑。在此基礎(chǔ)上,研究者確定了自己的研究問題,即“城市高房價(jià)對當(dāng)代青年晚婚或不婚的影響及其政策意涵”。
其次,基于理論演繹推理出可操作化的研究假設(shè)。無論依據(jù)實(shí)證主義還是后實(shí)證主義的方法論,量化分析都特別強(qiáng)調(diào)基于理論的邏輯推理,即基于某一或某些理論視角提出研究假設(shè),并將研究假設(shè)操作化為變量之間的關(guān)系。比如,如果要研究“青少年成長經(jīng)歷對于青年生育意愿的影響”,通過閱讀國內(nèi)外文獻(xiàn),發(fā)現(xiàn)可以采用的理論視角為“低生育率陷阱假說”[13]。該假說認(rèn)為,在少子化環(huán)境長大的青年自身的生育意愿要低于在多子女家庭長大的青年。根據(jù)該假說,研究者可以將研究問題操作化為如下兩個(gè)研究假設(shè):在其他條件相同的情況下,(1)從個(gè)人來看,獨(dú)生子女的生育意愿要明顯低于非獨(dú)生子女;(2)從夫妻來看,雙方均為獨(dú)生子女生育意愿最低,而雙方均為非獨(dú)生子女生育意愿最高,一方為獨(dú)生子女一方為非獨(dú)生子女生育意愿居中。
在準(zhǔn)確界定研究問題和基于理論確定可操作化研究假設(shè)基礎(chǔ)之上,接下來就是收集、錄入、清理和評(píng)估一手?jǐn)?shù)據(jù)的環(huán)節(jié)。首先,需要設(shè)計(jì)調(diào)查問卷或結(jié)構(gòu)化訪談(或觀察),從而對核心變量進(jìn)行有效測量。比如,基于“從個(gè)人來看,獨(dú)生子女的生育意愿要明顯低于非獨(dú)生子女”這一研究假設(shè),那么就要在準(zhǔn)確界定“獨(dú)生子女”“非獨(dú)生子女”和“生育意愿”概念的基礎(chǔ)上對其進(jìn)行有效測量?!蔼?dú)生子女”指的是“沒有兄弟姐妹”,而“非獨(dú)生子女”指的是“至少有一個(gè)兄弟姐妹”,“生育意愿”指的是“在當(dāng)前三孩政策下,15~49歲育齡人群期望生育的子女?dāng)?shù)量”;在有效測量基礎(chǔ)上,接下來就需要通過概率抽樣方法獲得足夠調(diào)查樣本。而常用概率抽樣方法包括簡單隨機(jī)抽樣、系統(tǒng)抽樣、分層抽樣、整群抽樣等。按照測量方法和抽樣方法收集一手?jǐn)?shù)據(jù)之后,還要對數(shù)據(jù)進(jìn)行錄入、清理和評(píng)估,包括去除無效數(shù)據(jù)、處理缺失值、樣本代表性評(píng)估和確定加權(quán)方案等,從而為接下來的數(shù)據(jù)分析做好準(zhǔn)備。
在數(shù)據(jù)分析環(huán)節(jié),主要分為描述性統(tǒng)計(jì)和解釋性統(tǒng)計(jì)。其中,描述性統(tǒng)計(jì)主要對研究總體、分人群核心研究變量的統(tǒng)計(jì)結(jié)果進(jìn)行描述,比如樣本的均值、標(biāo)準(zhǔn)差和極值(最大值和最小值)以及由樣本推斷的總體均值和估計(jì)區(qū)間等;解釋性統(tǒng)計(jì)又分為相關(guān)分析和因果推斷。相關(guān)分析主要分析兩個(gè)變量之間的關(guān)系,比如兄弟姐妹數(shù)與本人生育意愿正相關(guān),即兄弟姐妹數(shù)越多,那么本人生育意愿就越高。但存在相關(guān)并不等同于存在因果關(guān)系,這是因?yàn)橐蚬P(guān)系除了需要滿足相關(guān)性之外,還需要同時(shí)滿足以下兩個(gè)條件:(1)時(shí)間上,自變量在前而因變量在后;(2)自變量和因變量存在邏輯上的關(guān)系。按照這一標(biāo)準(zhǔn),我們除了看到兄弟姐妹數(shù)和本人生育意愿正相關(guān)之外,還知道(1)兄弟姐妹數(shù)時(shí)間上在本人生育意愿之前,即兄弟姐妹數(shù)代表的是本人從小長大的原生家庭環(huán)境,而本人生育意愿是當(dāng)前三孩政策下的期望生育子女?dāng)?shù);(2)按照“社會(huì)化”理論,童年時(shí)期以及成長環(huán)境會(huì)對其當(dāng)前觀念和行為產(chǎn)生影響,因此兄弟姐妹數(shù)邏輯上也是影響青年當(dāng)前生育意愿的因素。在滿足因果推斷的三個(gè)前提條件之下,研究者還需要借助多元線性回歸、多元Logistic回歸、傾向值匹配等方法來試圖控制或盡量減輕其他變量對兄弟姐妹數(shù)對于青年當(dāng)前生育意愿影響的混淆(Confounding)作用。
最后,研究者需要對一手?jǐn)?shù)據(jù)的統(tǒng)計(jì)分析結(jié)果進(jìn)行解釋和詮釋。研究者首先需要對量化研究測量方法的有效性、抽樣方法的科學(xué)性、收集到的一手?jǐn)?shù)據(jù)對研究總體的代表性等進(jìn)行充分論證和詳細(xì)說明,否則量化分析結(jié)果的可靠性和有效性嚴(yán)重成疑。在對研究過程科學(xué)性和客觀性進(jìn)行充分論證的基礎(chǔ)上,則需要通過數(shù)據(jù)結(jié)果來檢驗(yàn)研究假設(shè)。如果所得數(shù)據(jù)結(jié)果不支持研究假設(shè),那么可以說研究假設(shè)被“證偽”;如果所得結(jié)果支持研究假設(shè),按照后實(shí)證主義的方法論,也不能說研究假設(shè)被“證實(shí)”,也只能說研究假設(shè)暫時(shí)沒有被“證偽”?;谘芯考僭O(shè)的檢驗(yàn)情況,最后要回到相應(yīng)理論,尤其要關(guān)注那些被“證偽”的研究假設(shè),從而力求對現(xiàn)有理論進(jìn)行一定的修正或情景限定。
總之,量化研究從始至終都要緊緊圍繞研究問題這一核心,按照量化研究實(shí)證主義或后實(shí)證主義方法論,首先基于理論視角將研究問題經(jīng)過演繹推理細(xì)化為可操作化的研究假設(shè),然后通過有效測量方法和科學(xué)概率抽樣方法收集一手?jǐn)?shù)據(jù),從而對研究假設(shè)進(jìn)行檢驗(yàn),并力圖對現(xiàn)有理論進(jìn)行一定的修正。在量化研究的整個(gè)過程中,關(guān)于研究問題的研究結(jié)論也逐漸清晰和具體化。
基于二手?jǐn)?shù)據(jù)的量化研究主要指使用可以公開獲得的已有數(shù)據(jù)進(jìn)行量化分析,其基本研究過程與基于一手?jǐn)?shù)據(jù)的量化分析基本類似,在此只是重點(diǎn)介紹其不同之處。總的來說,基于二手?jǐn)?shù)據(jù)的量化分析對所用數(shù)據(jù)的生產(chǎn)過程通常缺乏較為全面和清晰的了解,并且研究假設(shè)與所用二手?jǐn)?shù)據(jù)之間往往匹配性欠佳。
首先,二手?jǐn)?shù)據(jù)的生產(chǎn)過程對于研究者來說猶如一個(gè)“黑盒子”。雖然國內(nèi)外可公開申請的大型社會(huì)調(diào)查數(shù)據(jù)庫通常有詳細(xì)的調(diào)查手冊、調(diào)查問卷等輔助性說明文件,但由于每個(gè)數(shù)據(jù)庫都有自己的特定研究對象、抽樣框及抽樣方法,這與研究者本人的研究對象、研究總體等可能并不吻合。比如,研究者的研究問題是“城市未婚青年居住狀況與心理健康之間的關(guān)系”,如果研究者找到一個(gè)二手?jǐn)?shù)據(jù),正好包括“居住狀況”和“心理健康”兩個(gè)關(guān)鍵變量的測量。那么,是否該二手?jǐn)?shù)據(jù)就可以直接拿來使用呢?答案很可能是未必。這是因?yàn)?,該二手?jǐn)?shù)據(jù)的研究對象有可能是包括青少年、中年和老年人的全人群樣本。那么問題來了,該二手?jǐn)?shù)據(jù)對全人群有代表性,能保證其對未婚青年人有代表性嗎?即使對全國未婚青年人有代表性,能保證其對分地區(qū)(比如東、中、西部)或分省份的未婚青年有代表性嗎?同樣,能保證其對于分年齡的未婚青年人有代表性嗎?這樣的追問可以一直擴(kuò)展下去。因此,使用二手?jǐn)?shù)據(jù)雖然免去了自己收集數(shù)據(jù)的辛苦,但該二手?jǐn)?shù)據(jù)對于研究者本人研究對象的代表性需要系統(tǒng)和全面的評(píng)估。當(dāng)然,除了二手?jǐn)?shù)據(jù)對于研究者研究總體的代表性之外,研究假設(shè)核心變量測量的信度和效度也需要系統(tǒng)評(píng)估,比如可以同時(shí)比較幾個(gè)可獲得的二手?jǐn)?shù)據(jù)對于研究變量的測量方法和測量結(jié)果的一致性。
其次,研究假設(shè)和二手?jǐn)?shù)據(jù)的匹配性通常并不理想。從量化研究的邏輯上來看,應(yīng)該首先有研究問題,然后基于理論視角通過演繹推理出可操作化的研究假設(shè),緊接著基于可操作化假設(shè)去收集一手?jǐn)?shù)據(jù)(包括核心變量測量方法和抽樣方法等),并基于收集到的一手?jǐn)?shù)據(jù)對研究假設(shè)進(jìn)行檢驗(yàn)。但二手?jǐn)?shù)據(jù)本身是基于其他研究目的而收集,從時(shí)間上來說二手?jǐn)?shù)據(jù)要先于研究者的研究問題和可操作化研究假設(shè),這就導(dǎo)致了研究者做出的研究假設(shè)與二手?jǐn)?shù)據(jù)的匹配性往往欠佳。表現(xiàn)之一是研究者往往要根據(jù)可獲得的二手?jǐn)?shù)據(jù)來修正甚至重新改寫自己的研究問題和可操作化研究假設(shè),難免會(huì)削足適履,而這可能會(huì)大幅降低研究價(jià)值和效力。表現(xiàn)之二是研究者容易受控于二手?jǐn)?shù)據(jù),使得研究問題成為數(shù)據(jù)驅(qū)動(dòng)的結(jié)果,即首先運(yùn)行二手?jǐn)?shù)據(jù)的結(jié)果,如果結(jié)果統(tǒng)計(jì)性顯著,那么再去編織研究問題和研究假設(shè),而這種做法就將研究的邏輯徹底顛倒了過來。其實(shí),從研究邏輯上來說,提出研究假設(shè)所用的數(shù)據(jù),不能夠在對假設(shè)的檢驗(yàn)中再次使用,因?yàn)檫@樣就犯了“依據(jù)事后解釋”的方法論謬誤[7]。
無論量化研究還是質(zhì)性研究,都是一個(gè)循環(huán)往復(fù)的研究過程。無論是研究問題、理論視角及研究假設(shè),都可能要根據(jù)后續(xù)研究對象的界定、抽樣方法和測量方法等進(jìn)行相應(yīng)修正甚至大幅調(diào)整。從這種意義上說,量化研究和質(zhì)性研究過程的各階段都存在相互影響和反饋機(jī)制。具體而言,各個(gè)研究階段雖然在時(shí)間上和邏輯上有先后,但在實(shí)際研究過程中總是處于實(shí)時(shí)互動(dòng)中,雖然前序階段很大程度上決定了后續(xù)階段的研究方向和方法,但同時(shí)后續(xù)階段的實(shí)施也會(huì)對前序階段產(chǎn)生影響甚至對其進(jìn)行修正。
雖然量化研究是一個(gè)循環(huán)往復(fù)、各階段相互影響和互為反饋的過程,但研究者最終呈現(xiàn)給學(xué)術(shù)同行、研究資助方以及公眾的卻是一個(gè)結(jié)構(gòu)化的“作品”。因此,研究者需要在紛繁復(fù)雜的研究過程中理出一個(gè)清晰的“作品”表述邏輯和呈現(xiàn)結(jié)構(gòu),這就涉及量化研究的寫作規(guī)范問題??偟膩碚f,量化研究的最終“作品”主要有兩種形式,即學(xué)術(shù)論文和調(diào)查報(bào)告。其中,量化研究學(xué)術(shù)論文主要基于學(xué)術(shù)取向,其特點(diǎn)是追求研究的學(xué)術(shù)價(jià)值和意義,比如在方法論、理論、方法、技術(shù)或?qū)W術(shù)觀點(diǎn)方面的創(chuàng)新,并遵循嚴(yán)格的學(xué)術(shù)規(guī)范標(biāo)準(zhǔn);量化研究調(diào)查報(bào)告則更為追求研究的實(shí)踐和政策價(jià)值,試圖通過對研究問題的經(jīng)驗(yàn)實(shí)證分析來謀求社會(huì)現(xiàn)實(shí)的改善,其遵循的撰寫規(guī)范相比學(xué)術(shù)論文也要更加靈活。
首先,量化研究學(xué)術(shù)論文的寫作規(guī)范,其呈現(xiàn)明顯的“八股”形式[14]。一篇典型的量化研究學(xué)術(shù)論文一般分為六個(gè)主要部分,分別為研究問題(引言)、文獻(xiàn)回顧與研究假設(shè)、數(shù)據(jù)與方法、描述性統(tǒng)計(jì)結(jié)果、相關(guān)分析或因果推斷結(jié)果、主要結(jié)論。當(dāng)然,也有很多研究將文獻(xiàn)回顧與研究假設(shè)、數(shù)據(jù)與方法進(jìn)行合并,或者將數(shù)據(jù)與方法、描述性統(tǒng)計(jì)結(jié)果進(jìn)行合并,或者將相關(guān)分析或因果推斷結(jié)果拆分為兩個(gè)獨(dú)立部分,但這些改變并不影響量化研究上述的基本架構(gòu)。
量化研究學(xué)術(shù)論文的六個(gè)部分各有側(cè)重點(diǎn)。其中:(1)研究問題(引言)部分,一般首先開門見山,直接表明本文的研究問題以及研究的價(jià)值(主要為學(xué)術(shù)價(jià)值,有的研究也兼有政策價(jià)值);(2)文獻(xiàn)回顧與研究假設(shè)一般首先要圍繞研究問題回顧國內(nèi)外相關(guān)研究文獻(xiàn),找到本研究在該問題相關(guān)領(lǐng)域?qū)W術(shù)研究脈絡(luò)中的位置。要做到繼往開來,即一方面要清晰本研究和以往研究的傳承之處,另一方面又要突出本研究的創(chuàng)新之處。在回顧研究文獻(xiàn)基礎(chǔ)上,最好能夠借鑒某一或某些理論視角提出可操作化的研究假設(shè);(3)數(shù)據(jù)與方法部分,首先要介紹研究所用數(shù)據(jù)基本情況,包括是基于一手?jǐn)?shù)據(jù)還是二手?jǐn)?shù)據(jù),數(shù)據(jù)收集的基本過程、抽樣方法以及樣本對于總體的代表性情況等。接下來,要列明本研究采用的技術(shù)方法,包括核心變量的測量方法、統(tǒng)計(jì)分析策略和具體技術(shù)等;(4)描述性統(tǒng)計(jì)部分,主要是對核心研究變量及分群體情況進(jìn)行統(tǒng)計(jì)描述。其中,既有樣本的描述性統(tǒng)計(jì)(均值、標(biāo)準(zhǔn)差、極值等),又包括基于樣本對于總體指標(biāo)的統(tǒng)計(jì)推斷(區(qū)間估計(jì));(5)相關(guān)分析或因果推斷部分,要特別注意因果推斷的“有條件性”。嚴(yán)格因果推斷的條件其實(shí)非??量?,當(dāng)前絕大多數(shù)基于橫截面數(shù)據(jù)的研究其實(shí)只是一種相關(guān)分析而已,這一點(diǎn)將在本文第四部分進(jìn)行更加深入的分析;(6)主要結(jié)論部分其實(shí)就是全文的縮減版(精華版),需要通過凝練簡約的語言將之前的五部分內(nèi)容概括出來。除此之外,有的文章還會(huì)在最后對研究的局限性進(jìn)行簡要探討。
量化研究調(diào)查報(bào)告相對學(xué)術(shù)論文更為注重調(diào)查問題的現(xiàn)實(shí)意義和政策意涵,寫法也更為靈活。一般來說,調(diào)查報(bào)告主要基于研究者收集到的一手?jǐn)?shù)據(jù),并主要分為四部分,包括調(diào)查問題、調(diào)查方法和數(shù)據(jù)、主要調(diào)查發(fā)現(xiàn)、結(jié)論與建議。其中,調(diào)查問題部分主要介紹本次社會(huì)調(diào)查的主要目的和核心問題,并能夠重點(diǎn)從調(diào)查問題的現(xiàn)實(shí)意義方面來凸顯本次社會(huì)調(diào)查的重要性;調(diào)查方法和數(shù)據(jù)部分,則需要對本次社會(huì)調(diào)查使用的調(diào)查方法(問卷還是結(jié)構(gòu)式訪談或結(jié)構(gòu)式觀察)和調(diào)查地點(diǎn)等進(jìn)行清晰介紹,并對收集到的數(shù)據(jù)基本情況進(jìn)行簡要說明;主要調(diào)查發(fā)現(xiàn)部分,一般基于描述性統(tǒng)計(jì)對本次社會(huì)調(diào)查的主要發(fā)現(xiàn)進(jìn)行簡明扼要的陳述,要求邏輯清晰、陳述結(jié)構(gòu)完整并且讓讀者對調(diào)查發(fā)現(xiàn)能夠一目了然;結(jié)論與建議部分,除了總結(jié)本次調(diào)查的目的、基本過程和主要發(fā)現(xiàn)外,調(diào)查報(bào)告還特別關(guān)注政策建議部分,其相比學(xué)術(shù)論文具有更直接和更強(qiáng)烈的實(shí)踐取向和政策導(dǎo)向。
綜上可見,量化研究學(xué)術(shù)論文和調(diào)查報(bào)告各有所長,并不存在孰優(yōu)孰劣的絕對判定標(biāo)準(zhǔn)。量化研究學(xué)術(shù)論文一般發(fā)表在學(xué)術(shù)期刊上,其閱讀對象一般為學(xué)術(shù)同行,因此比較注重學(xué)術(shù)共同體內(nèi)部的同行評(píng)價(jià),并且特別追求研究的學(xué)術(shù)價(jià)值和理論創(chuàng)新。而量化研究調(diào)查報(bào)告通常以政府公報(bào)或白皮書、學(xué)界藍(lán)皮書、新聞媒體、網(wǎng)絡(luò)自媒體等方式公布或發(fā)表,其閱讀對象一般為政府相關(guān)部門、調(diào)查資助方、新聞媒體及公眾,因此非常注重文章深入淺出和通俗易懂,并希望通過擴(kuò)大調(diào)查報(bào)告的社會(huì)反響來促進(jìn)政府相關(guān)政策的出臺(tái)或改善。
量化研究是當(dāng)今社會(huì)科學(xué)占據(jù)絕對主導(dǎo)地位的研究范式。無論是經(jīng)濟(jì)學(xué)、政治學(xué)、社會(huì)學(xué)還是人口學(xué)等學(xué)科,絕大多數(shù)研究者某種意義上都可以稱之為量化研究者,同時(shí)量化研究文章也頻繁出現(xiàn)在各學(xué)科主流期刊顯要位置。不過,社會(huì)科學(xué)量化研究雖然以自然科學(xué)為標(biāo)桿,強(qiáng)調(diào)其研究對象的客觀性、研究過程的科學(xué)性以及研究成果的規(guī)范性,但其自身卻容易出現(xiàn)各種謬誤,其原因涉及缺乏量化研究基本方法論素養(yǎng)、對社會(huì)現(xiàn)象缺乏敏感性、理論貧乏、抽樣和測量以及統(tǒng)計(jì)分析技術(shù)規(guī)范性不足等諸方面。本部分內(nèi)容將首先總結(jié)社會(huì)科學(xué)量化研究常犯的七大謬誤,然后對常規(guī)量化研究進(jìn)行反思并簡要討論大數(shù)據(jù)和人工智能時(shí)代下傳統(tǒng)量化研究的定位和未來。
第一個(gè)典型謬誤,是研究者自身缺乏基本量化研究方法論素養(yǎng),看似使用了量化方法,但卻陷入了“主觀決定論”。比如,人口學(xué)曾經(jīng)被認(rèn)為是最接近自然科學(xué)的社會(huì)科學(xué),無論是其研究對象(比如生育、死亡和遷移)還是研究方法(比如生命表、人口預(yù)測技術(shù)等)都具有典型的客觀化、科學(xué)化、數(shù)學(xué)化等自然科學(xué)特點(diǎn)。但是,近年來人口學(xué)卻陷入了“科學(xué)性危機(jī)”,無論是人口學(xué)內(nèi)部、其他學(xué)科研究者還是廣大民眾對人口學(xué)家頗有微詞。雖然“冰凍三尺,非一日之寒”,但人口學(xué)家對人口形勢的誤判卻是其中極其重要的原因。而人口形勢誤判則集中體現(xiàn)為“統(tǒng)計(jì)怪圈”現(xiàn)象和人口預(yù)測嚴(yán)重偏離人口現(xiàn)實(shí)[15]。
“統(tǒng)計(jì)怪圈”主要指某次人口普查或抽樣調(diào)查得到了極低的總和生育率,當(dāng)時(shí)人口學(xué)界主流觀點(diǎn)認(rèn)為極低生育率是由于大規(guī)模出生漏報(bào)和瞞報(bào)所導(dǎo)致,在不可能得到真實(shí)漏報(bào)和瞞報(bào)率的情況下,研究者主觀地將總和生育率調(diào)整到1.8或以上,認(rèn)為這一生育率只是略低于2.1的更替水平,因此比較符合中國人口實(shí)際[16]。到了下次人口普查或抽樣調(diào)查,繼續(xù)得到了極低生育率,研究者按照自己的主觀預(yù)設(shè)繼續(xù)大幅調(diào)高總和生育率。這一過程在1992年至2010年的近20年里一直循環(huán)往復(fù)。當(dāng)然,中國當(dāng)前極低生育率的現(xiàn)實(shí)已經(jīng)基本否定了當(dāng)年大幅調(diào)高總和生育率的做法[17]。試想如果當(dāng)年人口普查或抽樣調(diào)查得到了極低生育率后,能夠尊重現(xiàn)實(shí)和客觀結(jié)果,那么人口政策的調(diào)整可能會(huì)更及時(shí)一些,人口少子化和老齡化形勢也會(huì)更緩和一些,當(dāng)前公眾對人口學(xué)和人口學(xué)家的不滿也會(huì)更少一些。
除了“統(tǒng)計(jì)怪圈”,近年來尤其有關(guān)“全面兩孩”的人口預(yù)測結(jié)果嚴(yán)重偏離人口現(xiàn)實(shí)也是人口學(xué)危機(jī)的重要原因[16]。由于社會(huì)、經(jīng)濟(jì)等的快速變化以及人口預(yù)測經(jīng)常涉及人口的中長期變化,因此人口預(yù)測屢屢出錯(cuò)其實(shí)并不奇怪,世界各國莫不如此。但是,人口學(xué)者對于“全面兩孩”政策調(diào)整將導(dǎo)致的人口形勢變化卻出現(xiàn)了集體失誤,并且有的研究結(jié)果嚴(yán)重偏離人口實(shí)際。為什么會(huì)這樣?目前還未見多少反思性文章。其實(shí),現(xiàn)在回看這些預(yù)測,人口預(yù)測參數(shù)設(shè)定錯(cuò)誤是其失誤的關(guān)鍵所在。具體表現(xiàn)為,一是對“全面兩孩”政策響應(yīng)人群的估計(jì)過于樂觀,似乎忽略了即使政策允許生二孩但育齡夫婦仍有選擇不生的自由,或者有的夫婦即使想生二孩但由于身體等生理性原因已經(jīng)很難生育二孩;二是對生育意愿、生育間隔等參數(shù)的設(shè)定過于主觀,缺乏實(shí)證基礎(chǔ)。
通過上述“統(tǒng)計(jì)怪圈”和人口預(yù)測失誤兩個(gè)案例,可以看出無論量化研究的研究對象多么客觀,研究方法和技術(shù)多么科學(xué)和數(shù)學(xué)化,如果研究者不具備基本量化研究方法論素養(yǎng),并且對社會(huì)現(xiàn)實(shí)缺乏敏感性,那么就容易陷入“閉門造車”的境地。尤其當(dāng)社會(huì)現(xiàn)實(shí)和研究者自我感覺不一致時(shí),研究者如果缺乏反思和反省精神,則會(huì)出現(xiàn)試圖讓客觀服從于主觀的傾向,量化研究方法和技術(shù)諸般“武器”的先進(jìn)恰恰起到了推波助瀾的作用。
第二個(gè)典型謬誤,是量化研究者的研究問題意識(shí)不足。研究問題是文章寫作圍繞的核心,理論視角、研究假設(shè)、數(shù)據(jù)和方法等都是圍繞研究問題展開。但現(xiàn)實(shí)是,無論量化研究還是質(zhì)性研究,許多研究者并沒有很好的問題意識(shí)。比如,有的研究問題在學(xué)界早有定論,新的研究則幾乎提供不了多少學(xué)術(shù)貢獻(xiàn)。更有甚者,有的量化研究通篇充斥著各種統(tǒng)計(jì)圖表,但卻沒有明確且聚焦的研究問題,讓讀者通篇讀起來不知所云。
以青年低生育研究為例,“單獨(dú)二孩”尤其“全面兩孩”以來,有關(guān)低生育研究的量化文章呈“井噴”態(tài)勢,內(nèi)容涉及生育意愿、低生育支持政策等方面[18]。但實(shí)事求是來講,即使已經(jīng)發(fā)表的相關(guān)文章,真正具有好的研究問題意識(shí)的量化研究并不太多。當(dāng)前低生育量化研究有一種千篇一律和隔靴搔癢之感,都集中討論一些所謂熱點(diǎn)話題,但大多流于現(xiàn)象表面,并且喜歡空談?wù)呓ㄗh。出現(xiàn)這種問題的主要原因,就是不具備研究問題意識(shí)和敏感性,同時(shí)又缺乏對低生育問題的長期研究積累,在“發(fā)表為王”學(xué)風(fēng)和自利動(dòng)機(jī)的驅(qū)使下,盲目追逐學(xué)術(shù)熱點(diǎn),試圖通過量化研究科學(xué)化外衣來達(dá)到發(fā)表文章的目的。
第三個(gè)謬誤,是量化研究欠缺合適的理論視角,使得文章成為了“數(shù)字展廳”。按照量化研究實(shí)證主義或后實(shí)證主義方法論,基于理論演繹推理出可操作化的研究假設(shè)是量化研究的重要環(huán)節(jié),起著承上啟下的作用。因此,一個(gè)好的量化研究,需要選擇一個(gè)或一系列合適的理論視角。除了缺乏理論視角這一明顯謬誤之外,實(shí)際量化研究還可能出現(xiàn)理論視角選擇不當(dāng)?shù)膯栴}。比如,研究青年人遷移問題,很多量化研究者喜歡使用“推拉理論”,操作化為一系列影響青年人遷移的推力和拉力的測量變量,然后看哪些變量會(huì)顯著影響青年人遷移?!巴评碚摗弊畲蟮膯栴}是其就像一個(gè)筐,幾乎無所不包,因此該理論實(shí)際上無法被“證偽”,而不具有“可證偽性”是違反量化研究方法論原則的。又比如,當(dāng)前很多學(xué)者在研究青年低生育問題時(shí)喜歡使用“第二次人口轉(zhuǎn)變論”,該理論認(rèn)為低生育現(xiàn)象與“個(gè)人主義”價(jià)值觀的盛行和傳統(tǒng)家庭價(jià)值觀的式微有關(guān),而研究者也通?;谠摾碚摬僮骰癁橐幌盗醒芯考僭O(shè)并借此解釋低生育現(xiàn)象[19]。但是,“第二次人口轉(zhuǎn)變論”的最大問題是其犯了方法論的“生態(tài)學(xué)謬誤”,即該理論在個(gè)人層面看似正確,但在國家層面卻并不如此甚至恰恰相反。
量化研究常犯的第四個(gè)謬誤,是數(shù)據(jù)樣本對研究群體沒有代表性。如果樣本對總體沒有代表性的話,無論研究結(jié)論多么吸引眼球都應(yīng)一票否決?;谝皇?jǐn)?shù)據(jù)和二手?jǐn)?shù)據(jù)的樣本代表性問題,在本文第二部分已有詳細(xì)討論,在此不再累述。此處重點(diǎn)補(bǔ)充討論一種盛行的“顛倒式”抽樣邏輯。該抽樣邏輯以配額抽樣為代表,即根據(jù)樣本規(guī)模和研究總體的年齡、性別、教育、職業(yè)和婚姻等分布情況,將樣本“配額”分配到各個(gè)抽樣單元(比如小區(qū)),然后要求調(diào)查員主觀選擇該抽樣單元符合“配額”特征的樣本直至滿足“配額”為止。這種抽樣方法從最終樣本分布來說具有很強(qiáng)的欺騙性,因?yàn)闃颖具x取的“非隨機(jī)性”不可避免會(huì)帶有很強(qiáng)的主觀性,該樣本對總體的代表性往往較差。因此,評(píng)估樣本對總體的代表性,不僅要關(guān)注樣本與總體分布的差異,而且還要關(guān)注抽樣過程是否遵循概率隨機(jī)性原則,二者缺一不可。
對核心變量的測量缺乏信度或效度,是量化研究常犯的第五個(gè)謬誤。與樣本代表性一樣,如果對核心變量的測量缺乏信度或效度,那么該量化研究同樣應(yīng)一票否決。比如,研究當(dāng)前青年低生育意愿問題,首先需要對生育意愿這一變量進(jìn)行有效測量。國內(nèi)外人口學(xué)界一度十分流行使用“理想子女?dāng)?shù)”來測量育齡人群生育意愿,但人口預(yù)測與人口實(shí)際的強(qiáng)烈反差表明,理想子女?dāng)?shù)并不是生育意愿的有效測量指標(biāo)。當(dāng)前正在形成的共識(shí)是,“理想子女?dāng)?shù)”主要測量的是育齡人群覺察到的社會(huì)生育規(guī)范,其與育齡個(gè)體自身的生育意愿往往相差很大,尤其在當(dāng)前超低生育率形勢下就更是如此[18][20]。也就是說,“理想子女?dāng)?shù)”并不是生育意愿的有效測量指標(biāo),之前盛行使用“理想子女?dāng)?shù)”盡管得到了較為一致(即信度較高)的指標(biāo),但由于沒有測量效度因此也容易導(dǎo)致另一種集體失誤。
量化研究容易犯的第六個(gè)謬誤,是研究者輕視甚至忽略描述性統(tǒng)計(jì)。從統(tǒng)計(jì)邏輯上來講,描述性統(tǒng)計(jì)是進(jìn)行更為復(fù)雜統(tǒng)計(jì)分析的基礎(chǔ)和前提。但當(dāng)前很多量化研究過于沉迷于假設(shè)檢驗(yàn),忙于“數(shù)星星”找顯著,卻忽略了本來更為重要的描述性統(tǒng)計(jì),導(dǎo)致即使研究得到假設(shè)檢驗(yàn)顯著的結(jié)果,研究者往往也分不清統(tǒng)計(jì)結(jié)果只是統(tǒng)計(jì)性顯著還是具有實(shí)質(zhì)性顯著意義,對其結(jié)果的解釋可能陷入沒有描述性統(tǒng)計(jì)支撐的個(gè)人“臆想”。對于某些研究問題來說,描述性統(tǒng)計(jì)往往比所謂假設(shè)檢驗(yàn)等更為重要。比如,要研究大城市青年獨(dú)居問題,首先要做的就是要清楚了解大城市獨(dú)居青年的描述性統(tǒng)計(jì)特征,包括獨(dú)居青年的年齡、性別、戶籍、職業(yè)、收入和區(qū)域分布特征等。只有在了解上述大城市獨(dú)居青年的描述性特征基礎(chǔ)上,才能進(jìn)一步了解大城市獨(dú)居青年的影響因素和公共政策干預(yù)措施等。如果沒有對大城市獨(dú)居青年的精準(zhǔn)了解,直接探討?yīng)毦蝇F(xiàn)象成因和相應(yīng)公共政策等在研究邏輯上則屬于舍本逐末,學(xué)術(shù)研究和政策價(jià)值必然會(huì)大打折扣。
輕言因果關(guān)系是量化研究常犯的第七個(gè)典型謬誤。即使公認(rèn)最為接近檢驗(yàn)因果關(guān)系的實(shí)驗(yàn)研究,也存在諸多對實(shí)驗(yàn)過程和結(jié)果的干擾因素,基于抽樣調(diào)查數(shù)據(jù)的統(tǒng)計(jì)推斷就更是如此。當(dāng)前量化研究所用數(shù)據(jù)(無論一手還是二手?jǐn)?shù)據(jù))絕大多數(shù)為橫截面數(shù)據(jù),而橫截面數(shù)據(jù)只能提供“差異”,而“差異”與因果推斷關(guān)注的“變化”往往存在很大差別[7]。即使有關(guān)注“變化”的追蹤數(shù)據(jù),也往往因?yàn)閭€(gè)體主動(dòng)退出、遷移別處或死亡等原因?qū)е伦粉檾?shù)據(jù)發(fā)生“刪截”問題,從而給因果推斷帶來一定困難。
其實(shí),從統(tǒng)計(jì)原理和理論來說,并不存在一種能夠真正確定因果關(guān)系的統(tǒng)計(jì)方法或技術(shù)。同樣,同時(shí)使用了多種統(tǒng)計(jì)技術(shù),并不代表就比使用單一統(tǒng)計(jì)技術(shù)更能證明因果關(guān)系的存在。有關(guān)因果關(guān)系和因果推斷的哲學(xué)發(fā)展史表明,因果關(guān)系更多是“質(zhì)”,并不能靠單純增加統(tǒng)計(jì)技術(shù)的“量”來加以確定。但遺憾的是,“技術(shù)控”現(xiàn)象目前呈日趨泛濫趨勢,沒有太多根據(jù)便斷言存在因果關(guān)系成為學(xué)界慣例,而這一現(xiàn)象已經(jīng)嚴(yán)重影響了量化研究的學(xué)術(shù)聲譽(yù)。
第一個(gè)反思,是量化研究者要痛定思痛,采取實(shí)際行動(dòng)切實(shí)提高自身社會(huì)科學(xué)量化研究方法論素養(yǎng),真正做到尊重客觀社會(huì)現(xiàn)實(shí)。當(dāng)前社會(huì)各界對量化研究的各種“詬病”與傳統(tǒng)質(zhì)性研究對量化研究的批評(píng)其實(shí)很不相同。與學(xué)術(shù)界相比,非學(xué)術(shù)界更為關(guān)注的是量化研究能否真正做到客觀、科學(xué)的分析和研判經(jīng)濟(jì)、社會(huì)和人口等各層面現(xiàn)狀和未來發(fā)展趨勢以及提出建立在客觀研判基礎(chǔ)上的公共政策建議。但遺憾的是,量化研究者無論在經(jīng)濟(jì)、金融、社會(huì)還是人口諸層面多次預(yù)測判斷失真,這加劇非學(xué)術(shù)界的質(zhì)疑,從近年來政府主管部門、報(bào)紙雜志、新聞媒體、公眾等對量化研究較為負(fù)面的態(tài)度可見一斑。
本研究認(rèn)為,外界對量化研究的不滿恰恰反映了相當(dāng)數(shù)量的量化研究者的方法論素養(yǎng)、研究方法訓(xùn)練明顯不足。“數(shù)據(jù)為王”“方法為王”“技術(shù)為王”等花哨、浮躁的理念在為數(shù)不少的量化研究者那里很有市場。尤其是在大數(shù)據(jù)和人工智能等新的數(shù)據(jù)存儲(chǔ)和分析技術(shù)大行其道的今天,這種過于功利化的理念愈演愈烈。正所謂“過猶不及”,過于強(qiáng)調(diào)技術(shù)、算法,恰恰是以犧牲常規(guī)社會(huì)科學(xué)研究方法論和嚴(yán)謹(jǐn)?shù)姆椒鞒虨榇鷥r(jià)的。因此,量化研究需要正本清源,量化研究者也需要從對于各種統(tǒng)計(jì)技術(shù)和算法等“花拳繡腿”的過度沉迷中走出來,轉(zhuǎn)向努力養(yǎng)成扎實(shí)的量化研究方法論基礎(chǔ)、科學(xué)客觀的量化研究流程以及形成嚴(yán)謹(jǐn)?shù)牧炕芯繉懽饕?guī)范。
第二個(gè)反思,是量化研究者要虛心接受質(zhì)性研究對量化研究的批評(píng),可以嘗試引入“人數(shù)互動(dòng)”的視角,尤其要特別關(guān)注人在數(shù)據(jù)生產(chǎn)、統(tǒng)計(jì)分析和數(shù)據(jù)結(jié)果詮釋三個(gè)過程中分別賦予數(shù)據(jù)、方法和技術(shù)等的主觀意義。具體來說:(1)在數(shù)據(jù)生產(chǎn)過程中,要謹(jǐn)防那種“預(yù)定結(jié)果式”數(shù)據(jù)收集方式。比如,為了得到較高的戶均子女?dāng)?shù)指標(biāo),樣本主要選取那些已婚并且已有子女的女性,而選擇性遺漏那些未婚或已婚但現(xiàn)無子女的女性;(2)在統(tǒng)計(jì)分析過程中,也要防范“預(yù)定結(jié)果式”數(shù)據(jù)處理方式。比如,為了得到統(tǒng)計(jì)性顯著結(jié)果,嘗試多種統(tǒng)計(jì)方法模型,最終只保留能夠使得結(jié)果顯著的統(tǒng)計(jì)方法,而不報(bào)告使得統(tǒng)計(jì)結(jié)果不顯著的一種或多種統(tǒng)計(jì)方法。又比如,為了得到比基于人口普查或抽樣調(diào)查直接估計(jì)更高的總和生育率,很多人口學(xué)者喜歡采用間接估計(jì)方法,間接估計(jì)方法需要研究者主觀設(shè)定的空間比較大,因此數(shù)據(jù)結(jié)果相對直接估計(jì)更容易被“操縱”[21];(3)在數(shù)據(jù)結(jié)果詮釋階段,要充分關(guān)注研究者對同一數(shù)據(jù)結(jié)果的不同詮釋,并嘗試從研究者學(xué)術(shù)思想理念、所屬研究機(jī)構(gòu)、研究贊助方等多方面對不同的詮釋尋找合理解釋。比如,面對同樣1.6的總和生育率,有的人口學(xué)者很憂慮,認(rèn)為已經(jīng)遠(yuǎn)低于2.1的更替水平,長此以往將迎來持續(xù)且快速的人口負(fù)增長,但有的人口學(xué)者卻對此顯得比較樂觀,認(rèn)為其仍然高于1.5的“低生育率陷阱”警戒線,并且認(rèn)為人口規(guī)模的減少對中國很可能是好事情[22]。為什么會(huì)有如此樂觀的詮釋和解讀?經(jīng)過系統(tǒng)研讀這些學(xué)者的相關(guān)研究,通常會(huì)發(fā)現(xiàn)此類學(xué)者一般是“適度人口論”的堅(jiān)定擁護(hù)者。可見,對同一數(shù)據(jù)結(jié)果具有不同詮釋的原因是學(xué)者的人口理念不同[22-24]。
第三個(gè)反思,是不能過于割裂地談量化研究和質(zhì)性研究方法,要注重不同研究路徑的有機(jī)融合,需要尋找一種可能的折衷之道,比如混合研究方法。顧名思義,混合研究方法試圖綜合量化研究和質(zhì)性研究,并且一般采納兩種研究路徑[4]。第一種路徑是針對某一研究問題,同時(shí)采用量化研究方法(比如問卷調(diào)查、結(jié)構(gòu)式訪談或觀察)和質(zhì)性研究方法(比如半結(jié)構(gòu)或無結(jié)構(gòu)式訪談、焦點(diǎn)組座談或田野觀察);第二種路徑是首先使用量化研究方法,比如通過問卷調(diào)查搜集數(shù)據(jù)或者直接使用二手?jǐn)?shù)據(jù),對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析并得到數(shù)據(jù)處理結(jié)果。為了對數(shù)據(jù)結(jié)果有充分的解釋,接下來使用質(zhì)性研究方法,比如從研究對象中選取少部分進(jìn)行半結(jié)構(gòu)或無結(jié)構(gòu)式深度訪談,從而深入了解量化數(shù)據(jù)結(jié)果背后所反映的被調(diào)查者的態(tài)度、觀念和動(dòng)機(jī)。當(dāng)然,不論同時(shí)使用還是先后使用兩種方法,目前混合研究方法在方法論、方法和技術(shù)等方面的整合和規(guī)范程度還遠(yuǎn)遠(yuǎn)不夠,這也是今后研究一個(gè)重要的著力點(diǎn)和努力方向。
第四個(gè)反思,需要放在當(dāng)前大數(shù)據(jù)和人工智能熱潮的背景下,本研究認(rèn)為這些量化研究新方法和新技術(shù)帶來便利的同時(shí),研究者也應(yīng)對其未曾預(yù)料的副作用保持足夠警醒。云存儲(chǔ)、云計(jì)算、物聯(lián)網(wǎng)和區(qū)塊鏈等大數(shù)據(jù)和人工智能分析技術(shù)的確有其革命性的一面,數(shù)據(jù)存儲(chǔ)能力和處理效率得到了極大提高,給量化研究者帶來了很多便利。但是,當(dāng)前量化研究表現(xiàn)出一定的過度癡迷大數(shù)據(jù)和人工智能技術(shù)的傾向,甚至認(rèn)為新技術(shù)是“靈丹妙藥”,人們借此可以徹底告別以往繁瑣且嚴(yán)格的社會(huì)科學(xué)量化研究流程以及痛苦的因果推斷之旅。其實(shí),這種認(rèn)識(shí)的背后恰恰反映了研究者對于傳統(tǒng)量化研究方法的不自知和不自信,對此現(xiàn)象應(yīng)該提高警惕。
以人口預(yù)測為例,20世紀(jì)70年代末有自然科學(xué)家領(lǐng)導(dǎo)研究團(tuán)隊(duì)采用“控制論”來預(yù)測中國未來100年的人口發(fā)展趨勢,當(dāng)時(shí)“控制論”比時(shí)下的大數(shù)據(jù)和人工智能無論科學(xué)前沿性還是權(quán)威性都是有過之而無不及。但是,采用當(dāng)時(shí)如此高精尖技術(shù)做的人口預(yù)測,今天回看幾乎成了笑話,其與中國人口發(fā)展實(shí)際可謂差了十萬八千里。為什么會(huì)出現(xiàn)這種情況?根本原因就是因?yàn)榧夹g(shù)無論標(biāo)榜多么先進(jìn)多么前沿,其至多只是一個(gè)工具和手段而已。而一個(gè)好的量化研究的標(biāo)準(zhǔn)更多的存在于是否具有扎實(shí)的方法論基礎(chǔ)以及研究假設(shè)是否經(jīng)得起經(jīng)驗(yàn)檢驗(yàn),而這位自然科學(xué)家領(lǐng)導(dǎo)的團(tuán)隊(duì)顯然忽略了傳統(tǒng)量化研究的這些核心方面,使用當(dāng)時(shí)最尖端最時(shí)髦的技術(shù)卻生產(chǎn)出了現(xiàn)在來看非常荒謬的預(yù)測結(jié)果。其實(shí),從某種意義上來說,進(jìn)入大數(shù)據(jù)和人工智能時(shí)代,傳統(tǒng)定量分析方法不僅沒有過時(shí),反而變得更加重要,即在技術(shù)可能越來越不成問題的情況下,研究方法論、對研究問題的敏感性、理論視角、測量方法等成為好的研究和壞的研究的主要分界線。
基于以上分析,可以暢想一下傳統(tǒng)量化研究的未來。傳統(tǒng)量化研究的基本內(nèi)核,包括方法論、基本研究過程等不會(huì)發(fā)生根本改變,并且在大數(shù)據(jù)和人工智能等新技術(shù)背景下傳統(tǒng)量化研究的重要性不僅沒有降低,反而會(huì)更加凸顯。同時(shí),量化研究在回應(yīng)非學(xué)術(shù)界和質(zhì)性研究對其批評(píng)的過程中自身也會(huì)變得更加開放包容。一方面,量化研究自身的科學(xué)性、客觀性和規(guī)范性得到顯著增強(qiáng)。另一方面,量化研究與質(zhì)性研究的分界線變得更具彈性,量化研究能夠積極吸納質(zhì)性研究的優(yōu)勢,比如其對于個(gè)人及其賦予事物的主觀意義的強(qiáng)調(diào)。總之,雖然當(dāng)前量化研究面臨不少責(zé)難和非議,但如果能夠徹底反思并且切實(shí)行動(dòng),那么其未來仍然充滿光明和希望,廣大研究者和社會(huì)各界民眾都希望量化研究能夠不斷趨近于“量化社會(huì)現(xiàn)實(shí),增進(jìn)人類知識(shí),提高個(gè)人福祉”的終極理想。反之,如果量化研究缺乏徹底的反思,繼續(xù)沉浸于“技術(shù)至上”之迷夢,那么量化研究的未來可能會(huì)邁向另一個(gè)極端。
社會(huì)科學(xué)量化研究目前面臨來自非學(xué)術(shù)界和質(zhì)性研究的“雙重批評(píng)”,某種程度上陷入了信任危機(jī)。與此同時(shí),相當(dāng)數(shù)量的社會(huì)科學(xué)量化研究者過度沉迷于假設(shè)檢驗(yàn)、大數(shù)據(jù)和人工智能分析,表現(xiàn)出較強(qiáng)的“技術(shù)崇拜”。針對量化研究的研究現(xiàn)狀和學(xué)界風(fēng)氣,本研究主要以青年研究為例,詳細(xì)分析了社會(huì)科學(xué)量化研究的方法論、研究基本過程、寫作基本規(guī)范以及量化研究常見的七大謬誤及其反思。
本研究認(rèn)為,為了應(yīng)對當(dāng)前量化研究呈現(xiàn)的自身危機(jī),首先要做的是要正本清源,復(fù)興傳統(tǒng)量化研究的方法論基礎(chǔ)、研究方法以及注重研究過程的規(guī)范性。其中,社會(huì)科學(xué)量化研究的方法論經(jīng)歷了從實(shí)證主義向后實(shí)證主義的轉(zhuǎn)變,兩者雖然都注重從理論演繹推理出可操作化假設(shè),但檢驗(yàn)假設(shè)的邏輯從“證實(shí)”轉(zhuǎn)變?yōu)椤白C偽”;基于一手?jǐn)?shù)據(jù)的量化研究基本過程通常包括確定研究問題、基于理論演繹推理可操作化假設(shè)、數(shù)據(jù)收集和清理、對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析、解釋和詮釋數(shù)據(jù)結(jié)果等五個(gè)關(guān)鍵環(huán)節(jié)。而基于二手?jǐn)?shù)據(jù)的量化研究雖然省略了數(shù)據(jù)收集環(huán)節(jié),但同樣需要認(rèn)真評(píng)估數(shù)據(jù)質(zhì)量和樣本代表性。同時(shí),需要認(rèn)識(shí)到二手?jǐn)?shù)據(jù)收集過程的非透明性、研究假設(shè)和二手?jǐn)?shù)據(jù)匹配性往往欠佳等局限性;量化研究的寫作規(guī)范方面,學(xué)術(shù)論文和調(diào)查報(bào)告是量化研究最終呈現(xiàn)的“作品”。其中,學(xué)術(shù)論文主要追求研究的學(xué)術(shù)價(jià)值和意義,力圖在方法論、方法和理論等方面有所創(chuàng)新,其閱讀對象主要為學(xué)界同行,并且遵循嚴(yán)格的寫作規(guī)范標(biāo)準(zhǔn)。而調(diào)查報(bào)告更重視研究問題的現(xiàn)實(shí)意義和政策價(jià)值,閱讀對象更多是政府部門、調(diào)查資助方、新聞媒體等,其寫作形式相對也更加靈活。
本研究還總結(jié)了當(dāng)前社會(huì)科學(xué)量化研究存在的常見謬誤,并進(jìn)行了相應(yīng)反思和未來發(fā)展展望。其中,當(dāng)前社會(huì)科學(xué)量化研究的常見謬誤包括量化研究者缺乏基本方法論素養(yǎng)、研究問題意識(shí)不足、研究欠缺合適理論視角、樣本對研究總體沒有代表性、核心變量測量缺乏信度或效度、輕視或忽略描述性統(tǒng)計(jì)、輕言因果關(guān)系等七個(gè)方面;對此的反思包括提高量化研究方法論素養(yǎng)、引入“人數(shù)互動(dòng)”視角、嘗試量化研究和質(zhì)性研究的有機(jī)融合、保持對大數(shù)據(jù)和人工智能副作用的警醒。未來發(fā)展方面,本研究認(rèn)為在大數(shù)據(jù)和人工智能時(shí)代,在技術(shù)越來越不是問題的形勢下,傳統(tǒng)量化研究的重要性反而愈加凸顯。如果社會(huì)科學(xué)量化研究者能夠深刻反思并采取切實(shí)行動(dòng),那么未來量化研究在更加開放包容、讓數(shù)據(jù)更有溫度的同時(shí),其自身的客觀性和科學(xué)性以及在學(xué)界和公眾的信任度和美譽(yù)度會(huì)重新回升。當(dāng)然,如果研究者反思性不足并且缺乏實(shí)際行動(dòng),那么量化研究也可能會(huì)趨向另一個(gè)極端。因此,社會(huì)科學(xué)量化研究的未來依然懸而未決并取決于學(xué)術(shù)共同體每一個(gè)人的實(shí)際行動(dòng)。