潘綏銘 張 娜 黃盈盈
摘要:筆者們在完成總?cè)丝诘亩嚯A段抽樣的筆記本電腦輔助的實地調(diào)查之后,以縮減的同一問卷進行網(wǎng)站調(diào)查。兩者的可比性得以論證。通過對照分析,發(fā)現(xiàn)網(wǎng)站調(diào)查應(yīng)答者的階層分布相比于前者出現(xiàn)了全面的統(tǒng)計學(xué)上的顯著差異,證明網(wǎng)站調(diào)查既不能代表總?cè)丝冢膊荒艽砭W(wǎng)民,甚至不能代表城市男性網(wǎng)民。網(wǎng)站調(diào)查的興旺與不受批評的現(xiàn)狀,來源于當(dāng)前大眾的信息饑渴與無知rr從業(yè)者和無良傳媒商的自覺合謀制造以及學(xué)術(shù)界對社會責(zé)任的忽視。網(wǎng)站調(diào)查本質(zhì)上是招募調(diào)查,因此不是做不到而是不需要總體界定與隨機抽樣。這違背了科學(xué)研究方法的基本定義,因此網(wǎng)站調(diào)查只能向著開展定性調(diào)查的方向發(fā)展。
關(guān)鍵詞:網(wǎng)絡(luò)調(diào)查;網(wǎng)站調(diào)查;隨機抽樣;調(diào)查方法論;科學(xué)性
中圖分類號:C915文獻標(biāo)志碼:A
一、問題的提出與研究方法
1提出問題的背景。在互聯(lián)網(wǎng)上的某個網(wǎng)站發(fā)布、僅僅由上網(wǎng)者主動登錄該網(wǎng)站并且主動回答的定量問卷調(diào)查(網(wǎng)站調(diào)查,web survey,web-based survey),至晚從2005年開始就在我國呈現(xiàn)為幾何式的增加,其調(diào)查結(jié)果往往被大眾傳媒廣泛地、放大地傳播,不但已經(jīng)在相當(dāng)大的程度上影響到公眾的認(rèn)知與價值判斷傾向,甚至影響到政府行政與立法;就連被認(rèn)為應(yīng)該是科學(xué)性要求最強的醫(yī)學(xué)領(lǐng)域中,居然也有人堂而皇之地使用起這樣的網(wǎng)站調(diào)查的結(jié)果。在“性”方面最典型的例子是:生產(chǎn)避孕套(安全套)的杜蕾斯公司2004年公布其網(wǎng)站調(diào)查結(jié)果說:中國人的性伴侶人數(shù)達到平均19.3個,是世界上最多的。經(jīng)大眾媒體廣泛傳播之后,引發(fā)了中國公眾的極大困惑與爭論。盡管該公司的網(wǎng)站調(diào)查負(fù)責(zé)人信誓旦旦地說:“我們就是想盡一些社會責(zé)任,了解人們性生活全景,并和社會來分享信息。這個報告和商業(yè)沒有任何關(guān)系,也不會為商業(yè)而用?!钡菑钠渖鐣Ч麃砜?,人們?nèi)匀缓苡欣碛烧J(rèn)為,這個網(wǎng)站調(diào)查其實從一開始就可能僅僅是該公司的一種促銷手段而已。
雖然國際上已有研究,雖然我國的一些學(xué)者在泛論式的研究成果中也涉及到這方面的問題,但是我國學(xué)術(shù)界到目前為止仍然沒有專門針對這種大行其道的網(wǎng)站調(diào)查的論文。
2問題的提出。網(wǎng)站調(diào)查既沒有一個調(diào)查總體,也不可能進行隨機抽樣,因此其結(jié)果不具有任何意義上的代表性,這是學(xué)術(shù)界一直堅持的共識(金懷玉,2002;郭繼志,2006;胡云峰,2008),某些網(wǎng)站調(diào)查的主張者也敢于公然承認(rèn)這一點。(12)
但是,網(wǎng)站調(diào)查的這種非隨機抽樣方法究竟產(chǎn)生了多大程度的樣本偏差,這種偏差又造成了調(diào)查結(jié)果在多大程度上的失誤,我國學(xué)術(shù)界目前尚缺乏實證的研究成果。這不利于對網(wǎng)站調(diào)查方法及其結(jié)果進行科學(xué)的評價,不利于引導(dǎo)公眾正確看待各種網(wǎng)站調(diào)查的結(jié)果,客觀上可能造成學(xué)術(shù)界放棄引導(dǎo)公眾之社會責(zé)任。
筆者尤其希望論述的是:網(wǎng)站調(diào)查的這種樣本偏差為什么值得學(xué)術(shù)界高度重視?其方法論層面(而不是操作層面)的意義是什么?筆者又主張什么與建議什么?為此,筆者設(shè)計了這樣的一個研究方案:
(一)研究方法
首先,在福特基金會的資助下,筆者于2006年8月到12月完成了一項全國18—60歲總?cè)丝诘亩嚯A段抽樣問卷調(diào)查。第一級抽樣單位為縣級區(qū)域,按照城鄉(xiāng)分層,以離婚率排序進行系統(tǒng)抽樣,共抽取21個省市自治區(qū)的120個縣級區(qū)域,其中75個城市縣級區(qū)域,45個農(nóng)村縣級區(qū)域。第二級抽樣單位是在抽中的縣級區(qū)域里,采用隨機數(shù)確定一個街道(鎮(zhèn)、鄉(xiāng))。第三級抽樣單位是居委會(村),在城市的街道中采用隨機數(shù)抽取2個居委會,在農(nóng)村的鎮(zhèn)鄉(xiāng)中采用隨機數(shù)抽取一個村,共抽取195個居委會(村)。最后以當(dāng)?shù)鼐幼∪丝跒榈?級抽樣單位,按照當(dāng)?shù)爻W∪丝诿麊渭捌涞乩矸秶鷥?nèi)的流動人口的總?cè)藬?shù)進行系統(tǒng)抽樣,共獲得5403個有效樣本。(以下簡稱為“總?cè)丝谡{(diào)查”(10)
然后,筆者從2007年8月開始,將同樣的問卷,在保留所有基本提問,刪除細節(jié)追問之后(題量大約是原來的一半),以Web格式掛在一個公共網(wǎng)站上(http://www.omni3w.net/omnisurvey/)。到2008年12月1日為止,共獲得18歲到60歲的2593人的有效回答。(以下簡稱為“網(wǎng)站調(diào)查”)
第三步,將兩組數(shù)據(jù)進行對比分析,以便發(fā)現(xiàn)其差異。其中總?cè)丝谡{(diào)查的數(shù)據(jù)已經(jīng)按照抽樣方案,使用2005年百分之一人口普查數(shù)據(jù)進行加權(quán)。本文下列的所有統(tǒng)計表格中的所有變量均進行了交叉表的卡方檢驗(Pealsoil Chi-Square,Asymp,Sig.2-sided)與獨立樣本的T值檢驗(independent-sample T test),其統(tǒng)計量均為0.0000。(下文中不再一一列出。)
(二)可比性論證
由于筆者進行的是對比分析,因此將兩種調(diào)查方法的可比性進行論證如下:
2006年筆者所進行的全國總?cè)丝趩柧碚{(diào)查,采用筆記本電腦輔助的調(diào)查方法(computer survey),也就是把問卷設(shè)計成電子格式,顯示在調(diào)查員隨身攜帶的筆記本電腦的屏幕上,由被調(diào)查者來按鍵回答。這是目前國際上效果最佳的實地社會調(diào)查方法。
這種方法與網(wǎng)站調(diào)查實際上已經(jīng)具有完全的同質(zhì)性,當(dāng)然可以作為評價網(wǎng)站調(diào)查結(jié)果的對照標(biāo)準(zhǔn)。其具體表現(xiàn)為:
1筆者在總?cè)丝谡{(diào)查中,事先給每位被調(diào)查者送交一封預(yù)約信,說明筆者的調(diào)查目的與大概內(nèi)容,邀請他們到預(yù)定的地點來接受調(diào)查。因此被調(diào)查者具有完全的自由與相應(yīng)的能力來選擇是否接受調(diào)查。這與網(wǎng)站調(diào)查所采用的招募自愿者的方法,在自愿回答這一點上不存在任何性質(zhì)的差異。
2筆者把被調(diào)查者請到完全封閉的獨立的訪談室,獨自面對電腦屏幕,自己作答。訪談室內(nèi)只有與被調(diào)查者同性別的訪談員。他們坐在筆記本電腦的對面,由于電腦屏幕(蓋子)的遮擋,完全看不到被調(diào)查者的回答結(jié)果,只有在被調(diào)查者需要的時候才會提供適當(dāng)?shù)恼f明與電腦操作上的幫助。這與網(wǎng)站調(diào)查所最著力標(biāo)榜的獨立回答(因此最能保密),具有完全相同的性質(zhì)。
3在被調(diào)查者能夠“真實表述”這一點上,筆者的反證是:既然筆者的調(diào)查在動員與回答的各個環(huán)節(jié)上與網(wǎng)站調(diào)查在性質(zhì)上相同,那么其回答也就會具有相同性質(zhì)的真實。
(三)筆者的調(diào)查內(nèi)容對于本論題的特殊意義
筆者的這兩個調(diào)查都是針對性行為與性關(guān)系的高度敏感問題。調(diào)查這樣的內(nèi)容,網(wǎng)站調(diào)查往往被認(rèn)為具有大得多的真實性。姑且不論這一點,筆者的假設(shè)是:如果網(wǎng)站調(diào)查的樣本偏差程度在統(tǒng)計學(xué)上是顯著的,那么眾多的個體的真實回答匯集起來的恰恰就是總體認(rèn)知上的謬誤。
(四)問題的凝煉
綜上所述,筆者所進行的筆記本電腦輔助的實地社會調(diào)查,在操作方法上與網(wǎng)站調(diào)查并不存在性質(zhì)上的差異,那么對于調(diào)查結(jié)果來說,唯一
的差異只能是來自于是否進行了隨機抽樣。也就是說,筆者所設(shè)計的對照研究,不僅足以檢驗網(wǎng)站調(diào)查的樣本偏差的程度及其后果,而且是檢驗的最佳途徑。
二、網(wǎng)站調(diào)查樣本的社會階層分布嚴(yán)重偏離實況
1與總?cè)丝诘钠?。在現(xiàn)實生活中,網(wǎng)站調(diào)查的實施者經(jīng)常把大規(guī)模的樣本量當(dāng)作標(biāo)榜其調(diào)查結(jié)果具有代表性的最重要的指標(biāo),有時甚至是唯一標(biāo)準(zhǔn)。
我國的絕大多數(shù)相關(guān)的研究成果都已經(jīng)指出了上述說法的荒謬。筆者的實證對比研究也清楚地表明:在筆者所設(shè)置的30個社會階層特征指標(biāo)中,與全國總?cè)丝谡{(diào)查的結(jié)果相比,網(wǎng)站調(diào)查結(jié)果中基本持平的指標(biāo)僅有7個,而其余的23個指標(biāo)相差可以達到58個百分點,甚至相差20倍(上過大學(xué)或者研究生的比例)。這就使得任何統(tǒng)計技術(shù)層次上的矯正都失去了可能性。
2與全國網(wǎng)民總體的偏差。在大眾傳媒領(lǐng)域中,雖然尚無直接的理論論述,但是在使用過程中相當(dāng)多的人認(rèn)為,網(wǎng)站調(diào)查雖然不能代表中國的總?cè)丝?,但是至少在一定程度上可以代表中國的網(wǎng)民。這成為網(wǎng)站調(diào)查結(jié)果被廣泛傳播的重要理論依據(jù)之一。
但是,筆者把全國總?cè)丝谡{(diào)查中的網(wǎng)民抽出來與網(wǎng)站調(diào)查結(jié)果進行對照卻發(fā)現(xiàn):即使僅僅針對網(wǎng)民這個群體,網(wǎng)站調(diào)查的對象也系統(tǒng)地偏向于城市的、30歲以下的、大學(xué)以上的、中等以上收入的科技人員與知識分子。其間的差異可以達到49個百分點,甚至5倍左右(上過大學(xué)或者研究生的比例)。顯然,網(wǎng)站調(diào)查無法代表全國的網(wǎng)民總體。
3與城市男性網(wǎng)民總體的偏差。網(wǎng)站調(diào)查樣本就連特定的網(wǎng)民小群體也無法代表。筆者把兩個調(diào)查中的城市男性網(wǎng)民這樣一個總體單獨抽取出來進行對照分析,發(fā)現(xiàn)網(wǎng)站調(diào)查在其他社會階層特征上的差異仍然很大而且具有統(tǒng)計學(xué)顯著性。上述三點匯總起來便得到下面的表1。
表1充分表明:即使網(wǎng)站調(diào)查中的某些社會階層的數(shù)據(jù),恰巧基本符合了隨機抽樣的總?cè)丝谡{(diào)查的結(jié)果,它也仍然因其在另外那些重要社會特征方面所存在的偏差而無法代表那些數(shù)據(jù)恰巧基本相符的社會階層。
三、網(wǎng)站調(diào)查的樣本偏差帶來的認(rèn)知謬誤
表2說明:那些在網(wǎng)上回答筆者調(diào)查的人,其實都是那些性活動非常活躍而且不遵守傳統(tǒng)性道德的人們中那些表現(xiàn)欲更強一些的人。可是,即使是僅僅針對這些特定人,網(wǎng)站調(diào)查的結(jié)果也僅僅是表現(xiàn)出這些人的共同傾向,仍然不具有任何意義上的代表性。
如果學(xué)術(shù)界任由這樣的網(wǎng)站調(diào)查結(jié)果在大眾傳媒中擴散,那么就會夸大“性自由者”的比例,就會扭曲城市男性網(wǎng)民、全體網(wǎng)民乃至全體中國人的性的存在狀況,甚至可能引來社會管理方面的決策失誤。
四、網(wǎng)站調(diào)查興起及其社會文化原因
網(wǎng)站調(diào)查得以興起,最基本的社會推動力來自于中國公眾的“統(tǒng)計數(shù)字饑渴”。長期以來,中國的統(tǒng)計數(shù)字一是過于官方化(唯有官方機構(gòu)在調(diào)查與發(fā)布),二是過于物質(zhì)化(主要是調(diào)查與統(tǒng)計各種可測量的客觀存在物),對于普通人所關(guān)心的常人生活中的各種生動現(xiàn)象與人們的實踐活動卻缺乏調(diào)查與統(tǒng)計,造成了供給不足所引發(fā)的需求旺盛。
首先,無知與無良自覺合謀的“統(tǒng)計數(shù)字經(jīng)濟學(xué)”是大約21世紀(jì)以來中國的獨特產(chǎn)物㈣。它雖然來自“眼球經(jīng)濟”(注意力經(jīng)濟,the economv of attention)”,但是在當(dāng)今的中國,這往往是一種高度自覺的合謀行為:一些缺乏社會科學(xué)基本訓(xùn)練的IT從業(yè)者,持續(xù)地、商業(yè)化地、批量化地生產(chǎn)出各式各樣的非隨機抽樣的網(wǎng)站調(diào)查結(jié)果,再由一些力圖吸引眼球的傳媒商人包裝為五花八門的聳人聽聞的“統(tǒng)計數(shù)字”來賺錢。他們還發(fā)出豪言壯語:“網(wǎng)絡(luò)調(diào)查必將取代傳統(tǒng)的調(diào)查方式,這是調(diào)查業(yè)發(fā)展的趨勢和方向?!苯Y(jié)果,中國公眾在信息供不應(yīng)求的同時,還不得不面臨著信息的商業(yè)化選擇甚至是公然造假。
其次,中國社會科學(xué)界在社會調(diào)查與統(tǒng)計分析方面的專業(yè)化程度不夠,而普及程度更低。網(wǎng)站調(diào)查對于公眾的誤導(dǎo),在相當(dāng)大的程度上應(yīng)該歸因于社會科學(xué)家既沒有積極抗?fàn)帯皞髅降脑捳Z霸權(quán)”,也沒有用日常語言把社會調(diào)查中隨機抽樣的必要性給公眾講清楚。
五、網(wǎng)站調(diào)查的欠科學(xué)性
表面上看來,網(wǎng)站調(diào)查與總?cè)丝谡{(diào)查之間在代表性方面的巨大差異,來源于網(wǎng)站調(diào)查既沒有調(diào)查總體也無法進行隨機抽樣。因此,許多網(wǎng)站調(diào)查中的有識之士已經(jīng)開始努力接近隨機抽樣,不斷地提出各種解決方法,例如“正確界定目標(biāo)總體”(袁峰,2005)、運用IP地址限制技術(shù)、Cookie技術(shù)(滕文杰,2005)等等。一些專業(yè)學(xué)者也試圖進行評估與控制(杜婷,2004;李軍軍,2005),或者矯正各種抽樣誤差(陳珍珍,游家興,2002;黃建,2004;徐浪,2006;杜婷,2006;顏承元,2007;王東,2007;胡云峰,2008),或者在統(tǒng)計技術(shù)層面上進行彌補(劉瑋,2005;李軍軍,2005;浦國華,2006)。還有一些學(xué)者則是提倡規(guī)范網(wǎng)站調(diào)查的應(yīng)用范圍(滕文杰,2005;郭繼志,2006;),或者提倡“網(wǎng)絡(luò)調(diào)查與傳統(tǒng)調(diào)查相結(jié)合”(鐘蕾,2006;石磊,2008)。
但是筆者認(rèn)為,上述努力都是治標(biāo)而不治本。其實,網(wǎng)站調(diào)查與總?cè)丝谡{(diào)查之間所具有的方法論層次上的根本區(qū)別,或者說,是否進行隨機抽樣之所以具有方法論意義上的決定性,在于前者是依賴于調(diào)查對象主動地去尋找調(diào)查問卷,而后者則是研究者有目標(biāo)有設(shè)計地去尋找被動反應(yīng)的調(diào)查對象。
這是網(wǎng)站調(diào)查無法克服的根本缺陷。這又可以分為三個層次步步深入地來看。
首先,任何網(wǎng)站,即使是僅僅針對網(wǎng)民,也不可能具有起碼程度的涵蓋性。這說的是:任何網(wǎng)站調(diào)查都不可避免地會出現(xiàn)極高比例的無應(yīng)答誤差(這往往被刻意隱瞞了)。它的來源,并不是潛在的應(yīng)答者看到了問卷而不回答,而是他們根本就看不到發(fā)布問卷的該網(wǎng)站或者看到了而根本不去點擊。這是因為互聯(lián)網(wǎng)上永遠也不會有一個人人必須點擊之的網(wǎng)站,哪怕是最大的門戶網(wǎng)站或者搜索引擎也是如此。
其次,網(wǎng)站調(diào)查的抽樣框永遠無法涵蓋人口總體。無論科技與經(jīng)濟如何發(fā)展,只要人類還存在著各種差異,那么互聯(lián)網(wǎng)使用者就永遠也不可能覆蓋任何一個較大規(guī)模的人口總體。這是因為,這不僅是能不能用上互聯(lián)網(wǎng)的問題,更是愿不愿意用的問題??倳腥瞬簧暇W(wǎng)的,而這種偏差又是非實地調(diào)查而不可測定的。所謂“隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)站調(diào)查的代表性會日益提高”的說法其實只是以假設(shè)來代替前提的謬誤。
第三,最根本的是對主動應(yīng)答者無法進行任何抽樣。也就是說,只要調(diào)查對象是主動地、任意地參加的(這常常被認(rèn)為是網(wǎng)站調(diào)查最重要的優(yōu)點),那么任何一種抽樣(哪怕是非隨機的)就不可能實現(xiàn),任何程度的代表性也就根本無從談起。在現(xiàn)存的網(wǎng)站調(diào)查中,別說抽樣,就連那些根本不適合回答本問卷的應(yīng)答者也沒有去阻擋,夫
復(fù)何言?
歸根結(jié)底,網(wǎng)站調(diào)查與實地調(diào)查的本質(zhì)區(qū)別在于:前者的樣本規(guī)模與代表性完完全全掌握在被調(diào)查者手中,無論調(diào)查者把問卷或者抽樣方法(如果有的話)設(shè)計得多么科學(xué)多么巧妙,都無法控制調(diào)查實際進程的任何一個環(huán)節(jié),甚至連最微小的影響與干預(yù)都無法施加。反之,在筆者所進行的電腦輔助的實地調(diào)查中,一切盡在掌控之中。
這一本質(zhì)區(qū)別標(biāo)識了網(wǎng)站調(diào)查方法的非科學(xué)性。
網(wǎng)站調(diào)查的方法論的實質(zhì)是招募式調(diào)查,是守株待兔、愿者上鉤。這違背了任何一種問卷調(diào)查的最基本的原理。
社會科學(xué)中的問卷調(diào)查屬于方法論意義上的實證主義范疇內(nèi)的科學(xué)主義流派,來源于對于自然科學(xué)基本研究方法之一的“受控條件下可重復(fù)的試驗”的模仿。后者要求“我”(調(diào)查者)必須主動地去研究被動存在的“它”(調(diào)查對象),才能得到對于“我”的假設(shè)的檢驗。
在社會調(diào)查中,經(jīng)典的實地調(diào)查方法由于是調(diào)查者自己需要進行“試驗”(實地調(diào)查),因此不得不主動地追求“受控條件”(總體界定)與“可重復(fù)”(隨機抽樣),結(jié)果客觀上也就達到了模仿自然科學(xué)的效果,實現(xiàn)了自己的科學(xué)性。
可是網(wǎng)站調(diào)查卻恰恰相反。由于它一開始就沒打算進行“由調(diào)查者來操作的試驗”(實地調(diào)查)而是依賴于應(yīng)答者自投羅網(wǎng),所以根本不需要任何主動尋找調(diào)查對象的設(shè)計與實施;結(jié)果也就不需要“受控條件”、“可重復(fù)”這兩大原則。也就是說,招募調(diào)查對象的網(wǎng)站調(diào)查,絕不是在總體界定與抽樣方法方面做得不夠,而是根本不需要這些東西。這就是它的非科學(xué)(不是反科學(xué))的性質(zhì),任何基于科學(xué)性的統(tǒng)計技術(shù)都無法改善之,因為兩者牛頭不對馬嘴。
進一步說,正是由于招募調(diào)查這一實質(zhì)不可改變,因此網(wǎng)站調(diào)查被認(rèn)為所擁有的一切優(yōu)越之處(方便、及時、廉價、時空廣泛等等),統(tǒng)統(tǒng)都會因其調(diào)查結(jié)果在代表性上的謬誤而變成助紂為虐之舉。
更進一步說,經(jīng)典的實地問卷調(diào)查是客觀測量的方法,是調(diào)查者主動去收集被動存在的數(shù)據(jù),而網(wǎng)站調(diào)查所使用的招募調(diào)查方法則在很大程度上是“主體建構(gòu)”,是應(yīng)答者們主動創(chuàng)造出調(diào)查數(shù)據(jù)。這兩者之間的區(qū)別已經(jīng)超出統(tǒng)計技術(shù)與調(diào)查方法的操作層次,實際上是方法論層次上的科學(xué)主義與人文主義的沖突焦點,甚至需要從認(rèn)識論層次上來進行分析。本文僅希望指出雙方的不同質(zhì),不再展開論述。
六、發(fā)展建議
由于“招募調(diào)查對象”這一方法論上的本質(zhì),網(wǎng)站調(diào)查不應(yīng)該再朝著總體代表性這個無望的方向發(fā)展,而是應(yīng)該朝著三個不同的方向前進。
第一個方向仍然在問卷調(diào)查的范疇之內(nèi),把網(wǎng)站調(diào)查作為實地調(diào)查的預(yù)調(diào)查(試調(diào)查)。這樣的網(wǎng)站調(diào)查絕對不是尋求任何絕對數(shù)與百分比,而是用來修訂調(diào)查問卷。這樣,我們就很可能提前發(fā)現(xiàn)許許多多問卷設(shè)計中的缺點。這樣,網(wǎng)站調(diào)查的各種優(yōu)點(方便、及時、廉價、時空廣泛等等)才能真正變成正向的長處,才能極大地彌補實地調(diào)查的預(yù)調(diào)查中成本高、耗時長、時空狹小等缺點。
第二個發(fā)展方向是把網(wǎng)站調(diào)查所發(fā)現(xiàn)的小概率的社會現(xiàn)實轉(zhuǎn)化為定性的表述。招募式調(diào)查不可能實現(xiàn)代表性,卻足以反映社會生活的多樣化存在。它所得到的任何數(shù)字的意義,并不是某種情況在某種群體中占百分之多少,而是在社會生活中確實存在著這種情況。因此網(wǎng)站調(diào)查應(yīng)該努力去揭示那些發(fā)生概率很小甚至極小的各種現(xiàn)象,這才是其最大優(yōu)點。
這是因為,一方面,隨機抽樣的實地調(diào)查的最大缺點恰恰是很容易篩選掉這樣的小概率情況;另一方面對于任何一種小概率情況來說,最重要的并不是它有多少、占百分之多少,而首先是它究竟有沒有、存在不存在。
例如在筆者所進行的網(wǎng)站調(diào)查中,有些應(yīng)答者一生中的性伴侶人數(shù)達到了4位數(shù)。反之,有些年輕夫妻雖然沒有任何相關(guān)的障礙,卻可以在上一年中連一次性生活都沒有。因此網(wǎng)站調(diào)查實施者應(yīng)該這樣來發(fā)布自己的調(diào)查結(jié)果:盡管發(fā)生概率很小而且出乎大眾的意料,但是這樣的人確實存在于我們的社會之中。
這樣的表述是一種定性的認(rèn)知,不但應(yīng)該舍棄任何尋求絕對數(shù)與百分比的意圖,而且應(yīng)該在表述中刻意把具體的數(shù)目字模糊化。
這種定性認(rèn)知其實非常重要。它可以打破社會中廣泛存在的各式各樣的刻板印象,促進公眾首先在思維方式上實現(xiàn)多元化,從而發(fā)揮社會調(diào)查的積極社會作用。
說到底,即使是隨機抽樣的定量統(tǒng)計數(shù)字與相關(guān)分析的結(jié)果,最后其實也只有被當(dāng)作定性認(rèn)知來使用,人類才能夠思考。㈣因此在這一點上,網(wǎng)站調(diào)查恰恰可以以其對于小概率現(xiàn)象的強大的發(fā)現(xiàn)能力,在定性認(rèn)知上開辟捷徑。
第三個發(fā)展方向是把網(wǎng)站調(diào)查徹底轉(zhuǎn)變?yōu)槎ㄐ哉{(diào)查的工具。
定性調(diào)查追求的并不是測量社會現(xiàn)象,而是發(fā)現(xiàn)與理解人的行為及其結(jié)果,因此不尋求代表性,而是追求資料的深度。尤其是定性調(diào)查不但不排斥而且非常歡迎調(diào)查對象的各種主動呈現(xiàn)。這不僅恰恰符合網(wǎng)站調(diào)查的性質(zhì),而且其所有優(yōu)點更有用武之地。研究者完全可以運用各種文化感召與技術(shù)手段,把網(wǎng)站設(shè)置為某一主題的磁鐵,去吸納那些日漸增多而且送貨上門的“網(wǎng)上自白”。
尤其是,在實地的定性調(diào)查中,合適的調(diào)查對象常常是可遇而不可求;而網(wǎng)站調(diào)查的招募性質(zhì)及其相對更容易做到的大應(yīng)招量,卻恰恰可以在更大的程度上解決這一難題。
參考文獻:
[1]方國斌、陳年紅,基于網(wǎng)絡(luò)技術(shù)的抽樣調(diào)查設(shè)計與實施研究,統(tǒng)計與決策[J],2009,(1):4—7
[2]方國斌、陳年紅,網(wǎng)絡(luò)抽樣調(diào)查組織形式及其優(yōu)缺點,統(tǒng)計與決策,2008,(24):31—32
責(zé)任編輯木宸