□李志勇
閱讀是人類獲取知識、增長智慧的重要方式之一,是一個國家、一個民族精神發(fā)育、文明傳承的重要途徑。為全面及時準(zhǔn)確掌握全省居民閱讀狀況,自2018 年起,江蘇省社情民意調(diào)查中心受省全民閱讀辦委托,利用計算機輔助電話調(diào)查系統(tǒng)和全國統(tǒng)計系統(tǒng)社情民意調(diào)查熱線電話“12340”,在全省范圍內(nèi)開展居民閱讀狀況電話調(diào)查,及時獲取全省居民閱讀情況數(shù)據(jù),其中根據(jù)調(diào)查結(jié)果計算的居民綜合閱讀率納入了江蘇省高質(zhì)量發(fā)展監(jiān)測評價指標(biāo)體系,因此準(zhǔn)確可靠的反映居民閱讀狀況顯得更為重要。本文從江蘇居民閱讀調(diào)查的實踐出發(fā),分析調(diào)查中的難點和易產(chǎn)生的誤差及解決路徑。
自2014 年江蘇開展居民閱讀調(diào)查狀況以來,前期主要通過入戶或街頭攔截訪問的形式開展。2018 年至今,全省居民閱讀狀況調(diào)查由江蘇省社情民意調(diào)查中心組織開展,采用的是計算機輔助電話調(diào)查方式。除了上述的調(diào)查方式外,有些調(diào)查還通過網(wǎng)絡(luò)平臺進(jìn)行。這些調(diào)查方式在組織方式上以及對數(shù)據(jù)質(zhì)量的影響各有哪些優(yōu)缺點呢?如下表如示:
閱讀行為的客觀界定與不同的人對閱讀行為的主觀判斷存在誤差。按照現(xiàn)代社會普遍接受的最寬泛的定義,閱讀指的是“理解書寫或印刷符號的能力”。隨著數(shù)字媒介的變革,閱讀從印刷時代過渡到電子時代,再過渡到數(shù)字時代,人們對閱讀的理解呈現(xiàn)出更豐富的內(nèi)涵。閱讀寬泛的定義,更像是一種獲取各類信息的行為,不僅從印刷介質(zhì)上,還包含了從電子屏幕等高科技界面上獲取編碼信息的能力,不僅有“看”,還包括了“聽”。本文所談的“閱讀”,是一種狹義的理解范疇,是讀者通過印刷媒介和電子媒介傳播的圖文讀物獲得有意義的行為,不僅強調(diào)的是“看”,更強調(diào)“看什么”。即閱讀的具體介質(zhì)應(yīng)包括閱讀紙質(zhì)類、電子類的書、報、刊物和文章作品。
表1 不同調(diào)查方式優(yōu)缺點比較
雖然,閱讀行為的客觀界定用文字很好定義,但在調(diào)查實踐中,不同的人對閱讀行為有著不同的理解,其差別在于對自我閱讀量、閱讀頻率及閱讀內(nèi)容在閱讀行為界定上的不同理解。有的人認(rèn)為偶爾看下報紙不算閱讀,有的人則認(rèn)為就看看微信也算閱讀,如果不在調(diào)查時特意解釋說明在一段時間內(nèi)(如一年)只要有過閱讀紙質(zhì)和電子類的書報刊的行為,就算是有閱讀行為,會使一定數(shù)量的人更傾向于把有無閱讀習(xí)慣當(dāng)作有無閱讀行為。我們把這種客觀界定與主觀判斷產(chǎn)生的調(diào)查誤差稱為抽樣調(diào)查中非抽樣誤差的一種——計量誤差。當(dāng)然在閱讀狀況調(diào)查中,計量誤差不僅僅限于前面提及的概念理解誤差,還有一些問卷設(shè)計不科學(xué)、測量不準(zhǔn)確形成的計量誤差;還有調(diào)查閱讀量,如“一年中閱讀了多少本書?”這類回憶性的測量也易造成計量誤差。
調(diào)查實踐證明,居民閱讀狀況調(diào)查與其他調(diào)查不一樣的是,居民閱讀狀況調(diào)查反映的是居民自身的閱讀行為、偏好等情況,不是對外界事物的評價。顯然,在對調(diào)查的配合程度上,有閱讀行為人群和無閱讀行為人群是不一致的,有閱讀行為人群的配合程度明顯高于無閱讀人群。無閱讀行為人群認(rèn)為你調(diào)查的是閱讀狀況,和我沒關(guān)系,就不愿意接受調(diào)查。因此,無論是哪種調(diào)查方式,都會或多或少的存在無閱讀人群對調(diào)查的配合程度低、易產(chǎn)生拒訪、難以入樣的現(xiàn)象,特別是電話調(diào)查這種本身拒訪率就高的調(diào)查方式更是如此。
這種拒訪現(xiàn)象我們可看作為“無回答”的種類之一,還有一種是因調(diào)查內(nèi)容缺失行程的,也可稱為“無回答”。由“無回答”產(chǎn)生的誤差,我們稱之為無回答誤差,也是非抽樣誤差的種類之一。如果“無回答”層和“回答”層在所研究標(biāo)志方面沒有顯著差異,則“無回答”的影響不大。但如果“無回答”層與“回答”層存在顯著差異(如有閱讀行為的人和無閱讀行為的人),會造成估計量是有偏的,且由于“無回答”沒有提供樣本數(shù)據(jù),即實際調(diào)查到的樣本比目標(biāo)樣本小,估計誤差就可能會增大。如果不解決這個問題,易造成調(diào)查樣本中無閱讀行為人群結(jié)構(gòu)性缺失,使居民閱讀調(diào)查變成對“文化人”的調(diào)查,使調(diào)查結(jié)果產(chǎn)生一定誤差。因此,要提高閱讀調(diào)查數(shù)據(jù)的準(zhǔn)確性和可靠性,必須要把無閱讀行為人群摸準(zhǔn)查實。
眾所周知,只要是調(diào)查、進(jìn)行測量就會有誤差。全面調(diào)查有調(diào)查誤差也有數(shù)據(jù)處理誤差。而抽樣調(diào)查也同樣存在誤差,誤差的大小決定調(diào)查數(shù)據(jù)的估計精度。從理論上說,抽樣調(diào)查估計精度的高低只取決于抽樣誤差的大小。抽樣誤差是抽樣過程中產(chǎn)生的,由樣本隨機性引起的且不可避免,但可計算。每一次抽樣調(diào)查都能根據(jù)抽樣設(shè)計的方法來計算抽樣誤差,即每一次抽樣調(diào)查都有一個唯一確定的估計精度。然而在實踐中,往往還存在抽樣誤差以外的因素在影響著抽樣估計精度,這個因素就是非抽樣誤差。它的存在改變了實際的估計精度,又使我們難以客觀衡量抽樣估計精度。當(dāng)抽樣估計值受非抽樣誤差的影響而與真實情況相差甚遠(yuǎn)時,討論抽樣估計精度就毫無意義。
非抽樣誤差是指除了抽樣誤差以外的各種原因引起的誤差,主要包括抽樣框誤差、計量誤差和無回答誤差三大類。抽樣框誤差是指目標(biāo)總體與抽樣總體不一致產(chǎn)生的誤差,如在電話調(diào)查中電話號碼(電話號段)不能涵蓋目標(biāo)總體;計量誤差主要是問卷設(shè)計階段產(chǎn)生的誤差,如用詞不準(zhǔn)確,問句存在誘導(dǎo)性和傾向性等;也有調(diào)查員引起的調(diào)查誤差,如對被訪對象回答內(nèi)容的理解產(chǎn)生偏差等;還有調(diào)查對象原因形成的誤差(如對問題的理解產(chǎn)生偏差,如需要回憶才能回答的問題等)。非抽樣誤差由于原因的復(fù)雜性和不隨機性,難以測量、計算、控制。
可見,對居民閱讀調(diào)查誤差的考量,不僅要根據(jù)樣本量的大小、總體指標(biāo)的變異程度、抽樣設(shè)計方法、估計方法以及總體大小等因素來計算抽樣誤差估計調(diào)查精度,還要對調(diào)查本身會產(chǎn)生哪些非抽樣誤差作深入考量,采取措施,最大限度的避免非抽樣誤差,讓非抽樣誤差對數(shù)據(jù)精度的影響降到最低。
圖1 抽樣調(diào)查誤差的種類
在江蘇居民閱讀狀況的調(diào)查實踐中,針對調(diào)查中的難點和易產(chǎn)生的誤差,要降低和控制誤差,提高調(diào)查數(shù)據(jù)的準(zhǔn)確性和可靠性,使調(diào)查數(shù)據(jù)能更好推動居民閱讀工作的開展,要做到以下四點:
1.整理和編制與目標(biāo)總體近似的抽樣框。如在計算機輔助電話調(diào)查中盡可能收集大而全的電話號段,即通過收集基本單位名錄庫、各類普查資料中的電話號碼,并整理和編制電話號段(如固定電話中的前四位,手機號碼中的前七位),在調(diào)查時采用尾數(shù)隨機法,自動生成電話號碼,確保調(diào)查時,計算機自動形成的電話號碼能將目標(biāo)總體全涵蓋,以降低抽樣框不準(zhǔn)、缺失帶來的抽樣框誤差。
2.收集、整理調(diào)查區(qū)域與人口結(jié)構(gòu)相關(guān)的數(shù)據(jù)。如城鄉(xiāng)、性別、年齡、受教育程度等數(shù)據(jù),并根據(jù)被調(diào)查區(qū)域的人口結(jié)構(gòu)數(shù)據(jù)在調(diào)查時作好樣本配額控制,使調(diào)查樣本的人口結(jié)構(gòu)與被調(diào)查區(qū)域的人口結(jié)構(gòu)相近似,使調(diào)查結(jié)果更精確地反映本地區(qū)真實的閱讀狀況和水平。
1.選擇合適的調(diào)查方式。前面已經(jīng)闡述了各種不同調(diào)查方式的優(yōu)缺點。目前,江蘇居民閱讀狀況調(diào)查采取的計算機輔助電話方式,解決了無閱讀人群入樣難的問題,在確保數(shù)據(jù)真實可靠的前提下,電話調(diào)查的組織便捷、時效性高、數(shù)據(jù)質(zhì)量可監(jiān)控等優(yōu)點將得到充分利用。
2.科學(xué)設(shè)計抽樣方法。根據(jù)調(diào)查的目的和調(diào)查估計精度的要求,設(shè)計更為科學(xué)的抽樣方法,如江蘇采取的分層抽樣,可以在相同樣本量的條件下減少抽樣誤差。
3.科學(xué)設(shè)計調(diào)查問卷。通過精準(zhǔn)設(shè)計,讓被訪者更加清晰明確調(diào)查問題的內(nèi)容、定義及界定,使其能更準(zhǔn)確地回答,更準(zhǔn)確地反映實際情況,以降低計量誤差。如對無閱讀人群配合程度低、易拒訪的現(xiàn)象,在問卷設(shè)計上可設(shè)置跳轉(zhuǎn),對明確表示自己無閱讀行為的人群,不再詢問閱讀相關(guān)的內(nèi)容,只需詢問被訪對象相應(yīng)的背景信息,使其作為有效樣本,使實際調(diào)查完成的樣本縮小或接近目標(biāo)樣本,從而降低無回答誤差帶來的影響,降低估計誤差。
1.做好訪問員的配備和培訓(xùn)工作。嚴(yán)格按照《社情民意計算機輔助電話調(diào)查管理規(guī)范》(DB32/T 3618—2019)的要求,做好訪問員的配備和業(yè)務(wù)培訓(xùn)工作。
2.質(zhì)量控制貫穿于工作全流程。嚴(yán)格按照《社情民意計算機輔助電話調(diào)查管理規(guī)范》(DB32/T 3618—2019)的要求,規(guī)范執(zhí)行數(shù)據(jù)采集,將質(zhì)量控制于調(diào)查全流程,提高調(diào)查數(shù)據(jù)質(zhì)量,降低訪問和數(shù)據(jù)處理時產(chǎn)生的誤差。
要多角度來衡量、評價居民閱讀狀況。不僅要測量居民的閱讀行為,更要從多角度來衡量、評價居民閱讀狀況。要克服單一指標(biāo)——居民綜合閱讀率評價閱讀行為不夠全面不能體現(xiàn)閱讀工作成效的不足,而采用更科學(xué)的居民閱讀指數(shù)來進(jìn)行衡量和評價閱讀狀況。如從居民閱讀個體指數(shù)和閱讀工作指數(shù)來共同構(gòu)建居民閱讀指數(shù),不僅包括反映居民自身的閱讀行為、閱讀時長等,也要包括反映閱讀服務(wù)設(shè)施的建設(shè)、利用情況,閱讀活動的開展、參與情況等,以期更好地發(fā)揮指標(biāo)的引領(lǐng)作用,把促進(jìn)全民閱讀作為建設(shè)“強富美高”新江蘇的“賦能工程”,更好地推動書香社會建設(shè),建設(shè)社會文明程度更高的新江蘇。