余小霞 辛自強 苑媛
摘要:措辭效應(yīng)是一種由量表語言表述引起的特殊的方法效應(yīng)。本文系統(tǒng)梳理了措辭效應(yīng)的相關(guān)研究,根據(jù)措辭效應(yīng)的來源將其分為正向一反向表述效應(yīng)、問題表述焦點效應(yīng)、量尺選項的措辭效應(yīng)三類,并從語義理解、認(rèn)知加工等視角探討了措辭效應(yīng)發(fā)生的心理機制??刂拼朕o效應(yīng)有兩類方法,一方面可以采用轉(zhuǎn)換項目表述方式和量表形式等程序控制手段,另一方面可以采用“相關(guān)特質(zhì)相關(guān)方法”“相關(guān)特質(zhì)相關(guān)特性”和雙因子模型分析方法進行統(tǒng)計控制。未來研究應(yīng)加強影響因素的探究,考察常用量表在不同文化下的措辭效應(yīng),并借鑒語言學(xué)的視角深入探究措辭效應(yīng)的本質(zhì)。
關(guān)鍵詞:措辭效應(yīng);方法效應(yīng);心理機制;控制方法
1.引言
心理測量主要以文字語言為載體傳達意義,受測者基于對量表語義的理解對各個項目做出反應(yīng)。這就使得量表中語言表述的結(jié)構(gòu)、內(nèi)容等因素均可能導(dǎo)致測量結(jié)果的差異。這類由語言表述方式對量表產(chǎn)生的影響可以統(tǒng)稱為“措辭效應(yīng)”(wording effect)。
國內(nèi)外研究者在使用“wording effect”這一概念時,往往將其等同于“項目表述效應(yīng)”(item/question wording effect),即項目的正向和反向表述方式引起的與測量內(nèi)容無關(guān)的系統(tǒng)變異(顧紅磊,王才康,2012;顧紅磊,溫忠麟,2014;DiStefano&Moil,2006)。事實上,項目表述效應(yīng)僅是措辭效應(yīng)的一種表現(xiàn)形式.由于其具有普遍性和典型性,將顯著影響量表的信度和效度,因而引起了眾多研究者的關(guān)注。
從根本上講,措辭效應(yīng)是一種方法效應(yīng)(method effect)或者說反應(yīng)偏差(response bias),它是一種與測量構(gòu)念無關(guān)的、系統(tǒng)的誤差反應(yīng)(American Education Research Association,1999)。心理測量中有兩個值得特別關(guān)注的問題:測量結(jié)果能否反映被試的真實狀態(tài)?測得的是不是目標(biāo)變量?量表的優(yōu)劣通常用信度和效度兩個指標(biāo)來衡量,量表中的細(xì)微差異,包括問題和選項的順序、措辭使用等都會對量表的信度和效度造成影響(Krosniek,1991)。
隨著測量法的廣泛應(yīng)用.研究者面臨著一個共同的困境:盡管使用同一量表.不同研究得到的量表結(jié)構(gòu)卻不盡一致。最為典型的如羅森伯格自尊量表,大多數(shù)研究結(jié)果不支持原量表設(shè)想的單維結(jié)構(gòu):一些研究發(fā)現(xiàn)正向表述和反向表述的項目各聚合成一個因子.構(gòu)成量表的二維結(jié)構(gòu)(Farh&Cheng,1997;Marsh,Scalas,&Nagengast,2010);一些研究發(fā)現(xiàn)除整體的自尊因子外,正向表述項目(Wang,Siegal,F(xiàn)alck,&carlson,2001)或反向表述項目(DiStefano&Moil,2006)存在一個方法因子;也有研究發(fā)現(xiàn),除整體的自尊因子外,正向表述項目和反向表述項目各包含一個潛在的方法因子(Lindwall.Barkoukis,Grano,Lucidi,Raudsepp,Liukkonen,&ThogersenNtoumani,2012;Urban,Szigeti,Ktiktinyei,&Demetrovics,2014)。以項目表述效應(yīng)為代表的措辭效應(yīng)普遍存在于諸如羅森伯格自尊量表等各類量表中,不能忽視(Marsh,1996;Biderman,Nguyen,Cunningham,&Ghorbani,2011),一些實證研究已經(jīng)從不同角度揭示了措辭效應(yīng)的實質(zhì).對以上問題做出了解答。本文將梳理措辭效應(yīng)的主要類型及其對測量的影響,分析不同類型措辭效應(yīng)存在的心理機制.在此基礎(chǔ)上探討避免和消除措辭效應(yīng)的方法。
2.措辭效應(yīng):類型及影響
量表中的措辭既包括指導(dǎo)語和題干的語言表述,也包括量尺上的選項表述。根據(jù)措辭效應(yīng)的來源,可將其分為三類:正向-反向表述效應(yīng)、問題表述焦點效應(yīng)、量尺選項的措辭效應(yīng)。
2.1正向-反向表述效應(yīng)
在大多數(shù)量表中.為了避免被試產(chǎn)生趨同反應(yīng).只在量尺的一端作答,往往同時采用正向題和反向題(McClendon,1991;Schuman&Presser,1981)。以羅森伯格自尊量表(Rosenberg Seff-Es-teem Scale,RSES)為例,該量表共有10個條目,包括5道正向題(比如,“我認(rèn)為自己是個有價值的人,至少與別人不相上下”)和5道反向題(比如,“我覺得自己沒有什么值得自豪的地方”)。
即便對反向題進行了反向計分處理,使正向題和反向題在邏輯上具有等價性.正向題和反向題的混合使用仍帶來了新的問題。許多人格量表都是單維結(jié)構(gòu),正向題和反向題引起的項目表述效應(yīng)使得項目間的相關(guān)降低,導(dǎo)致因素分析中單維結(jié)構(gòu)擬合不佳(DiStefano&Moil,2006)。這一現(xiàn)象在不同的量表中均得到了證實,例如Rosenberg(1965)編制的自尊量表(DiStefano&Moil,2006;Marsh et a1.,2010),Judge,Erez,Bono和Thoresen(2003)編制的核心自我評價量表(Gu,Wen,&Fan,2015),Scheier,Carver和Bridges(1994)編制的生活定向測驗(顧紅磊,王才康,2012;Kam&Meyer,2012),Prmto,Sidanius,Stallworth和Malle(1994)編制的社會支配傾向量表(Xin&Chi,2010)。
同時.對于哪些項目適合正向表述.哪些項目適合反向表述.以及正向和反向表述各占多大比例等問題目前尚無定論。研究者對于某些項目采用正向表述還是反向表述也存在爭論.比如羅森伯格自尊量表中文版的條目8。在原量表中該條目被列為反向題,采用反向計分方式。中文版量表將其翻譯為“我希望我能為自己贏得更多尊重”,在語義上變成了正向表述項目,但使用時仍沿用反向計分方式(汪向東,王希林,馬弘,1999)。研究發(fā)現(xiàn),這樣的處理方法導(dǎo)致該條目鑒別度不強,量表的信度也隨之降低,因此一些研究者建議刪除該題目或者修改表述和計分方式(韓向前,江波,湯家彥,王益榮,2005;申繼亮,張金穎,佟雁,周麗清,2003;田錄梅,2006;王萍,高華,許家玉,黃金菊,王成江,1998)。申自力和蔡太生(2008)通過比較不同的表述方式發(fā)現(xiàn).該項目改為反向表述“我覺得我將來難以獲得更多的尊重”時,量表的內(nèi)部一致性信度更高,因此采用反向表述似乎更好。
在正向一反向表述中,還有一種較為特殊的類型:比較式表述。當(dāng)進行兩個事物的比較時,既可以采用正向比較(比如“A比B好”),也可以采用反向比較(“B比A差”),研究者將這兩種表述形式分別稱為“優(yōu)于”(more than)句式和“差于”(less than)句式(Bruekmtiller&Hoorens,2015)。在邏輯意義上,兩種句式是等價的,然而研究表明.人們對正向比較表述的同意程度和喜歡程度均高于反向比較表述,并且“優(yōu)于”句式(“多于”“好于”……)比“差于”句式(“少于”“弱于”……)更有說服力。
作為一種典型的措辭效應(yīng),正向一反向表述效應(yīng)具有一些較為明顯的特征。首先,它受到個體因素的影響,比如年齡、受教育程度、人格。大多數(shù)研究發(fā)現(xiàn)羅森伯格自尊量表的反向表述效應(yīng)更突出.但該量表用于老年人時正向、反向表述均存在方法效應(yīng)且正向表述的效應(yīng)更突出.研究者認(rèn)為這與被試的情緒和心境有關(guān),老年人特定的心態(tài)導(dǎo)致他們偏好積極回答(Carstensen&Mikels,2005;Lindwall et al,2012);受教育程度較高的被試更不容易受到不同項目表述的影響.因為認(rèn)知水平影響對措辭的理解能力,受教育程度較高的被試能夠辨別出正向表述和反向表述間細(xì)微的差異(Campostrini&Mcqueen,1993),理解兩種表述形式的語義等價性,因此不容易受措辭形式改變的影響;具有完美主義人格的被試在中文版生活定向測驗中反映出更明顯的項目表述效應(yīng)(顧紅磊,王才康,2012)。
其次,正向一反向表述效應(yīng)的大小與文化背景有關(guān)。由于不同文化中人們對項目表述的理解,尤其是反向表述的理解具有較大差異(Schmiu&Allik,2005),因此,不同文化的被試在同一量表特質(zhì)因子和方法因子上的得分不一致,并且正向表述和反向表述的效應(yīng)也存在差異(Lindwall etal,2012;Yang,Chen,Lo,&Turner,2012)。此外,文化差異可能作用于人格導(dǎo)致作答差異。在測量自尊時,東方文化下被試表現(xiàn)出保守傾向,使得他們?nèi)菀椎凸雷约旱谋憩F(xiàn),最終導(dǎo)致正向表述的項目出現(xiàn)措辭效應(yīng)(Farh&Cheng,1997)。
再次,項目的排列順序也可能影響項目表述效應(yīng)。有研究發(fā)現(xiàn),當(dāng)改變自尊量表中項目的順序時,項目表述效應(yīng)的強弱隨之改變(Urban etal,2014)。同時,項目表述效應(yīng)具有跨時間的穩(wěn)定性(Moil&DiStefano,2002;Urban et al,2014),因此一些學(xué)者認(rèn)為其反映的是人格特質(zhì)(DiStefano&Moil,2006;Lindwall et al,2012)。
2.2問題表述焦點效應(yīng)
在理解問題表述時.措辭中隱含的特定意義以及問題表述中涉及的關(guān)鍵詞語都可能成為焦點,影響被試對項目的反應(yīng)。
2.2.1引導(dǎo)性措辭
引導(dǎo)性措辭是指問題表述通過傳達隱含的假設(shè),引導(dǎo)回答者以特定的方式思考問題,從而給出研究者期望的答案(Lehman,Krosnick,West&Li,1992)。比如,“你在多大程度上認(rèn)為有關(guān)x的新聞報道含有對x的偏見?”中暗含了一個確定的判斷:新聞報道含有對x的偏見。這類措辭容易引起人們的默許反應(yīng)傾向和證實傾向.掩蓋其真實態(tài)度,做出社會大眾或研究者所贊許的行為。
2.2.2關(guān)鍵詞表述
問題表述中有一些較為關(guān)鍵的措辭.它們可能成為被試關(guān)注的焦點,從而影響反應(yīng)結(jié)果。這些措辭主要涉及專業(yè)術(shù)語、敏感話題、頻率詞、反應(yīng)內(nèi)容、行為主體等方面.有研究者曾總結(jié)了其中一些方面對量表產(chǎn)生的影響(Podsakoff.MacKenzie,Lee,&Podsakoff,2003)。
專業(yè)術(shù)語的指代含義十分明確,其熟悉度和理解難度對于不同群體差異較大。在日常使用中,人們還會對一些專業(yè)術(shù)語附加一定的褒貶意味.使得作答結(jié)果表現(xiàn)出更強的社會贊許性。研究者在調(diào)查臨床醫(yī)療中安慰劑的使用頻率時.采用了兩種問卷,一種直接使用專業(yè)術(shù)語“安慰劑”.一種將其隱晦地表述為“非特異性療法”,結(jié)果采用“安慰劑”表述的問卷上.醫(yī)生回答的使用頻率顯著低于另一種問卷(Tilburt.Emanuel,Kaptchuk.Curlin,&Miller,2008)。與之類似,量表中涉及敏感話題(比如“性觀念”)時,措辭的使用也非常關(guān)鍵。為了避免社會贊許性的影響.往往采用較間接的、隱晦的措辭。
人格和心理健康測量中經(jīng)常使用一些表示頻率的詞語,這些詞語的使用也可能影響被試的反應(yīng)。當(dāng)題目中包含極端的頻率詞(如“總是”“從不”)時,被試有更強烈的避免極端選項的傾向.導(dǎo)致在李克特量表上更容易選擇中點值(MePherson&Mohr,2005;Nye,Newman,&Joseph,2010)。
另外,量表的指導(dǎo)語或題干表述明確指出了被試需要做出何種反應(yīng),比如,是評價“喜歡程度”還是“同意程度”.前者側(cè)重情感,后者則含有較多的認(rèn)知成分,這類引導(dǎo)反應(yīng)內(nèi)容的措辭可能導(dǎo)致不同的結(jié)果。此外,問題表述中行為主體規(guī)定的是自己、特定他人還是一般人也將影響被試的反應(yīng)。當(dāng)涉及自我評價時.社會贊許效應(yīng)會更明顯,因此如果量表含有敏感話題.最好涉及“一般人”而非被試本人(辛自強,2012)。
2.3量尺選項的措辭效應(yīng)
量尺是否標(biāo)出所有選項、選項呈現(xiàn)的順序以及兩端選項的表述這三個特征是引起措辭效應(yīng)的主要因素。
2.3.1量尺選項的完整性
通常情況下,量尺要么標(biāo)明所有選項,要么只標(biāo)注兩端的選項。有研究對比了這兩種量尺的差異,但結(jié)論存在爭議。Christian(2007)發(fā)現(xiàn),在標(biāo)出所有選項時.被試更容易做出極端的積極回答,導(dǎo)致量表得分偏高;只標(biāo)出端點時,被試的回答可能比其真實態(tài)度消極。隨后又有研究發(fā)現(xiàn),兩種量尺得到的平均分并沒有顯著差異(deLeeuw,Hox,&Scherpenzeel,2011;Menold,Kaczmirek,Lenzner,&Neusar,2014),但是在deLeeuw等(2011)的研究中,標(biāo)出所有選項時選擇兩個極端選項的被試的比例顯著少于只標(biāo)注兩端選項的情況。
關(guān)于量尺選項的完整性與量表信效度的關(guān)系.研究結(jié)果也具有差異。一些研究發(fā)現(xiàn),標(biāo)出所有選項能提高評分者信度、重測信度、效度等指標(biāo)(Menold et a1.,2014;Weng,2004)。然而,也有研究者得到了相反的結(jié)果(如Andrews,1984)。值得注意的是.李克特量表所采用的計分量尺嚴(yán)格來講是一種順序量尺或等級量尺.只是在處理數(shù)據(jù)時通常將其視作等距量尺(辛自強,2012)。在量尺上標(biāo)出所有選項有利于被試?yán)斫?但文字表述間往往并不等距,易破壞量尺的等距性。
2.3.2量尺選項的順序效應(yīng)
選項的呈現(xiàn)順序可能影響被試的回答,產(chǎn)生首因效應(yīng)或近因效應(yīng)(Krosnick&A]win,1987)。研究表明,首因效應(yīng)和近因效應(yīng)的出現(xiàn)與作答形式有關(guān),量表以視覺形式呈現(xiàn)(如自陳式填答)時首因效應(yīng)更明顯,以聽覺呈現(xiàn)(如電話調(diào)查)時近因效應(yīng)更明顯(Christian,2007;Krosnick&Alwin,1987)。
量尺上選項的方向性在一定程度上也會影響測量結(jié)果。李克特量表通常采用水平方向呈現(xiàn)的量尺,左端為消極表述,右端為積極表述,比如“非常不同意——非常同意”,但也有反向呈現(xiàn)的量尺.即采用“非常同意——非常不同意”的形式(如Lindwall et al.,2012)。此外,也有一些研究采用垂直方向呈現(xiàn)的量尺(如Christian,2007)。從已有研究結(jié)果來看,選項的方向性對垂直量尺的影響似乎更大。Christian(2007)發(fā)現(xiàn),垂直量尺的頂端為消極表述時.評價結(jié)果略微積極,但在統(tǒng)計上沒有顯著差異。Hahne和Lenzner(2015)運用眼動技術(shù)探查選項順序效應(yīng)的本質(zhì).比較了方向性對水平量尺和垂直量尺的影響。其結(jié)果發(fā)現(xiàn).垂直量尺更容易受到選項方向的影響.導(dǎo)致兩種方向的量尺上作答結(jié)果出現(xiàn)更明顯的差異。該研究同時揭示了被試在水平量尺和垂直量尺選項上注視點數(shù)量和注視時間的差異.無論方向如何,水平量尺左右兩端獲得的注意較為平均.垂直量尺上總是頂端部分獲得的注意更多。
2.3.3量尺端點的文字表述
量尺選項的文字表述直接影響到被試對量尺的理解,措辭上的細(xì)微變化可能導(dǎo)致不同的反應(yīng)。其中,量尺端點的文字表述尤為重要。研究者發(fā)現(xiàn),量尺端點的文字表述可能通過激活與之對應(yīng)的概念影響被試在量尺上的回答(Gannon&0s—trom,1996)。量尺的端點值可以采用“非常不x”和“非常x”,也可以采用“非常Y”和“非常x”(x與Y意義相反)。在前一種表述中,量尺明確標(biāo)記的類別(x)被激活,另一個未被明確標(biāo)記的類別會被用來判斷量尺最左端的值(“非常不x”),在大多數(shù)情況下這個類別就是x的反面:而對于后一種.x和Y兩個類別都被激活.而且一個與之均不同的類別會被用以理解量尺中間點。
使用李克特五點量表時,備選答案的表述用詞采用“非極端表述方式”(“同意、比較同意、不確定、不太同意、不同意”)還是“極端表述方式”(“非常同意、同意、不確定、不同意、非常不同意”)可能影響被試的態(tài)度表達。研究者以大學(xué)生為被試,考察了這兩種表述方式對被試的選擇傾向是否存在影響。結(jié)果表明,大學(xué)生傾向于用非極端表述來表達態(tài)度,因而表現(xiàn)出對非極端表述量尺的偏好(李艷玲,2006)。
3.措辭效應(yīng):心理機制
3.1語義理解
對于正向一反向表述引起的項目表述效應(yīng),雖已有多年研究.但研究者的觀點不盡一致,因此在項目表述效應(yīng)的實質(zhì)上還未達成共識(Kam,2016)。盡管如此,項目表述效應(yīng)源于措辭,措辭本身的結(jié)構(gòu)特征以及由此傳達的語義在一定程度上有助于理解該效應(yīng)。
Wason(1960)的研究表明,當(dāng)改變對某一規(guī)則的語言描述時,被試會認(rèn)為規(guī)則本身也發(fā)生了改變。由此看來,當(dāng)某一項目由正向表述改為反向表述,或由反向表述改為正向表述時,其意義在一定程度上已經(jīng)出現(xiàn)了差異。正反表述引起的結(jié)果差異可能正是由于正反表述背后的概念不同(campostrini&Mcqueen,1993)。在兼有正向和反向表述的量表中.反向表述效應(yīng)更為普遍,這是因為理解否定陳述更具復(fù)雜性,等價的否定陳述與肯定陳述的信息處理方式不一致(Mayo,Schul,&Burnstein,2004)。比如在理解反向表述“我不是有罪的”時(對應(yīng)的正向表述為“我是無辜的”),Mayo等(2004)發(fā)現(xiàn),人們不是簡單地通過“有罪的”或“無辜的”來進行理解,說明“有罪的”與“無辜的”不僅意義相反,且是兩個不同的概念體系。由于語義理解很大程度上取決于個體的語言能力,因此有研究者認(rèn)為,正反表述的反應(yīng)偏差與被試的語言能力有關(guān)(Marsh,1986)。
語義理解的差異也為關(guān)鍵詞表述引起的措辭效應(yīng)提供了可能的解釋。Manstead和Parker(1995)發(fā)現(xiàn),在評價某一事物時,詢問“是否喜歡”和“優(yōu)勢劣勢”將分別激活態(tài)度的不同方面.導(dǎo)致評價結(jié)果不同。“是否喜歡”的表述激活情感性信念,誘發(fā)諸如興奮、緊張、害怕等情緒,被試將基于情緒體驗來進行評價;“優(yōu)勢劣勢”的表述激活工具性信念,使被試更多地考慮客觀實際的后果.基于行為的具體結(jié)果進行評價。
語義理解受到文化差異和日常使用習(xí)慣這兩個因素的影響,這兩個重要因素有助于進一步解釋措辭效應(yīng)。Schmitt和AHik(2005)采用羅森伯格自尊量表在53個國家開展大規(guī)模調(diào)查,發(fā)現(xiàn)反向表述效應(yīng)在不同國家樣本中的強弱程度有差異。他們認(rèn)為,這是因為反向表述的理解更加復(fù)雜,在不同文化中更容易產(chǎn)生差異,這或許也是反向表述效應(yīng)更為普遍的原因之一。有關(guān)羅森伯格量表的諸多研究證據(jù)啟示研究者,在翻譯、修訂量表時.需要格外注意文化差異導(dǎo)致的語義理解上的分歧。以學(xué)習(xí)動機量表為例,研究者發(fā)現(xiàn),中文版量表中的一些項目與其在原量表中所隸屬的內(nèi)生和外生動機取向不同(池麗萍,辛自強,2006)。比如,“我想要知道自己究竟能在學(xué)業(yè)上做得多出色”在原量表中是內(nèi)生動機的組成項目,中國被試卻因“出色”是與他人比較得出的結(jié)果而將其視為外生動機的內(nèi)容。
語義理解受到日常使用習(xí)慣的影響,語言習(xí)慣導(dǎo)致人們對一些特定的表達方式具有獨特的理解。比如,對于兩個極端的類型,如好-壞、高-矮等.人們習(xí)慣于使用“好”“高”一端,這一端往往涵蓋了正向、反向的所有類型,而相反的一端只包含了其本身指代的類型。比如,當(dāng)人們問“這個人有多讓人討厭”時,意味著這個人是讓人討厭的(只是在問討厭的程度),而在問“這個人有多讓人喜歡”時就沒有這樣的預(yù)設(shè)(Bruckmtiller,&Hoorens,2015)。
3.2認(rèn)知加工特征
3.2.1決策判斷中的偏見
“假設(shè)證實策略”(hypothesis—confirmation strategy)可以解釋引導(dǎo)性措辭的影響。當(dāng)問題表述中隱含的假設(shè)被個體知覺時,人們傾向于證真而非證偽,因此會無意識地搜集與之符合的證據(jù),并選擇性地忽略反面證據(jù)(Skov&Sherman,1986)。決策與判斷領(lǐng)域的研究將這種現(xiàn)象稱為“判斷焦點效應(yīng)”(Lehman et al,1992),認(rèn)為人們普遍存在內(nèi)隱的、支持題干表述焦點的傾向。這一效應(yīng)還受到被試作答動機的影響,比如,利己性動機可能導(dǎo)致不同程度的措辭效應(yīng)。因此,在涉及個人特質(zhì)時,問題表述對個人特質(zhì)越有利,被試越容易贊同(Sakshaug&Kreuter,2014;Sears,1983)。此外,當(dāng)量表不僅僅是自我評價,還關(guān)系到自我在他人面前的表現(xiàn)時,措辭效應(yīng)更為明顯(Farh&Cheng,1997)。
3.2.2認(rèn)知比較
一些項目表述含有對兩個事物的比較,社會知覺領(lǐng)域的研究發(fā)現(xiàn),人們在對兩個事物進行比較和判斷時,通常習(xí)慣把一方作為基準(zhǔn),通常是地位更高或占據(jù)多數(shù)的一方:而對于兩個社會地位一致的群體,當(dāng)把其中一個作為比較的基準(zhǔn)時,該群體會被認(rèn)為具有更高的地位和權(quán)力(Bruckmtiller&Abele,2010)。比如,“男性跟女性有什么不同”和“女性跟男性有什么不同”兩個問題得到的答案可能有一定區(qū)別。并且,當(dāng)人們?nèi)狈﹃P(guān)于這兩個群體的地位的知識時.這種現(xiàn)象更明顯(Bruckmtiller,Hegarty,&Abele,2012)?;谶@一機制,在比較句式中將哪一方作為基準(zhǔn)尤其重要,這將影響人們對兩個事物相對特性的期望。
在具體表述時.人們更偏好正向比較句式(“A比B好”)而不是反向比較句式(“B比A差”),這是因為“多于”“好于”等句式更符合日常的語言使用習(xí)慣,具有更高的認(rèn)知流暢性(Bruckmtiller&Hoorens,2015)。
3.2.3認(rèn)知資源分配
量尺選項引起的措辭效應(yīng)源于認(rèn)知資源的有限性,這種有限性使得個體在不同選項上分配的認(rèn)知資源不均衡(HoShne&Lenzner,2015;Krosnick&Alwin,1987;Tourangeau&Rasinski,1988)。
標(biāo)出量尺的所有選項與僅標(biāo)注兩端兩種條件下,被試對量尺的認(rèn)知加工存在差異。在前一種條件下.被試要閱讀、加工并理解所有選項(Christian,2007),因此各選項得到的注意程度及被選擇的可能性更為平均,這似乎能解釋deLeeuw等(2011)研究中標(biāo)出所有選項時極端回答更少的現(xiàn)象。
量尺選項的首因效應(yīng)和近因效應(yīng)更突出體現(xiàn)了各個選項上認(rèn)知資源分配的不均衡性,這兩種效應(yīng)的強弱受到作答形式的影響,不同作答形式導(dǎo)致對選項的加工深度不同.加工越深的選項越容易被選擇(Krosnick&Alwin,1987;Christian,2007)。當(dāng)量表以視覺形式呈現(xiàn)時(比如自陳式填答),第一個選項往往能獲得更深層的認(rèn)知加工.容易出現(xiàn)首因效應(yīng);當(dāng)量表以聽覺形式呈現(xiàn)時(比如電話調(diào)查),第一個選項還沒來得及加工,第二個選項又會呈現(xiàn).因此最后一個選項往往能獲得更深層的加工,出現(xiàn)近因效應(yīng)。
4.措辭效應(yīng):控制方法
措辭效應(yīng)并非不可避免,研究者可以從兩個層面盡可能地減少甚至消除措辭效應(yīng)的影響:(1)程序控制,編制量表時適當(dāng)轉(zhuǎn)換項目表述方式和量表形式等;(2)統(tǒng)計控制,在事后統(tǒng)計分析時通過比較不同模型的擬合度,辨析措辭效應(yīng)是否存在并予以分離。
4.1程序控制減少措辭效應(yīng)
方法一,舍棄反向表述項目。反向表述引起的措辭效應(yīng)更為普遍.因此.一些研究者認(rèn)為避免措辭效應(yīng)最為簡便的方法就是只采用正向題(Lindwall et al,2012)。但這樣容易導(dǎo)致被試在各個項目的反應(yīng)趨同,帶來共同方法偏差.所以遭到大多數(shù)研究者的反對。較早之前有研究者提出仍然保留反向題,將其作為填充題或測謊題,但計算總分的時候只使用正向題(Marsh,1996)。這種方法可能有效,但也帶來了新的問題。由于一些正向題和反向題屬于同一個維度,但內(nèi)容不同,如果忽略反向題的得分,就必須增加與之對應(yīng)的、等價的正向題,這就會使得量表項目的數(shù)量增加。
方法二,將單極表述項目改為雙極表述項目。主要做法是將正向或反向單極表述的項目轉(zhuǎn)化為由一對反義詞或一對意義相反的表述構(gòu)成的雙極表述項目(Schweizer,Rauch,&Gold,2011;Schweizer&Schreiner,2010)。在具體操作時,需要找到表述方向相反的一對項目,明確它們表述的核心概念,再定義量尺的兩端。比如可以將評價符合程度的兩個項目“大多數(shù)時候我都很開心”和“大多數(shù)時候我總是悶悶不樂”轉(zhuǎn)化為“大多數(shù)時候我的情緒狀態(tài)”.并采用“十分沮喪——十分開心”作為量尺。
該方法具有三個較為明顯的優(yōu)勢。其一,轉(zhuǎn)化后的項目能對所屬維度做出更準(zhǔn)確的描述(單極項目只能描述該維度的一個方向).從而使分量表之間,以及分量表與總量表的相關(guān)性顯著提高。其二,雙極表述項目較為中性,能有效減少偏見,避免被試對項目產(chǎn)生獨特性的理解(Goldberg,1992)。Schweizer和Schreiner(2010)認(rèn)為,雙極量表同時刺激了正向和反向作答的傾向,能平衡不恰當(dāng)?shù)姆磻?yīng)傾向.排除情感因素的影響.更具有客觀性。其三,這樣的轉(zhuǎn)化還能減少量表中的項目數(shù)量。
方法三,改變量表形式。一些研究者建議用“特殊構(gòu)念量表”(construct-specific scale)代替詢問同意程度的李克特量表(Saris.Revilla,Krosnick,&Shaeffer,2010)。常用的李克特量表都是采用類似“你在多大程度上贊同‘陌生人是可信的?”的題目.相應(yīng)的文字量尺為“非常不同意——非常同意”。事實上,可以將題目表述轉(zhuǎn)化為“陌生人多大程度上可信?”,量尺采用“非常不可信——非??尚拧薄_@兩種量表形式都是在測量“陌生人的可信程度”.區(qū)別在于“特殊構(gòu)念量表”在項目和選項中直接使用了測量的目標(biāo)概念。Christian(2007)比較了兩種量表形式,發(fā)現(xiàn)被試在詢問同意程度的李克特量表中往往避免選擇“強烈贊同”等極端選項.有較明顯的趨中作答傾向,而在“特殊構(gòu)念量表”中.被試在各個反應(yīng)選項上的選擇較為平均。Saris等(2010)認(rèn)為,“特殊構(gòu)念量表”能使被試在作答時只需要考慮一個維度,即量表測量的維度,而不需要同時考慮量表測量的維度以及“是否同意”這一反應(yīng)維度,能有效減少測量誤差。
此外.在量表形式上,可以用語義分化量表代替李克特量表。有研究分析了不同文化下的極端作答傾向,比較了兩種類型的量表——李克特量表和語義分化量表.發(fā)現(xiàn)李克特量表更容易引起極端作答。研究者認(rèn)為這是因為它太簡單,被試作答時卷入度較低(Rocereto.Puzakova,An—demon,&Kwak,2011)。
方法四,在題目表述和選項設(shè)置的其他細(xì)節(jié)上盡量避免措辭效應(yīng)。首先,對于反向表述項目,語義要盡可能地明確,讓被試?yán)斫獯痤}要求:同時,注意避免雙重反向表述,因為與反向表述相比,雙重反向表述有更強的方法效應(yīng)(Wang.Chen,&Jin,2014)。其次,在翻譯量表的過程中.為保證量表所測項目的有效性,可以根據(jù)量表編制者的理論意圖和概念界定對一些容易產(chǎn)生歧義或者不符合語言習(xí)慣和文化背景的項目進行修正(池麗萍,辛自強,2006)。此外,注意控制項目表述的難度,避免多重語義。比如,研究者發(fā)現(xiàn).將詢問同類行為發(fā)生頻率的問題拆分成若干個只針對某一具體行為的問題后,被試回答出現(xiàn)這些行為的概率更高——因為把所有行為放在一道問題中時.被試無法詳盡考慮所有問題(Brener,Grunbaum,Kann,Mcmanus,&Ross,2004)。
4.2統(tǒng)計控制分離措辭效應(yīng)
在編制量表的過程中.應(yīng)首先考慮程序控制手段,這樣才能從源頭上避免措辭效應(yīng)。但是,由于難以窮盡量表措辭的所有細(xì)節(jié),一些措辭的微弱差異也很難探查到,因此研究者試圖用統(tǒng)計的方法驗證措辭效應(yīng)是否存在,并通過特殊的統(tǒng)計方法將其分離出來。
在包含正向和反向表述項目的人格量表中.若要探明人格結(jié)構(gòu)的實質(zhì),分離措辭效應(yīng)尤其重要。目前,分離措辭效應(yīng)的統(tǒng)計方法在有關(guān)正向、反向項目表述效應(yīng)的研究領(lǐng)域已十分成熟,其基本思路是,運用驗證性因素分析的方法.建立包含項目表述效應(yīng)在內(nèi)的多個模型,比較模型的擬合度,探查效應(yīng)存在與否并進一步分析計算。
研究者基于多元特質(zhì)-多重方法(multitraitmultimethod)的概念框架.先后發(fā)展了相關(guān)特質(zhì)相關(guān)方法(Correlated-Trait Correlated-Method,CTCM)和相關(guān)特質(zhì)相關(guān)特性(Correlated-Trait Correlated-Uniqueness,CTCU)兩類模型。兩類模型的原理具有差異:CTCM模型把項目表述效應(yīng)當(dāng)作一種穩(wěn)定特質(zhì),通過構(gòu)建獨特的潛變量方法因子,將項目表述效應(yīng)從特質(zhì)效應(yīng)和誤差效應(yīng)中分離出來.并得到估計:CTCU模型則把項目表述效應(yīng)當(dāng)作影響因子結(jié)構(gòu)的噪音,通過限制所有的正向題或反向題的測量誤差相關(guān).將項目表述效應(yīng)分離,但不能對其單獨估計(Bagozzi,1993;Lindwall etal,2012;Podsakoff et al,2003;Quihy,Oakman,&Risko,2006;Tomds&Oliver,1999)。相比之下.CTCM模型的一大優(yōu)勢在于包含了獨立的方法效應(yīng)因子,使得方法效應(yīng)能用其他變量量化和預(yù)測(Lindwall et al,2012)。除此之外,兩種模型各有優(yōu)劣.研究者對于采用哪種模型存在較大爭議,有研究者對此進行了總結(jié),并通過數(shù)據(jù)模擬加以比較,建議優(yōu)先采用CTCM模型(Conway,Lievens,Seullen,&Lance,2004)。
以Pratto等(1994)編制的社會支配傾向量表(social dominance orientation scale)為例,Xin和Chi(2010)基于CTCM和CTCU的方法明確了量表的結(jié)構(gòu)。社會支配傾向量表由16個條目構(gòu)成,正向表述項目和反向表述項目各8個.采用7級評分(1為“非常不同意”,7為“非常同意”),在數(shù)據(jù)分析時對反向表述項目進行反向計分處理。原量表被認(rèn)為是單維結(jié)構(gòu),只包含社會支配傾向特質(zhì)(SDO)一個因子(Pratto et al,1994)。另有研究者發(fā)現(xiàn)該量表可能包含2個甚至3個因子。為了探明該量表的結(jié)構(gòu),Xin和Chi(2010)依據(jù)CTCM和CTCU的方法構(gòu)建了多個可能的模型,如圖1所示。
在圖1中.1A是一個單維結(jié)構(gòu)模型,所有項目均負(fù)荷在SDO一個因子上.是原量表的理論模型;1B為兩因素結(jié)構(gòu),正向和反向表述項目各自負(fù)荷在一個因子上:1C和1D為相關(guān)特質(zhì)相關(guān)方法模型(cTCM),認(rèn)為量表不僅包含SDO因子,還存在一個與SDO因子不相關(guān)的反向表述因子(1C)或正向表述因子(1D);1E和1F為相關(guān)特質(zhì)相關(guān)特性模型(CTCU),認(rèn)為在SDO因子的基礎(chǔ)上.存在反向題的測量誤差相關(guān)(1E)或者存在正向題的測量誤差相關(guān)(1F)。
采用驗證性因素分析的方法檢驗這6個模型的擬合度.可以得到它們各自的擬合度指標(biāo)和因素載荷。普遍來說,當(dāng)X2/df小于5(接近或小于3更好).CFI和NNFI大于0.90(接近或大于0.95更好).RMSEA和SRMR小于0.08的時候.模型可接受。研究結(jié)果表明,單維結(jié)構(gòu)的模型,即1A不可接受。也就是說,量表不只包含一個因子。比較這6個模型發(fā)現(xiàn),模型1E具有更好的擬合度。這說明社會支配傾向量表不僅包含SDO特質(zhì)因子,還包含由反向表述項目引起的方法因子。
如何證明反向表述項目的因子是方法效應(yīng)而不是穩(wěn)定特質(zhì)呢?研究者以“群際信任”(group trust)為效標(biāo).檢驗了特質(zhì)因子和方法因子與效標(biāo)因子的關(guān)聯(lián)度。理論上.特質(zhì)因子為測量的目標(biāo)特質(zhì),其與效標(biāo)因子的相關(guān)性應(yīng)達到顯著水平;方法因子為系統(tǒng)誤差.與效標(biāo)因子則應(yīng)當(dāng)沒有關(guān)系。由于模型1E中方法因子不是獨立的,無法計算效標(biāo)關(guān)聯(lián)度.研究者以1c為基礎(chǔ),加入效標(biāo)因子并構(gòu)建了模型2,見圖2。
同樣地.采用驗證性因素分析的方法檢驗?zāi)P?的擬合度。結(jié)果表明,模型2具有很好的擬合度。值得注意的是,社會支配傾向因子到群際信任的路徑是顯著的,反向表述效應(yīng)到群際信任的路徑則不顯著。也就是說,只有社會支配傾向因子是量表測量的目標(biāo)特質(zhì),它能有效預(yù)測群際信任水平,反向表述效應(yīng)因子僅僅是方法因子。
由此可見,對于可能含有措辭效應(yīng)的量表,可以依據(jù)CTCM和CTCU方法建構(gòu)模型,比較模型擬合度,探明量表的實際結(jié)構(gòu);結(jié)合效標(biāo)關(guān)聯(lián)程度,進一步確認(rèn)該量表中的措辭效應(yīng)是方法效應(yīng)還是穩(wěn)定特質(zhì);通過文化背景差異的比較,還可以探究量表結(jié)構(gòu)在不同文化中的穩(wěn)定性。
但是.有研究者認(rèn)為,CTCU和CTCM模型過于強調(diào)特質(zhì)效應(yīng)與項目表述效應(yīng)的差異,忽略了二者的關(guān)系.因此建議采用“雙因子模型”(bifactor model)(顧紅磊,溫忠麟,方杰,2014)。雙因子模型是一種特殊的多維因子模型,該模型中同時包含了測量所有題目共同性的全局因子和測量部分題目共同性的局部因子(顧紅磊,溫忠麟,2014)。在該模型中,全局因子是測量的目標(biāo)特質(zhì).局部因子則反映了正向表述或反向表述的效應(yīng)(顧紅磊,溫忠麟,2014;Rios&Wells,2014)。通過這樣的方式,量表項目的變異分解成全局因子、局部因子變異和誤差變異,就可以計算局部因子在共同因子中所占的比例,得到測驗的同質(zhì)性系數(shù).從而評價項目表述效應(yīng)對測驗單維性的影響程度(顧紅磊,等,2014)。
近年來國內(nèi)外一些文獻系統(tǒng)介紹了CTCM、CTCU模型法(顧紅磊,王才康,2012;熊紅星,張璟,葉寶娟,鄭雪,孫配貞,2012;周浩,龍立榮,2004)以及雙因子模型法(顧紅磊,溫忠麟,2014;顧紅磊,等,2014;Rios&Wells,2014)的原理和應(yīng)用,本文不再贅述。
5.研究展望
措辭效應(yīng)在不同的量表中普遍存在,它使得測量結(jié)果中摻雜了新的誤差變異,增加了測量結(jié)果產(chǎn)生偏差的可能性。在采用測量法的研究中,措辭效應(yīng)需引起高度重視。目前,與措辭效應(yīng)相關(guān)的研究較多,但研究主題側(cè)重正向一反向項目表述效應(yīng),各類措辭效應(yīng)的實質(zhì)和特性有待深入探究。
其一,探明措辭效應(yīng)的影響因素及因素間的相互作用。一些因素對措辭效應(yīng)的影響已經(jīng)得到了驗證,但已有研究對一些因素的作用存在爭議,且不同因素間是否存在相互作用尚不明確。未來還需進一步探究各種可能的影響因素,并關(guān)注它們與一些重要的心理變量是否存在交互作用,這樣才能更好地在量表編制、研究設(shè)計的程序上對措辭效應(yīng)加以控制。
其二,考察不同文化背景下一些常用量表是否存在措辭效應(yīng)及其具體表現(xiàn)。不同文化下語言的形式和語義理解存在較大差異,這可能是措辭效應(yīng)的重要來源。羅森伯格自尊量表中措辭效應(yīng)的研究發(fā)現(xiàn)對其他量表具有重要的借鑒意義.一些常用量表還需置于不同文化中考察是否存在措辭效應(yīng),以解釋不同文化下的測量結(jié)果,并促進完善量表。
其三,借鑒語言學(xué)的視角深入探究措辭效應(yīng)的本質(zhì)。措辭效應(yīng)源于語言形式,語言學(xué)的已有研究成果或許有助于解釋措辭效應(yīng)的本源.繼而指導(dǎo)量表編制中的措辭使用。在未來研究中.從語言學(xué)和測量學(xué)的雙重視角探究措辭效應(yīng)的實質(zhì)不失為一條好的研究路徑。