胡嘯
摘 要 信號(hào)檢測(cè)論被廣泛用于解釋個(gè)體在不同類型認(rèn)知任務(wù)中的決策過(guò)程。然而,經(jīng)典信號(hào)檢測(cè)論的重要不足之處在于難以進(jìn)一步解釋個(gè)體設(shè)置報(bào)告標(biāo)準(zhǔn)的過(guò)程對(duì)應(yīng)怎樣的內(nèi)在心理機(jī)制。本文從貝葉斯決策理論的視角出發(fā),深入探討個(gè)體在信號(hào)檢測(cè)任務(wù)中的決策規(guī)則。首先基于貝葉斯定理介紹貝葉斯決策理論的基本觀點(diǎn)。隨后探討貝葉斯決策理論如何解釋理想觀察者的決策規(guī)則,以及在實(shí)際的信號(hào)檢測(cè)任務(wù)中個(gè)體的決策結(jié)果與理想觀察者之間的偏離。其次探討經(jīng)典信號(hào)檢測(cè)論和貝葉斯決策理論在不等方差信號(hào)檢測(cè)模型中的差異。最后簡(jiǎn)要介紹支持貝葉斯決策理論的實(shí)證研究證據(jù)。
關(guān)鍵詞 信號(hào)檢測(cè)論;貝葉斯決策理論;先驗(yàn)概率;似然函數(shù);報(bào)告標(biāo)準(zhǔn)
分類號(hào) B841
DOI:10.16842/j.cnki.issn2095-5588.2023.09.003
1 引言
信號(hào)檢測(cè)論(signal detection theory, SDT)是實(shí)驗(yàn)心理學(xué)研究中應(yīng)用最為廣泛的計(jì)算模型之一。自從心理學(xué)家John A. Swets及其合作者首次將信號(hào)檢測(cè)論系統(tǒng)性地引入心理學(xué)領(lǐng)域以來(lái)(Green & Swets, 1966; Tanner & Swets, 1954),研究者們已經(jīng)廣泛地應(yīng)用信號(hào)檢測(cè)論模型來(lái)解釋知覺(jué)、記憶、推理等不同心理過(guò)程的內(nèi)在機(jī)制(Banks, 1970; Mamassian, 2016; Wixted, 2020)。在心理學(xué)論文數(shù)據(jù)庫(kù)PsycArticles和PsycInfo中,以“signal detection theory”為關(guān)鍵詞可以檢索出超過(guò)4000篇文獻(xiàn),且在2020至2022這三年間發(fā)表的文獻(xiàn)就達(dá)到了500篇,足以證明信號(hào)檢測(cè)論不僅在心理學(xué)研究的歷史上占有重要地位,而且在今天仍然具有旺盛的生命力。
在基于信號(hào)檢測(cè)論的心理學(xué)實(shí)驗(yàn)設(shè)計(jì)中,研究者會(huì)向被試呈現(xiàn)兩類不同的刺激,其中一類刺激被稱為“信號(hào)”(signal),而另一類刺激被稱為“噪音”(noise)。被試的任務(wù)是判斷哪些刺激屬于信號(hào),哪些刺激屬于噪音(Wickens, 2001)。比如,在一個(gè)聽(tīng)覺(jué)任務(wù)中,被試聽(tīng)到的刺激可能只包含白噪音,也可能在白噪音的基礎(chǔ)上疊加了一個(gè)特定聲調(diào)的聲音作為信號(hào);被試需要判斷信號(hào)在哪些試次(trial)當(dāng)中出現(xiàn)(Egan et al., 1959)。又如,在再認(rèn)記憶任務(wù)中,被試需要首先學(xué)習(xí)并記憶一系列詞語(yǔ),隨后研究者會(huì)向被試呈現(xiàn)一些學(xué)過(guò)的“舊詞”作為信號(hào),和一些沒(méi)學(xué)過(guò)的“新詞”作為噪音,被試需要判斷每個(gè)詞語(yǔ)是新詞還是舊詞(Mickes et al., 2007; Wixted, 2007)。通常情況下,信號(hào)檢測(cè)論會(huì)假設(shè)信號(hào)和噪音的刺激強(qiáng)度分別符合一個(gè)正態(tài)分布,且信號(hào)分布的均值高于噪音分布;信號(hào)分布和噪音分布均值之差被稱為辨別力指數(shù)(d'),它反映了個(gè)體辨別信號(hào)和噪音的能力,d'越高則個(gè)體的辨別力越強(qiáng)(Wickens, 2001)。
信號(hào)檢測(cè)論關(guān)注的一個(gè)重要問(wèn)題是,個(gè)體如何決策哪些刺激屬于信號(hào),哪些刺激屬于噪音。經(jīng)典的信號(hào)檢測(cè)論觀點(diǎn)認(rèn)為,個(gè)體會(huì)直接在刺激強(qiáng)度的數(shù)軸上設(shè)置報(bào)告標(biāo)準(zhǔn)C,如果當(dāng)前刺激的強(qiáng)度高于C,則個(gè)體判斷當(dāng)前刺激為信號(hào),反之判斷為噪音(Wixted, 2020)。圖1給出了信號(hào)檢測(cè)論模型的一個(gè)示例。該模型中噪音分布的均值為0,信號(hào)分布的均值為d', 兩個(gè)分布的標(biāo)準(zhǔn)差均為1;當(dāng)某個(gè)刺激的強(qiáng)度高于C時(shí),個(gè)體會(huì)將其判斷為信號(hào),反之則判斷為噪音。在信號(hào)檢測(cè)任務(wù)中,個(gè)體的作答結(jié)果可以被分為四種類型:擊中(將信號(hào)刺激判斷為信號(hào))、虛報(bào)(將噪音刺激判斷為信號(hào))、漏報(bào)(將信號(hào)刺激判斷為噪音)和正確拒絕(將噪音刺激判斷為噪音)(Wickens, 2001)。四類作答結(jié)果出現(xiàn)的概率由代表信號(hào)或噪音的正態(tài)分布在C的左側(cè)或右側(cè)的面積大小來(lái)表示(見(jiàn)圖1)。
信號(hào)檢測(cè)論的優(yōu)點(diǎn)在于,它可以從個(gè)體的作答正確率數(shù)據(jù)中,分離出辨別力指數(shù)d'和報(bào)告標(biāo)準(zhǔn)C這兩個(gè)指標(biāo),使得研究者可以分別探討任務(wù)難度(即d’)和個(gè)體的反應(yīng)偏向(即C)如何影響個(gè)體最終的作答結(jié)果(Wickens, 2001)。然而,經(jīng)典信號(hào)檢測(cè)論框架(即直接使用C來(lái)反映個(gè)體的決策判斷標(biāo)準(zhǔn)的信號(hào)檢測(cè)論模型)也存在一個(gè)重要的不足之處:它難以深入解釋個(gè)體在信號(hào)檢測(cè)任務(wù)中完成決策的過(guò)程對(duì)應(yīng)怎樣的內(nèi)在心理機(jī)制。雖然經(jīng)典信號(hào)檢測(cè)論簡(jiǎn)單地假設(shè)個(gè)體會(huì)直接將當(dāng)前刺激的強(qiáng)度與一個(gè)特定的判斷標(biāo)準(zhǔn)C在數(shù)軸上的位置進(jìn)行比較,并基于比較的結(jié)果來(lái)完成決策,但它通常難以進(jìn)一步解釋個(gè)體為何會(huì)把報(bào)告標(biāo)準(zhǔn)C設(shè)置在數(shù)軸上的特定位置,以及對(duì)于不同個(gè)體而言或在不同實(shí)驗(yàn)條件下C的位置產(chǎn)生差異的內(nèi)在原因(Glanzer et al., 2009, 2019)。
事實(shí)上,早在信號(hào)檢測(cè)論提出之初,Swets及其合作者就開(kāi)始使用貝葉斯決策理論(Bayesian decision theory, BDT)的觀點(diǎn)來(lái)解釋個(gè)體在信號(hào)檢測(cè)任務(wù)中的決策過(guò)程(Green & Swets, 1966)。近年來(lái),貝葉斯決策理論與信號(hào)檢測(cè)論之間的關(guān)系開(kāi)始受到越來(lái)越多研究者的重視(Fleming & Daw, 2017; Glanzer et al., 2019; Maloney & Zhang, 2010)。貝葉斯決策理論認(rèn)為個(gè)體會(huì)基于觀測(cè)到的當(dāng)前刺激強(qiáng)度,通過(guò)一個(gè)貝葉斯推理過(guò)程來(lái)決策當(dāng)前刺激是信號(hào)還是噪音(Fleming & Daw, 2017; Maloney & Zhang, 2010; Pouget et al., 2016)。和經(jīng)典信號(hào)檢測(cè)論相比,貝葉斯決策理論為個(gè)體如何在信號(hào)檢測(cè)任務(wù)中完成決策過(guò)程給出了更加深入的理論解釋(Glanzer et al., 2019; Lau, 2007)。
本文將從貝葉斯決策理論的視角,深入探討信號(hào)檢測(cè)論框架下個(gè)體的決策規(guī)則。本文將首先介紹貝葉斯決策理論的基本觀點(diǎn),即個(gè)體在信號(hào)檢測(cè)任務(wù)中如何通過(guò)一個(gè)貝葉斯推理過(guò)程完成決策。隨后,本文將闡述信號(hào)檢測(cè)論當(dāng)中的“理想觀察者”問(wèn)題,并在等方差信號(hào)檢測(cè)模型的框架下,介紹貝葉斯決策理論如何解釋實(shí)際研究中的被試與理想觀察者之間的偏離。接下來(lái),本文將討論不等方差的信號(hào)檢測(cè)模型,并闡述貝葉斯決策理論與經(jīng)典信號(hào)檢測(cè)論在該模型中存在的差異。最后,本文將介紹支持貝葉斯決策理論的實(shí)證研究證據(jù)。
2 貝葉斯決策理論
貝葉斯決策理論的基礎(chǔ)是貝葉斯定理,它來(lái)源于對(duì)聯(lián)合概率的計(jì)算公式(胡傳鵬等, 2018)。假設(shè)有兩個(gè)事件——A和B,則A和B同時(shí)發(fā)生的概率被稱為聯(lián)合概率,記為P (A,B)。聯(lián)合概率的計(jì)算公式可以被寫(xiě)為如下形式:
? ? ? ? ?P(A,B)=P(B|A)P(A) (1)
公式(1)的含義為:A和B同時(shí)發(fā)生的概率,等于A發(fā)生的概率P(A)乘以在A發(fā)生的條件下B發(fā)生的概率P(B|A)。其中,P(A)又被稱為邊緣概率,它指的是在不考慮其他事件的發(fā)生結(jié)果的情況下,某一事件發(fā)生的概率;而P(B|A)又被稱為條件概率,它指的是在確定某一個(gè)事件(如A)已經(jīng)發(fā)生的條件下,另一個(gè)事件(如B)發(fā)生的概率。實(shí)際上,A和B同時(shí)發(fā)生的聯(lián)合概率,還可以被寫(xiě)為另一種形式,即等于B發(fā)生的邊緣概率P(B)乘以在B發(fā)生的條件下A發(fā)生的條件概率P(A|B):
? ? ? ? ? P(A,B)=P(A|B)P(B) ? ?(2)
基于以上的公式(1)和(2),可以得出如下的公式(3):
? ?P(A|B)P(B)=P(B|A)P(A) (3)
公式(3)通常會(huì)被寫(xiě)為如下的形式:
公式(4)即為貝葉斯定理的一般形式。貝葉斯定理的提出起初只是為了刻畫(huà)兩個(gè)事件的邊緣概率和條件概率之間滿足的數(shù)學(xué)關(guān)系。然而,心理學(xué)家很快意識(shí)到,貝葉斯定理可以被用來(lái)刻畫(huà)人類的推理與決策過(guò)程(Kersten et al., 2004; Lau, 2007; Wickens, 2001)。比如,公式(4)可以用來(lái)解釋個(gè)體如何通過(guò)對(duì)事件B進(jìn)行觀測(cè),來(lái)推理事件A的發(fā)生概率。此時(shí),公式(4)中的P (A)被稱為先驗(yàn)概率,它指的是在觀測(cè)到事件B之前,個(gè)體對(duì)于事件A發(fā)生概率的先驗(yàn)認(rèn)識(shí)。P(A|B)被稱為后驗(yàn)概率,它反映了個(gè)體在觀測(cè)到事件B的發(fā)生結(jié)果之后對(duì)事件A發(fā)生概率的認(rèn)識(shí)。個(gè)體在貝葉斯推理過(guò)程中,會(huì)根據(jù)對(duì)事件B的觀測(cè)結(jié)果來(lái)更新自身對(duì)事件A發(fā)生概率的認(rèn)識(shí),即從P(A)更新為P(A|B)。另一方面,P (B | A)被稱為似然函數(shù),它反映了在給定事件A的情況下,事件B發(fā)生的可能性。在個(gè)體對(duì)事件A發(fā)生概率進(jìn)行更新的過(guò)程中,先驗(yàn)概率和似然函數(shù)都起到了重要的作用:一方面,當(dāng)A發(fā)生的先驗(yàn)概率值越高時(shí),其后驗(yàn)概率值也會(huì)越高;另一方面,在假定事件A發(fā)生的情況下,如果事件B發(fā)生的概率越高(即似然函數(shù)值越大),則個(gè)體在觀測(cè)到事件B之后也會(huì)認(rèn)為事件A成立的后驗(yàn)概率越高。
根據(jù)貝葉斯決策理論的觀點(diǎn),在信號(hào)檢測(cè)任務(wù)中,個(gè)體會(huì)觀測(cè)到每個(gè)刺激的強(qiáng)度(記為x),并基于x的值來(lái)完成一個(gè)貝葉斯推理過(guò)程,以推理當(dāng)前刺激屬于信號(hào)或噪音的后驗(yàn)概率(Burgess, 1985; Fleming & Daw, 2017; Wickens, 2001)。下面的公式給出了個(gè)體如何基于刺激強(qiáng)度x對(duì)當(dāng)前刺激屬于信號(hào)(記為S)的概率進(jìn)行更新:
公式(5)意味著,在觀測(cè)到當(dāng)前刺激之前,個(gè)體對(duì)當(dāng)前刺激屬于信號(hào)的概率存在先驗(yàn)認(rèn)識(shí),反映為先驗(yàn)概率P (S)。而在觀測(cè)到當(dāng)前刺激的強(qiáng)度x之后,被試將當(dāng)前刺激屬于信號(hào)的概率更新為后驗(yàn)概率P(S|x)。同理,個(gè)體基于刺激強(qiáng)度x對(duì)當(dāng)前刺激屬于噪音(記為N)的概率進(jìn)行更新的過(guò)程可以用如下公式表示:
貝葉斯決策理論認(rèn)為,個(gè)體會(huì)基于當(dāng)前刺激屬于信號(hào)或噪音的后驗(yàn)概率,來(lái)決定應(yīng)當(dāng)把當(dāng)前刺激判斷為信號(hào)還是噪音。如果刺激屬于信號(hào)的后驗(yàn)概率大于其屬于噪音的后驗(yàn)概率,則個(gè)體就會(huì)把當(dāng)前刺激判斷為信號(hào),反之則判斷為噪音(Burgess, 1985; Fleming & Daw, 2017; Lau, 2007)。由于刺激屬于信號(hào)和噪音的后驗(yàn)概率之和為1,因此個(gè)體會(huì)把P (S|x) =0.5作為判斷標(biāo)準(zhǔn):如果刺激屬于信號(hào)的后驗(yàn)概率大于0.5則判斷當(dāng)前刺激為信號(hào),而如果小于0.5則判斷刺激為噪音。
在公式(5)和(6)中,觀測(cè)到刺激強(qiáng)度x的邊緣概率P(x)是相等的。具體而言,P(x)的計(jì)算方法是,根據(jù)刺激屬于信號(hào)和噪音的先驗(yàn)概率——P(S)與P(N),對(duì)給定當(dāng)前刺激是信號(hào)或噪音的條件下觀測(cè)到x的概率(似然函數(shù))——P(x|S)與P(x|N),進(jìn)行加權(quán)平均:
P(x)=P(x|S)P(S)+P(x|N)P(N) (7)
可以通過(guò)將公式(5)與公式(6)相除,消去P(x)項(xiàng),得出下面的公式:
公式(8)意味著,貝葉斯決策過(guò)程可以被看作個(gè)體基于后驗(yàn)概率的比值進(jìn)行決策的過(guò)程:如果刺激屬于信號(hào)和噪音的后驗(yàn)概率比P(S|x) /P(N|x)大于1,則被試會(huì)把當(dāng)前刺激判斷為信號(hào),反之則判斷為噪音。根據(jù)貝葉斯定理,后驗(yàn)概率比值是由刺激強(qiáng)度x在信號(hào)和噪音成立的條件下的似然函數(shù)比值P(x|S)/P (x|N),以及信號(hào)和噪音的先驗(yàn)概率比值P(S)/P(N)共同決定的。
由于在信號(hào)或噪音成立的條件下,刺激強(qiáng)度x分別滿足一個(gè)概率分布(通常假設(shè)為正態(tài)分布),因此x在信號(hào)或噪音成立條件下的似然函數(shù)反映了當(dāng)刺激是信號(hào)或噪音時(shí)觀測(cè)到的刺激強(qiáng)度為x的相對(duì)概率,其等價(jià)于x在信號(hào)或噪音分布中出現(xiàn)的概率密度(即正態(tài)分布中x所在位置對(duì)應(yīng)的縱坐標(biāo)的值)。當(dāng)刺激強(qiáng)度x在信號(hào)分布下出現(xiàn)的概率密度P(x|S)越大,或在噪音分布下出現(xiàn)的概率密度P(x|N)越小時(shí),個(gè)體越傾向于將當(dāng)前刺激判斷為信號(hào),反之則更傾向于判斷為噪音。需要注意的是,個(gè)體在完成貝葉斯推理的過(guò)程中,可能并不知道信號(hào)和噪音分布的真實(shí)形態(tài)。比如,個(gè)體可能并不知道真實(shí)的信號(hào)與噪音分布的均值和標(biāo)準(zhǔn)差分別等于多少(Lau, 2007)。為了完成貝葉斯推理過(guò)程,個(gè)體必須主觀推測(cè)信號(hào)和噪音分布的形態(tài),并據(jù)此估計(jì)當(dāng)前刺激的強(qiáng)度x在信號(hào)和噪音分布中出現(xiàn)的似然函數(shù)(Lau, 2007)。
在一些情況下,個(gè)體對(duì)刺激屬于信號(hào)還是噪音可能不存在先驗(yàn)的偏好。比如,被試在參加一個(gè)信號(hào)檢測(cè)實(shí)驗(yàn)任務(wù)之前,可能對(duì)電腦屏幕上出現(xiàn)的刺激是信號(hào)還是噪音并沒(méi)有先驗(yàn)的偏向,而是簡(jiǎn)單地認(rèn)為二者是等可能的。此時(shí)可以簡(jiǎn)單假設(shè)信號(hào)和噪音成立的先驗(yàn)概率相等,即P(S)=P(N)=0.5。這種情況下的后驗(yàn)概率比值就等于似然函數(shù)的比值,因此貝葉斯決策的結(jié)果完全由似然函數(shù)的值來(lái)決定。然而,先驗(yàn)概率并不一定始終等于0.5 (Wickens, 2001)。比如,一些個(gè)體對(duì)信號(hào)和噪音出現(xiàn)的先驗(yàn)概率可能具有一定的主觀偏好,即可能偏向于認(rèn)為信號(hào)或噪音其中之一更可能出現(xiàn)。此時(shí),基于后驗(yàn)概率比值的貝葉斯決策過(guò)程不僅受到似然函數(shù)比值的影響,也受到先驗(yàn)概率比值的影響;當(dāng)個(gè)體認(rèn)為信號(hào)成立的先驗(yàn)概率越大,或噪音成立的先驗(yàn)概率越小時(shí),就越傾向于把當(dāng)前刺激判斷為信號(hào),反之則越傾向于判斷為噪音。
根據(jù)貝葉斯決策理論的觀點(diǎn),個(gè)體在貝葉斯推理過(guò)程中使用的似然函數(shù)值和先驗(yàn)概率值,均來(lái)自個(gè)體自身的主觀估計(jì)。那么,當(dāng)個(gè)體主觀估計(jì)的似然函數(shù)和先驗(yàn)概率等于多少時(shí),最終給出的決策結(jié)果是最理想的?當(dāng)似然函數(shù)和先驗(yàn)概率的主觀估計(jì)值發(fā)生變化時(shí),個(gè)體的決策過(guò)程又會(huì)受到怎樣的影響?為了回答上述問(wèn)題,本文接下來(lái)將從信號(hào)檢測(cè)任務(wù)中的“理想觀察者”視角出發(fā),在貝葉斯決策理論的框架下進(jìn)一步探討個(gè)體何時(shí)會(huì)給出最理想的決策,以及如何解釋實(shí)際研究中被試的決策結(jié)果與理想觀察者之間的偏離。
3 理想觀察者
根據(jù)經(jīng)典信號(hào)檢測(cè)論的觀點(diǎn),個(gè)體會(huì)在刺激強(qiáng)度的數(shù)軸上設(shè)置一個(gè)報(bào)告標(biāo)準(zhǔn)C,并通過(guò)比較當(dāng)前刺激的強(qiáng)度x與C在數(shù)軸上的位置,來(lái)決定當(dāng)前刺激是信號(hào)還是噪音。個(gè)體的作答結(jié)果可以被分為擊中、虛報(bào)、漏報(bào)和正確拒絕四種類型,其中擊中(將信號(hào)刺激判斷為信號(hào))和正確拒絕(將噪音刺激判斷為噪音)視為正確作答,而虛報(bào)(將噪音刺激判斷為信號(hào))和漏報(bào)(將信號(hào)刺激判斷為噪音)視為錯(cuò)誤作答。那么,一個(gè)有趣的問(wèn)題是,當(dāng)報(bào)告標(biāo)準(zhǔn)C設(shè)置在哪里時(shí),個(gè)體作答的正確率最大?在信號(hào)檢測(cè)論框架下,通過(guò)設(shè)置最合適的報(bào)告標(biāo)準(zhǔn)使得作答正確率最大的個(gè)體,被稱為理想觀察者(Wickens, 2001)。
為了計(jì)算出理想觀察者會(huì)把報(bào)告標(biāo)準(zhǔn)C設(shè)置在怎樣的位置,首先需要求出C值的變化如何影響作答正確率。這里以圖1中呈現(xiàn)的信號(hào)檢測(cè)論模型為例。在圖1所示的模型中,信號(hào)分布和噪音分布具有相等的方差(二者均等于1),該類模型又被稱為等方差信號(hào)檢測(cè)模型(Wickens, 2001)。根據(jù)圖1可知,當(dāng)實(shí)驗(yàn)中呈現(xiàn)的刺激為信號(hào)時(shí),作答正確率(即擊中率,hit rate,HR)等于信號(hào)分布下報(bào)告標(biāo)準(zhǔn)C右側(cè)的面積。具體計(jì)算公式為:
? ? ? ? ? ? HR=1-Φ(C|μ=d',σ=1) ? ? (9)
上式中,Φ (C|μ,σ)代表均值為μ、標(biāo)準(zhǔn)差為σ的正態(tài)分布的累積分布函數(shù),即等價(jià)于該正態(tài)分布位于C左側(cè)的曲線下方面積。同理,當(dāng)實(shí)驗(yàn)中呈現(xiàn)的刺激為噪音時(shí),作答正確率(即正確拒絕率,correct rejection rate,CRR)等于噪音分布下報(bào)告標(biāo)準(zhǔn)C左側(cè)的面積:
CRR=Φ(C|μ=0,σ=1) ? ? ? ? ? ? (10)
假設(shè)在信號(hào)檢測(cè)實(shí)驗(yàn)任務(wù)中,信號(hào)刺激出現(xiàn)的可能性為P(St),噪音刺激出現(xiàn)的可能性為P(Nt)。字母t的意思是,上述概率代表了信號(hào)和噪音刺激在實(shí)驗(yàn)中出現(xiàn)的真實(shí)(true)概率,以與個(gè)體在貝葉斯決策過(guò)程中使用的主觀先驗(yàn)概率相區(qū)分。據(jù)此可以求出總體的作答正確率Pcorrect:
Pcorrect=P(St)·HR+P(Nt)·CRR=
P(St)·[1-Φ(C|μ=d',σ=1)]+P(Nt)·Φ(C|μ=0,σ=1) ? (11)
為了求出C值等于多少時(shí)Pcorrect最大,可以先求出Pcorrect的一階導(dǎo)數(shù):
公式(12)中,?(C|μ,σ)代表在均值為μ、標(biāo)準(zhǔn)差為σ的正態(tài)分布中,刺激強(qiáng)度等于C時(shí)的概率密度。理想觀察者的報(bào)告標(biāo)準(zhǔn)Cideal應(yīng)當(dāng)設(shè)置在令Pcorrect的一階導(dǎo)數(shù)為0的位置,即滿足如下的公式(13):
P(Nt)· ?(Cideal|μ=0,σ=1)
-P(St)?(Cideal|μ=d',σ=1)=0 (13)
當(dāng)個(gè)體把強(qiáng)度高于Cideal的刺激全部判斷為信號(hào),而把強(qiáng)度低于Cideal的刺激全部判斷為噪音時(shí),個(gè)體的作答正確率達(dá)到最大(Wickens,2001)。根據(jù)正態(tài)分布的概率密度函數(shù),可以進(jìn)一步求出Cideal在刺激強(qiáng)度的數(shù)軸上的位置:
在等方差信號(hào)檢測(cè)模型中,當(dāng)信號(hào)和噪音在實(shí)驗(yàn)任務(wù)中出現(xiàn)的概率相同,即P(St)=P(Nt)=0.5時(shí),C的位置恰好等于d'/2,即理想觀察者會(huì)把報(bào)告標(biāo)準(zhǔn)設(shè)置在信號(hào)分布均值和噪音分布均值的正中間位置。換言之,理想觀察者設(shè)置的報(bào)告標(biāo)準(zhǔn)正好處在信號(hào)分布和噪音分布交叉的位置(Wickens, 2001)。
接下來(lái),本文將介紹如何從貝葉斯決策理論的角度來(lái)理解理想觀察者的決策規(guī)則。公式(13)又可以被寫(xiě)為如下形式:
不難看出,公式(17)與反映貝葉斯決策過(guò)程的公式(8)非常相似。在公式(17)中,信號(hào)和噪音在實(shí)驗(yàn)任務(wù)中出現(xiàn)的真實(shí)概率的比值P(St)/P(Nt),類似于個(gè)體在貝葉斯決策過(guò)程中使用的先驗(yàn)概率比值;而在公式(17)中,當(dāng)刺激強(qiáng)度等于Cideal時(shí),信號(hào)和噪音分布中的概率密度比值?(Cideal|μ=d',σ=1) /? (Cideal|μ=0,σ=1)也類似于貝葉斯決策過(guò)程中的似然函數(shù)比值。事實(shí)上,貝葉斯決策理論指出,當(dāng)個(gè)體完全清楚信號(hào)和噪音出現(xiàn)的客觀先驗(yàn)概率以及信號(hào)和噪音分布的真實(shí)形態(tài)(即真實(shí)的似然函數(shù)值)時(shí),采用貝葉斯決策機(jī)制可以保證個(gè)體成為理想觀察者,即能夠使得個(gè)體的作答正確率最大(Burgess, 1985)。具體而言,結(jié)合公式(8)與公式(17)可知,當(dāng)刺激強(qiáng)度恰好等于Cideal時(shí),后驗(yàn)概率的比值(即信號(hào)和噪音條件下似然函數(shù)與先驗(yàn)概率乘積的比值)等于1。而當(dāng)刺激強(qiáng)度大于Cideal時(shí),后驗(yàn)概率的比值大于1,此時(shí)個(gè)體會(huì)把當(dāng)前刺激判斷為信號(hào);當(dāng)刺激強(qiáng)度小于Cideal時(shí),后驗(yàn)概率的比值小于1,此時(shí)個(gè)體會(huì)把當(dāng)前刺激判斷為噪音。上述基于貝葉斯推理過(guò)程的決策規(guī)則,與經(jīng)典信號(hào)檢測(cè)論框架下理想觀察者的決策規(guī)則完全相同。
然而,針對(duì)實(shí)際研究的數(shù)據(jù)分析結(jié)果表明,雖然真實(shí)被試設(shè)置的報(bào)告標(biāo)準(zhǔn)與理想觀察者近似(Knill, 1998; Legge et al., 2002; Stretch & Wixted, 1998),但被試通常不會(huì)把報(bào)告標(biāo)準(zhǔn)恰好設(shè)置在公式(16)給出的Cideal的位置,這意味著被試的決策規(guī)則與理想觀察者仍然存在一定的偏離(Lau, 2007; Wickens, 2001)。根據(jù)貝葉斯決策理論,真實(shí)被試與理想觀察者的偏離可能由兩種原因造成。第一種是被試對(duì)信號(hào)和噪音出現(xiàn)的先驗(yàn)概率的估計(jì)與二者出現(xiàn)的實(shí)際概率不相同。圖2A給出了一個(gè)示例:在實(shí)際的實(shí)驗(yàn)任務(wù)中,信號(hào)和噪音出現(xiàn)的客觀概率相等,但被試主觀認(rèn)為信號(hào)出現(xiàn)的先驗(yàn)概率大于噪音的先驗(yàn)概率?;谪惾~斯決策理論的觀點(diǎn),被試此時(shí)會(huì)根據(jù)自身對(duì)先驗(yàn)概率的主觀估計(jì),把報(bào)告標(biāo)準(zhǔn)設(shè)置在信號(hào)分布和噪音分布均值的中間靠左的位置,以保證作答正確率最大。但由于被試主觀估計(jì)的先驗(yàn)概率與信號(hào)和噪音出現(xiàn)的客觀概率不同,因此被試設(shè)置的報(bào)告標(biāo)準(zhǔn)在實(shí)際的信號(hào)和噪音分布上就會(huì)與理想觀察者存在偏離。第二種是被試對(duì)信號(hào)或噪音分布形態(tài)的主觀估計(jì)與客觀分布的形態(tài)不同,進(jìn)而造成對(duì)似然函數(shù)的主觀估計(jì)出現(xiàn)偏差。在圖2B的示例中,被試對(duì)噪音分布均值的主觀估計(jì)與其真實(shí)值相等,但是對(duì)信號(hào)分布均值的主觀估計(jì)大于信號(hào)分布的實(shí)際均值。在這種情況下,被試會(huì)基于貝葉斯推理的結(jié)果,把報(bào)告標(biāo)準(zhǔn)設(shè)置在信號(hào)和噪音分布均值的主觀估計(jì)值的中點(diǎn)。然而,被試對(duì)信號(hào)分布均值的主觀估計(jì)偏差會(huì)導(dǎo)致設(shè)置的報(bào)告標(biāo)準(zhǔn)偏離實(shí)際分布上的理想標(biāo)準(zhǔn)(Lau, 2007; Wickens, 2001)。因此,和經(jīng)典信號(hào)檢測(cè)論相比,貝葉斯決策理論進(jìn)一步地解釋了為何個(gè)體在信號(hào)檢測(cè)任務(wù)中會(huì)把報(bào)告標(biāo)準(zhǔn)設(shè)置在特定的位置,并將其與個(gè)體對(duì)信號(hào)和噪音的出現(xiàn)概率及分布形態(tài)的主觀估計(jì)緊密聯(lián)系了起來(lái)。
以上結(jié)論都是基于圖1所示的等方差信號(hào)檢測(cè)模型推導(dǎo)得出的。在等方差信號(hào)檢測(cè)模型中,雖然和經(jīng)典信號(hào)檢測(cè)論相比,貝葉斯決策理論可以對(duì)個(gè)體的決策過(guò)程給出更加深入的理論解釋,但是二者在數(shù)學(xué)上是等價(jià)的。具體而言,雖然根據(jù)貝葉斯決策理論,個(gè)體對(duì)先驗(yàn)概率和似然函數(shù)的主觀估計(jì)可能與其客觀真實(shí)值存在差異,但只要個(gè)體主觀認(rèn)為信號(hào)和噪音分布的方差相等,基于經(jīng)典信號(hào)檢測(cè)論和貝葉斯決策理論得出的決策過(guò)程就會(huì)在數(shù)學(xué)上具有相等的形式:個(gè)體會(huì)在刺激強(qiáng)度x高于某一報(bào)告標(biāo)準(zhǔn)C時(shí)將刺激判斷為信號(hào),而在x低于C時(shí)將刺激判斷為噪音(Glanzer et al., 2009, 2019; Wickens, 2001)。然而,在實(shí)際的信號(hào)檢測(cè)任務(wù)中,信號(hào)和噪音分布的方差并不會(huì)始終相等;該類模型被稱為不等方差信號(hào)檢測(cè)模型(Mickes et al., 2007)。在這種情況下,經(jīng)典信號(hào)檢測(cè)論與貝葉斯決策理論之間的關(guān)系會(huì)變得更加復(fù)雜。接下來(lái),本文將介紹經(jīng)典信號(hào)檢測(cè)論與貝葉斯決策理論在不等方差信號(hào)檢測(cè)模型中存在怎樣的差異。
4 不等方差信號(hào)檢測(cè)模型
在信號(hào)檢測(cè)論模型中,為了簡(jiǎn)化模型假設(shè),研究者經(jīng)常假設(shè)信號(hào)和噪音分布具有相等的方差(標(biāo)準(zhǔn)差)。然而,在實(shí)際研究中,這一假設(shè)并非始終成立(Green & Swets, 1966; Wixted, 2020)。比如,在前文介紹過(guò)的再認(rèn)記憶任務(wù)中,研究者們發(fā)現(xiàn),和“新詞”代表的噪音分布相比,“舊詞”代表的信號(hào)分布具有顯著更大的標(biāo)準(zhǔn)差,且信號(hào)和噪音分布的標(biāo)準(zhǔn)差比值通常在1.25∶1左右(Mickes et al., 2007; Rotello, 2017)。Wixted (2007)提出了一種假設(shè)來(lái)解釋再認(rèn)記憶任務(wù)中信號(hào)分布方差更大的原因:與新詞相比,舊詞之所以在再認(rèn)記憶任務(wù)中具有更高的刺激強(qiáng)度,是由于個(gè)體對(duì)這些舊詞在學(xué)習(xí)階段進(jìn)行了一定程度的學(xué)習(xí)與記憶;而只有當(dāng)個(gè)體對(duì)所有舊詞的學(xué)習(xí)程度均相等時(shí),信號(hào)分布的方差才能與噪音分布保持一致。但實(shí)際上,個(gè)體對(duì)每個(gè)舊詞的學(xué)習(xí)程度必然不是完全相等的,不同舊詞的學(xué)習(xí)程度之間的變異會(huì)導(dǎo)致信號(hào)分布的方差顯著大于噪音分布。因此,等方差信號(hào)檢測(cè)模型雖然具有簡(jiǎn)單的理論假設(shè),但可能對(duì)信號(hào)檢測(cè)任務(wù)給出了過(guò)于簡(jiǎn)化的描述;而不等方差信號(hào)檢測(cè)模型也許能夠更好地反映個(gè)體在實(shí)際任務(wù)中完成的信號(hào)檢測(cè)過(guò)程。
值得注意的是,并非所有的信號(hào)檢測(cè)任務(wù)都必須使用不等方差信號(hào)檢測(cè)模型來(lái)描述。比如,在二選一迫選任務(wù)(2 alternative forced choice, 2AFC)范式中,屏幕上每次會(huì)同時(shí)呈現(xiàn)一個(gè)信號(hào)刺激(如舊詞)和一個(gè)噪音刺激(如新詞),被試需要從兩個(gè)刺激中準(zhǔn)確地選出信號(hào)刺激。即使信號(hào)和噪音分布的方差不相等,2AFC任務(wù)的信號(hào)檢測(cè)過(guò)程也能夠使用等方差信號(hào)檢測(cè)模型來(lái)定量刻畫(huà)(Wickens, 2001)。由于與本文主題不直接相關(guān),因此本文不對(duì)2AFC任務(wù)下的信號(hào)檢測(cè)論模型進(jìn)行進(jìn)一步介紹。感興趣的讀者可以閱讀已有文獻(xiàn)中對(duì)2AFC任務(wù)的論述(Macmillan & Creelman, 2004; Wickens, 2001)。
下面,本文將介紹在不等方差信號(hào)檢測(cè)模型的框架下,個(gè)體如何根據(jù)貝葉斯決策理論來(lái)完成決策過(guò)程。圖3給出了不等方差信號(hào)檢測(cè)模型的示例。與圖1相似,圖3中噪音分布的均值為0,信號(hào)分布的均值為d'。然而,與圖1不同的是,圖3中噪音分布的標(biāo)準(zhǔn)差σN等于1,而信號(hào)分布的標(biāo)準(zhǔn)差σS與1并不相等(圖3中假設(shè)σS大于1,即與再認(rèn)記憶任務(wù)中的情況相同)。為了簡(jiǎn)化貝葉斯推理過(guò)程,這里假設(shè)信號(hào)和噪音出現(xiàn)的真實(shí)概率均為0.5,且個(gè)體完全清楚信號(hào)和噪音的先驗(yàn)概率及似然函數(shù)。由于信號(hào)和噪音出現(xiàn)的先驗(yàn)概率相等,因此個(gè)體的決策結(jié)果完全依賴于當(dāng)前刺激的強(qiáng)度x在信號(hào)和噪音分布中的似然函數(shù)的比值:根據(jù)公式(8),當(dāng)似然函數(shù)的比值大于1時(shí),個(gè)體會(huì)將當(dāng)前刺激判斷為信號(hào),反之則判斷為噪音。然而,根據(jù)圖3可知,在不等方差信號(hào)檢測(cè)模型中,信號(hào)分布和噪音分布存在兩個(gè)不同位置的交叉點(diǎn)(C1和C2)。當(dāng)x小于C1或大于C2時(shí),x在信號(hào)分布中的概率密度高于噪音分布,因此被試會(huì)把當(dāng)前刺激判斷為信號(hào);而當(dāng)x處在C1和C2之間時(shí),x在噪音分布中的概率密度更高,被試會(huì)把當(dāng)前刺激判斷為噪音。換言之,信號(hào)和噪音分布的似然函數(shù)的一個(gè)特定比值,在刺激強(qiáng)度的數(shù)軸上對(duì)應(yīng)兩個(gè)不同的報(bào)告標(biāo)準(zhǔn)。
Glanzer等(2009)通過(guò)嚴(yán)密的數(shù)學(xué)推導(dǎo),給出了在不等方差信號(hào)檢測(cè)模型中,似然函數(shù)比值與刺激強(qiáng)度數(shù)軸上的報(bào)告標(biāo)準(zhǔn)C之間的對(duì)應(yīng)關(guān)系。Glanzer等首先計(jì)算了當(dāng)刺激強(qiáng)度等于C時(shí),信號(hào)和噪音分布中似然函數(shù)的比值,隨后對(duì)似然函數(shù)比值取自然對(duì)數(shù)(記為λ):
由于對(duì)數(shù)函數(shù)是單調(diào)遞增的,因此當(dāng)λ取到其最大值(或最小值)時(shí),似然函數(shù)的比值也應(yīng)當(dāng)能夠取到最大值(或最小值)。進(jìn)一步的計(jì)算結(jié)果表明(Glanzer et al., 2009),λ與刺激強(qiáng)度數(shù)軸上的報(bào)告標(biāo)準(zhǔn)C之間滿足二次函數(shù)關(guān)系(見(jiàn)圖4)。當(dāng)信號(hào)分布的標(biāo)準(zhǔn)差σS大于1時(shí),λ有最小值(記為λ*);而當(dāng)σS小于1時(shí),λ有最大值(記為λ*)。當(dāng)且僅當(dāng)λ等于λ*時(shí),刺激強(qiáng)度數(shù)軸上存在唯一的報(bào)告標(biāo)準(zhǔn)與其對(duì)應(yīng)(記為C*);而當(dāng)λ不等于λ*時(shí),每一個(gè)λ值都對(duì)應(yīng)兩個(gè)不同的報(bào)告標(biāo)準(zhǔn)。當(dāng)λ等于0(即似然函數(shù)比值為1)時(shí),對(duì)應(yīng)的兩個(gè)報(bào)告標(biāo)準(zhǔn)C1和C2將整個(gè)刺激強(qiáng)度數(shù)軸分為三個(gè)部分。如果σS大于1,則個(gè)體會(huì)將C1和C2中間的部分判斷為噪音,而將兩側(cè)的部分判斷為信號(hào);如果σS小于1則相反。
經(jīng)典信號(hào)檢測(cè)論認(rèn)為,即使在不等方差信號(hào)檢測(cè)模型中,個(gè)體仍然只會(huì)簡(jiǎn)單地設(shè)置一個(gè)報(bào)告標(biāo)準(zhǔn)C,并當(dāng)刺激強(qiáng)度x高于C時(shí)將刺激判斷為信號(hào),反之則判斷為噪音(Mickes et al., 2007; Wickens, 2001)。因此,經(jīng)典信號(hào)檢測(cè)論和貝葉斯決策理論為不等方差信號(hào)檢測(cè)模型中的決策機(jī)制給出了不同的預(yù)測(cè),個(gè)體根據(jù)兩種理論給出的決策結(jié)果也不再完全等價(jià)(這一點(diǎn)與等方差信號(hào)檢測(cè)模型有別)。
經(jīng)典信號(hào)檢測(cè)論和貝葉斯決策理論在不等方差信號(hào)檢測(cè)模型中存在的差異可以從操作者特性曲線(receiver operating characteristic curve, ROC curve)中體現(xiàn)出來(lái)。ROC曲線指的是在保持信號(hào)和噪音的客觀分布形態(tài)不變的基礎(chǔ)上,反映擊中率(HR)和虛報(bào)率(false alarm rate, FAR)之間關(guān)系的曲線(Wickens, 2001)。在經(jīng)典信號(hào)檢測(cè)論框架下,通過(guò)改變報(bào)告標(biāo)準(zhǔn)C的位置(如設(shè)置寬松或嚴(yán)格的報(bào)告標(biāo)準(zhǔn)),可以同時(shí)改變擊中率和虛報(bào)率的值。而在貝葉斯決策理論框架下(假設(shè)個(gè)體完全清楚先驗(yàn)概率和似然函數(shù)的真實(shí)值),可以通過(guò)改變信號(hào)和噪音刺激出現(xiàn)概率的方式來(lái)影響先驗(yàn)概率,進(jìn)而影響后驗(yàn)概率比值等于1時(shí)的似然函數(shù)比值(即影響λ的臨界值);λ的臨界值對(duì)應(yīng)的報(bào)告標(biāo)準(zhǔn)的位置也會(huì)隨之發(fā)生變化,進(jìn)而改變擊中率和虛報(bào)率。將所有可能的擊中率和虛報(bào)率配對(duì)繪制在圖上,以虛報(bào)率為橫坐標(biāo),擊中率為縱坐標(biāo),即可得到ROC曲線。
在等方差信號(hào)檢測(cè)模型中,無(wú)論個(gè)體基于經(jīng)典信號(hào)檢測(cè)論還是貝葉斯決策理論來(lái)完成決策過(guò)程(二者在數(shù)學(xué)上是等價(jià)的),只要辨別力指數(shù)d'的值大于0,ROC曲線就會(huì)始終處在對(duì)角線上方,即意味著擊中率始終高于虛報(bào)率;當(dāng)d'的值越高時(shí),ROC曲線下的面積越大(見(jiàn)圖5A的示例)。但是,在不等方差信號(hào)檢測(cè)模型中,如果個(gè)體基于經(jīng)典信號(hào)檢測(cè)論給出的決策機(jī)制來(lái)完成決策過(guò)程,則就算d'的值大于0,ROC曲線也會(huì)有一部分處在對(duì)角線下方。比如,當(dāng)信號(hào)分布標(biāo)準(zhǔn)差σS大于1時(shí),在擊中率和虛報(bào)率都非常接近1的情況下,擊中率會(huì)小于虛報(bào)率(見(jiàn)圖5B);而當(dāng)σS小于1時(shí),則在擊中率和虛報(bào)率都接近于0的情況下,擊中率小于虛報(bào)率(見(jiàn)圖5C)。與之相對(duì),如果個(gè)體基于貝葉斯決策理論來(lái)完成決策過(guò)程,則即使在不等方差信號(hào)檢測(cè)模型中,ROC曲線也會(huì)始終處在對(duì)角線上方(見(jiàn)圖5D);這一結(jié)論可以在數(shù)學(xué)上得到嚴(yán)格的證明(Wickens, 2001)。
經(jīng)典信號(hào)檢測(cè)論和貝葉斯決策理論之間的差異可以在zROC曲線上得到更加直觀的體現(xiàn)(Macmillan & Creelman, 2004)。所謂zROC曲線,指的是首先利用下面的公式將擊中率HR和虛報(bào)率FAR轉(zhuǎn)化為z分?jǐn)?shù):
? ? ? ? zHR=Φ-1(HR|μ=0,σ=1) ? (19)
? ? ? ? ?zFAR=Φ-1(FAR|μ=0,σ=1) ? ? ? (20)
公式(19)和(20)中,Φ-1(p|μ=0,σ=1)代表均值為0、標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布累積分布函數(shù)的逆函數(shù),即將取值范圍在0到1之間的概率值p轉(zhuǎn)化為取值范圍在負(fù)無(wú)窮到正無(wú)窮之間的z分?jǐn)?shù)。隨后,以zFAR為橫坐標(biāo),zHR為縱坐標(biāo),繪制二者之間的關(guān)系圖,即為zROC曲線。圖6給出了zROC曲線的示例。當(dāng)zROC曲線位于直線y=x上方時(shí),就意味著擊中率大于虛報(bào)率。從數(shù)學(xué)上可以證明,在經(jīng)典信號(hào)檢測(cè)論框架下,zHR和zFAR之間的關(guān)系為一條直線,其斜率等于噪音分布標(biāo)準(zhǔn)差和信號(hào)分布標(biāo)準(zhǔn)差的比值σN/σS (Wickens, 2001)。在信號(hào)檢測(cè)論中,噪音分布標(biāo)準(zhǔn)差σN通常設(shè)為1。當(dāng)信號(hào)分布標(biāo)準(zhǔn)差σS大于1時(shí),zROC直線的斜率小于1,此時(shí)zROC直線必然會(huì)在右側(cè)與直線y=x相交,并導(dǎo)致當(dāng)擊中率和虛報(bào)率的值均很大時(shí),擊中率小于虛報(bào)率。同理,當(dāng)σS小于1時(shí),zROC直線的斜率大于1,會(huì)在左側(cè)與y=x相交,并導(dǎo)致當(dāng)擊中率和虛報(bào)率的值均很小時(shí),擊中率小于虛報(bào)率(見(jiàn)圖6A的示例)。另一方面,在貝葉斯決策理論的框架下,zHR和zFAR之間的關(guān)系為一條曲線;無(wú)論σS的值等于多少,zROC曲線始終位于y=x的上方(見(jiàn)圖6B的示例)(Macmillan & Creelman, 2004)。
由于在不等方差信號(hào)檢測(cè)模型中,經(jīng)典信號(hào)檢測(cè)論和貝葉斯決策理論預(yù)測(cè)了不同的ROC曲線和zROC曲線形態(tài),因此從理論上講,可以通過(guò)考察實(shí)際研究當(dāng)中獲得的ROC以及zROC曲線,以及在極端條件下獲得的擊中率和虛報(bào)率數(shù)據(jù),來(lái)確認(rèn)哪一種理論能夠更好地解釋真實(shí)被試在不等方差信號(hào)檢測(cè)任務(wù)當(dāng)中的決策過(guò)程。比如,在再認(rèn)記憶任務(wù)中,可以考慮通過(guò)盡可能地增加舊詞的出現(xiàn)頻率,降低新詞的出現(xiàn)頻率,使得被試設(shè)置盡可能寬松的報(bào)告標(biāo)準(zhǔn),即將絕大多數(shù)刺激都判斷為舊詞(此時(shí)擊中率和虛報(bào)率都接近1)。在該實(shí)驗(yàn)條件下,如果發(fā)現(xiàn)被試的擊中率低于虛報(bào)率,則支持經(jīng)典信號(hào)檢測(cè)論;如果擊中率始終高于虛報(bào)率,則支持貝葉斯決策理論。
然而,上述實(shí)驗(yàn)設(shè)計(jì)很難在實(shí)際研究中得到應(yīng)用。這是因?yàn)樵诮?jīng)典信號(hào)檢測(cè)論框架下,當(dāng)不等方差信號(hào)檢測(cè)模型中的擊中率低于虛報(bào)率時(shí),擊中率與虛報(bào)率的真值都非常接近極端值0或1。同時(shí),即使存在擊中率低于虛報(bào)率的情況,二者之間的差異也是很小的(見(jiàn)圖5B和圖5C)。在此情況下,樣本數(shù)據(jù)中計(jì)算得到的擊中率與虛報(bào)率差值會(huì)受到抽樣誤差的嚴(yán)重影響,一點(diǎn)細(xì)微的抽樣誤差的存在都會(huì)導(dǎo)致研究者難以根據(jù)實(shí)驗(yàn)結(jié)果準(zhǔn)確估計(jì)擊中率與虛報(bào)率的真實(shí)差異(Glanzer et al., 2019; Macmillan & Creelman, 2004)。那么,是否存在某種實(shí)驗(yàn)設(shè)計(jì),使得研究者可以比較經(jīng)典信號(hào)檢測(cè)論和貝葉斯決策理論在解釋真實(shí)個(gè)體的決策過(guò)程時(shí)的優(yōu)劣呢?
5 支持貝葉斯決策理論的研究證據(jù)
有研究者指出,兩條件實(shí)驗(yàn)可以被用于比較經(jīng)典信號(hào)檢測(cè)論和貝葉斯決策理論在真實(shí)決策過(guò)程中的合理性(Glanzer et al., 2009, 2019; Semmler et al., 2018; Stretch & Wixted, 1998)。所謂的兩條件實(shí)驗(yàn),指的是在一個(gè)被試內(nèi)實(shí)驗(yàn)設(shè)計(jì)中,要求同一批被試完成兩個(gè)不同的信號(hào)檢測(cè)任務(wù);這兩個(gè)任務(wù)除了存在難度上的區(qū)別外,在任務(wù)要求上沒(méi)有任何差異。比如,被試可以完成兩個(gè)不同的再認(rèn)記憶任務(wù),這兩個(gè)任務(wù)的唯一區(qū)別在于學(xué)習(xí)階段被試學(xué)習(xí)每個(gè)舊詞的時(shí)間長(zhǎng)度存在差異,學(xué)習(xí)時(shí)間越長(zhǎng)則任務(wù)難度越低(Glanzer et al., 2009)。同時(shí),在兩個(gè)信號(hào)檢測(cè)任務(wù)中,被試不僅需要判斷每個(gè)刺激是信號(hào)還是噪音,而且需要給出自己對(duì)作答結(jié)果的信心判斷,即被試需要在一個(gè)李克特量表上評(píng)價(jià)自己對(duì)作答結(jié)果的信心程度。此外,Glanzer等(2019)指出,在兩條件實(shí)驗(yàn)設(shè)計(jì)中,被試必須清楚意識(shí)到每個(gè)試次來(lái)自哪個(gè)任務(wù)難度條件。因此,兩個(gè)不同難度的信號(hào)檢測(cè)任務(wù)最好在不同的組塊中進(jìn)行;如果一定要使用混合列表設(shè)計(jì),即把兩個(gè)難度的信號(hào)檢測(cè)任務(wù)的試次混合在一起,則必須通過(guò)特定的提示告知被試當(dāng)前的試次來(lái)自哪個(gè)實(shí)驗(yàn)條件,比如為屏幕上呈現(xiàn)的詞語(yǔ)標(biāo)注不同的顏色等。
研究者們提出了似然比理論來(lái)解釋個(gè)體在兩條件實(shí)驗(yàn)中的決策過(guò)程(Glanzer et al., 2009, 2019; Semmler et al., 2018)。似然比理論以貝葉斯決策理論為基礎(chǔ),包含兩個(gè)具體假設(shè):(1)似然比不變假設(shè)。該假設(shè)認(rèn)為,在兩種不同難度的實(shí)驗(yàn)條件下,個(gè)體用于貝葉斯決策過(guò)程的似然函數(shù)比值的臨界值保持不變(這一假設(shè)會(huì)在下面進(jìn)行更詳細(xì)的介紹)。(2)真實(shí)似然比假設(shè)。該假設(shè)認(rèn)為,個(gè)體知道信號(hào)和噪音分布的真實(shí)分布形態(tài),并會(huì)依據(jù)刺激強(qiáng)度在信號(hào)和噪音分布中的真實(shí)似然函數(shù)比值來(lái)完成決策過(guò)程。需要注意的是,真實(shí)似然比假設(shè)比一般的貝葉斯決策理論更強(qiáng):貝葉斯決策理論通常允許個(gè)體主觀估計(jì)的似然函數(shù)比值與真實(shí)的似然函數(shù)比值存在差異(Lau, 2007; Wickens, 2001),但真實(shí)似然比假設(shè)則認(rèn)為個(gè)體知道(或至少近似知道)信號(hào)與噪音分布中的真實(shí)似然函數(shù)(Glanzer et al., 2019; Semmler et al., 2018)。根據(jù)似然比理論,個(gè)體在兩條件實(shí)驗(yàn)中的決策過(guò)程應(yīng)同時(shí)滿足上述兩個(gè)假設(shè)(Glanzer et al., 2009, 2019)。
在似然比理論的基礎(chǔ)上,Glanzer等(2009, 2019)預(yù)測(cè)了兩條件實(shí)驗(yàn)中可能出現(xiàn)的三種實(shí)驗(yàn)現(xiàn)象,包括鏡像效應(yīng)、方差效應(yīng)和zROC長(zhǎng)度效應(yīng)(zROC length effect)。Glanzer等指出,似然比理論可以很容易地解釋上述三種現(xiàn)象的產(chǎn)生機(jī)制,但經(jīng)典信號(hào)檢測(cè)理論難以同時(shí)解釋這三種現(xiàn)象的發(fā)生。實(shí)際研究結(jié)果表明,在不同認(rèn)知領(lǐng)域(如知覺(jué)、記憶、推理、心理旋轉(zhuǎn)等)的信號(hào)檢測(cè)任務(wù)中,上述三種現(xiàn)象均穩(wěn)定存在(Glanzer et al., 2009, 2019; Hilford et al., 2015, 2019; Semmler et al., 2018),即在一定程度上支持了貝葉斯決策理論的合理性。由于篇幅所限,本文只著重介紹其中的一種現(xiàn)象——zROC長(zhǎng)度效應(yīng)。
zROC長(zhǎng)度效應(yīng)最早由Stretch和Wixted (1998)發(fā)現(xiàn)。Stretch和Wixted對(duì)已有的一項(xiàng)研究中的數(shù)據(jù)進(jìn)行了再次分析(Ratcliff et al., 1994);在該研究中,被試需要完成兩種不同難度的再認(rèn)記憶任務(wù)(容易vs.困難)。比如,在容易條件下被試學(xué)習(xí)每個(gè)舊詞的時(shí)間為3s,而在困難條件下每個(gè)舊詞的學(xué)習(xí)時(shí)間只有1s。在再認(rèn)測(cè)驗(yàn)中,被試需要在一個(gè)6點(diǎn)量表上針對(duì)每個(gè)詞語(yǔ)完成判斷任務(wù),其中1到6分別代表“確定是新詞”“很可能是新詞”“可能是新詞”“可能是舊詞”“很可能是舊詞”“確定是舊詞”。因此,被試不僅需要針對(duì)每個(gè)詞語(yǔ)進(jìn)行新舊判斷,還需要報(bào)告自己對(duì)作答結(jié)果的信心程度。在經(jīng)典信號(hào)檢測(cè)論框架下,信心判斷任務(wù)是二分判斷任務(wù)(信號(hào)vs.噪音)的推廣形式,即在n點(diǎn)量表上進(jìn)行的信心判斷任務(wù)等價(jià)于在刺激強(qiáng)度的數(shù)軸上設(shè)置(n-1)個(gè)報(bào)告標(biāo)準(zhǔn)(Wickens, 2001)。如圖7A所示,當(dāng)刺激強(qiáng)度低于第一個(gè)報(bào)告標(biāo)準(zhǔn)C1時(shí),被試會(huì)在信心判斷量表上報(bào)告為1;當(dāng)刺激強(qiáng)度在C1和C2之間時(shí),被試會(huì)在信心判斷量表上報(bào)告為2;以此類推。Stretch和Wixted發(fā)現(xiàn),與困難條件(辨別力指數(shù)d'更低的條件)相比,在容易條件(d'更高的條件)下,所有的報(bào)告標(biāo)準(zhǔn)的位置均會(huì)向中間收縮,即不同報(bào)告標(biāo)準(zhǔn)之間的距離會(huì)縮短(見(jiàn)圖7A)。Stretch和Wixted隨后在一個(gè)新的實(shí)驗(yàn)研究中驗(yàn)證了上述結(jié)論。
Glanzer等(2009, 2019)使用zROC曲線對(duì)Stretch和Wixted (1998)報(bào)告的現(xiàn)象進(jìn)行了重新表述。具體而言,Glanzer等首先根據(jù)被試在n點(diǎn)信心判斷量表上給出的判斷結(jié)果,通過(guò)改變報(bào)告標(biāo)準(zhǔn)的方式計(jì)算出(n-1)對(duì)擊中率和虛報(bào)率。比如,在一個(gè)6點(diǎn)信心判斷量表上,假設(shè)將信心判斷量表點(diǎn)數(shù)1視為被試把當(dāng)前刺激判斷為噪音,而將量表點(diǎn)數(shù)2~6視為被試把刺激判斷為信號(hào),即可計(jì)算出一組擊中率和虛報(bào)率;而如果將量表點(diǎn)數(shù)1~2視為被試把刺激判斷為噪音,而將量表點(diǎn)數(shù)3~6視為被試把刺激判斷為信號(hào),則可計(jì)算出另一組擊中率和虛報(bào)率;以此類推。隨后,Glanzer等基于每種實(shí)驗(yàn)條件下獲得的(n-1)對(duì)擊中率和虛報(bào)率繪制出zROC曲線。結(jié)果表明,與困難條件相比;容易條件下繪制的zROC曲線兩端之間的距離顯著更短(如圖7B所示);這意味著當(dāng)改變報(bào)告標(biāo)準(zhǔn)時(shí),容易條件下的擊中率和虛報(bào)率值變化幅度更小,即說(shuō)明容易條件下不同的報(bào)告標(biāo)準(zhǔn)之間更為接近。Glanzer等將這一現(xiàn)象命名為zROC長(zhǎng)度效應(yīng)。
似然比理論指出,基于似然比不變假設(shè)可以很自然地推導(dǎo)出zROC長(zhǎng)度效應(yīng)。根據(jù)貝葉斯決策理論(參考公式(8)),個(gè)體在n點(diǎn)信心判斷量表上給出判斷的過(guò)程,可以被看作在后驗(yàn)概率比值上設(shè)置(n-1)個(gè)閾值(記為β1、β2……βn-1),并將當(dāng)前刺激對(duì)應(yīng)的后驗(yàn)概率比值與每個(gè)β值相比較的過(guò)程。假如當(dāng)前刺激對(duì)應(yīng)的后驗(yàn)概率比值小于β1,則個(gè)體在信心判斷量表上報(bào)告的結(jié)果為1;假如刺激對(duì)應(yīng)的后驗(yàn)概率比值在β1和β2之間,則信心判斷的結(jié)果為2;以此類推(Green & Swets, 1966)。Glanzer等(2009, 2019)假設(shè),當(dāng)兩個(gè)實(shí)驗(yàn)條件之間的唯一差異為任務(wù)難度時(shí),個(gè)體設(shè)置的閾值β應(yīng)當(dāng)不會(huì)在實(shí)驗(yàn)條件之間發(fā)生改變。由于后驗(yàn)概率比值等于先驗(yàn)概率比值和似然函數(shù)比值的乘積,且個(gè)體在貝葉斯推理過(guò)程中對(duì)于信號(hào)和噪音出現(xiàn)的先驗(yàn)概率的主觀估計(jì)通??梢越埔暈楹愣ǎ‵leming & Daw, 2017; Wickens, 2001),因此可以在數(shù)學(xué)上等價(jià)地認(rèn)為,個(gè)體在信號(hào)和噪音分布的似然函數(shù)比值上設(shè)置了一組閾值,并通過(guò)每個(gè)刺激對(duì)應(yīng)的似然函數(shù)比值與上述閾值之間的比較來(lái)給出信心判斷的結(jié)果。同時(shí),個(gè)體在似然函數(shù)比值上設(shè)置的閾值應(yīng)當(dāng)不會(huì)在兩個(gè)實(shí)驗(yàn)條件之間發(fā)生變化(Glanzer et al., 2019)。上述假設(shè)即為似然比不變假設(shè)。
接下來(lái),本文將以等方差信號(hào)檢測(cè)模型為例,根據(jù)似然比不變假設(shè)來(lái)推導(dǎo)zROC長(zhǎng)度效應(yīng)。由于個(gè)體在似然函數(shù)比值上設(shè)置的閾值是恒定不變的,因此在為似然函數(shù)比值取對(duì)數(shù)之后,對(duì)數(shù)似然比(λ)上設(shè)置的閾值也不會(huì)在實(shí)驗(yàn)條件之間發(fā)生改變?;谡龖B(tài)分布的概率密度函數(shù)(參考公式(14)和(15)),可以寫(xiě)出λ與報(bào)告標(biāo)準(zhǔn)C之間的對(duì)應(yīng)關(guān)系(Glanzer et al., 2009):
當(dāng)λ在不同實(shí)驗(yàn)條件之間維持恒定時(shí),隨著任務(wù)難度的下降(即d'的上升),報(bào)告標(biāo)準(zhǔn)C會(huì)逐漸向d'/2的周圍收縮,因此一組報(bào)告標(biāo)準(zhǔn)之間的距離會(huì)縮短,即得出了zROC長(zhǎng)度效應(yīng)。此外,Glanzer等(2009)的數(shù)學(xué)推導(dǎo)結(jié)果表明,在不等方差信號(hào)檢測(cè)模型中,雖然個(gè)體的貝葉斯決策機(jī)制更為復(fù)雜,但只要個(gè)體保持λ在不同實(shí)驗(yàn)條件之間的恒定, zROC長(zhǎng)度效應(yīng)就會(huì)成立。Glanzer等(2009, 2019)指出,雖然經(jīng)典信號(hào)檢測(cè)論也可以對(duì)zROC長(zhǎng)度效應(yīng)進(jìn)行強(qiáng)行解釋,即認(rèn)為個(gè)體在刺激強(qiáng)度的數(shù)軸上直接設(shè)置的報(bào)告標(biāo)準(zhǔn)恰好隨著任務(wù)難度的降低而收縮,但它無(wú)法解釋報(bào)告標(biāo)準(zhǔn)的收縮對(duì)應(yīng)怎樣的內(nèi)在心理機(jī)制。因此,zROC長(zhǎng)度效應(yīng)可以被視為支持貝葉斯決策理論的證據(jù)?;谙嗨频姆椒ǎ珿lanzer等(2009)從似然比理論中推導(dǎo)出了另外兩種現(xiàn)象——鏡像效應(yīng)和方差效應(yīng),并在實(shí)際研究結(jié)果中驗(yàn)證了這兩種效應(yīng)的存在。感興趣的讀者可以閱讀Glanzer等(2009)的數(shù)學(xué)推導(dǎo)過(guò)程。
根據(jù)似然比理論得出的三種實(shí)驗(yàn)現(xiàn)象在一定程度上為貝葉斯決策理論提供了支持。然而,似然比理論一直受人質(zhì)疑的地方在于其包含的真實(shí)似然比假設(shè),即認(rèn)為個(gè)體在信號(hào)檢測(cè)任務(wù)中能夠知道信號(hào)和噪音分布的真實(shí)形態(tài)。一些研究者質(zhì)疑真實(shí)被試是否有能力掌握如此多的信息(Balakrishnan & Ratcliff, 1996; Criss & McClelland, 2006)。為了回應(yīng)這一質(zhì)疑,Semmler等(2018)提出,個(gè)體對(duì)信號(hào)和噪音分布形態(tài)的認(rèn)識(shí)來(lái)自日常生活中經(jīng)年累月的學(xué)習(xí);即使個(gè)體不能通過(guò)學(xué)習(xí)精確地掌握信號(hào)與噪音分布的均值與標(biāo)準(zhǔn)差,也至少可以清楚地意識(shí)到信號(hào)和噪音分布之間的距離如何隨著任務(wù)難度的變化而發(fā)生變化(Turner et al., 2011; Wixted & Gaitan, 2002)。然而,上述觀點(diǎn)目前主要停留在理論層面。未來(lái)需要進(jìn)一步對(duì)似然比理論的假設(shè)合理性進(jìn)行考察。
6 結(jié)語(yǔ)
本文在貝葉斯決策理論的框架下,探討了個(gè)體如何通過(guò)貝葉斯推理過(guò)程完成信號(hào)檢測(cè)任務(wù)中的決策判斷。與經(jīng)典信號(hào)檢測(cè)論相比,貝葉斯決策理論可以更加深入地解釋個(gè)體辨別信號(hào)和噪音的決策過(guò)程對(duì)應(yīng)怎樣的內(nèi)在心理機(jī)制。但是,貝葉斯決策理論中涉及的參數(shù)較多(包括個(gè)體對(duì)先驗(yàn)概率和似然函數(shù)的主觀估計(jì)),而在信號(hào)檢測(cè)實(shí)驗(yàn)任務(wù)中,根據(jù)擊中率和虛報(bào)率的實(shí)驗(yàn)數(shù)據(jù)難以對(duì)上述所有參數(shù)求解。比如,個(gè)體在信號(hào)檢測(cè)任務(wù)中的報(bào)告標(biāo)準(zhǔn)發(fā)生變化,既有可能是源于個(gè)體改變了對(duì)先驗(yàn)概率的主觀估計(jì),也可能是由于對(duì)似然函數(shù)的主觀估計(jì)發(fā)生了改變;而在實(shí)際研究中很難區(qū)分這兩種情況(Fleming & Daw, 2017; Lau, 2007)。雖然似然比理論認(rèn)為個(gè)體對(duì)似然函數(shù)的主觀估計(jì)和客觀真實(shí)值基本相同(Glanzer et al., 2009, 2019; Semmler et al., 2018),即對(duì)貝葉斯決策理論進(jìn)行了簡(jiǎn)化,但這一假設(shè)受到了其他研究者的質(zhì)疑。因此,本文認(rèn)為,在實(shí)際的信號(hào)檢測(cè)實(shí)驗(yàn)任務(wù)中,經(jīng)典信號(hào)檢測(cè)論(以及該理論提出的報(bào)告標(biāo)準(zhǔn)C)依然是可用于數(shù)據(jù)分析的有效工具。
本文討論的貝葉斯決策理論并不能完整反映個(gè)體在信號(hào)檢測(cè)任務(wù)中的決策機(jī)制。比如,貝葉斯決策理論認(rèn)為,個(gè)體的決策結(jié)果完全基于信號(hào)和噪音出現(xiàn)的后驗(yàn)概率的比值,當(dāng)信號(hào)的后驗(yàn)概率大于噪音時(shí),被試會(huì)將當(dāng)前刺激判斷為信號(hào),反之則判斷為噪音(Burgess, 1985)。然而,在實(shí)際研究中,被試的決策結(jié)果還會(huì)受到與任務(wù)相關(guān)的獎(jiǎng)勵(lì)及懲罰程度的影響。比如,一名司機(jī)在駕駛汽車即將到達(dá)十字路口時(shí),需要快速判斷前方的紅綠燈上目前顯示的是哪種顏色(這里定義綠燈為信號(hào),紅燈為噪音)。在上述的知覺(jué)判斷任務(wù)中,漏報(bào)(即將綠燈判斷為紅燈)并不會(huì)產(chǎn)生非常嚴(yán)重的后果,只會(huì)導(dǎo)致司機(jī)在十字路口多等待一段時(shí)間。然而,虛報(bào)(將紅燈判斷為綠燈)則會(huì)造成嚴(yán)重危害,比如司機(jī)闖紅燈撞到綠燈方向通行的汽車或行人。因此,司機(jī)可能會(huì)采取非常嚴(yán)格的報(bào)告標(biāo)準(zhǔn),即傾向于將紅綠燈上顯示的顏色判斷為紅色(噪音),而這一判別標(biāo)準(zhǔn)與司機(jī)實(shí)際接收的知覺(jué)信息(刺激強(qiáng)度)是相互獨(dú)立的。Green和Swets (1966)指出,當(dāng)不同作答結(jié)果的獎(jiǎng)勵(lì)或懲罰程度不同時(shí),個(gè)體的作答目標(biāo)可能會(huì)從最大化作答正確率(即理想觀察者),轉(zhuǎn)變?yōu)樽畲蠡陨慝@得的獎(jiǎng)勵(lì)或最小化自身所受的懲罰。此時(shí),個(gè)體的最終決策會(huì)同時(shí)基于信號(hào)和噪音成立的后驗(yàn)概率,以及不同的作答反應(yīng)可能導(dǎo)致的后果。
前文提到,貝葉斯決策理論認(rèn)為,個(gè)體在信號(hào)檢測(cè)任務(wù)中給出信心判斷的過(guò)程,可以被視為是在后驗(yàn)概率比值上設(shè)置一組不同的閾限,并將當(dāng)前刺激對(duì)應(yīng)的后驗(yàn)概率比值與每個(gè)閾限值相比較的過(guò)程(Glanzer et al., 2009, 2019; Green & Swets, 1966)。然而,近年來(lái),研究者逐漸認(rèn)識(shí)到,基于刺激強(qiáng)度推理得到的后驗(yàn)概率并不能準(zhǔn)確地反映個(gè)體的信心判斷結(jié)果。這是因?yàn)閭€(gè)體在決策當(dāng)前刺激是信號(hào)還是噪音時(shí)依賴的刺激強(qiáng)度,與信心判斷過(guò)程中使用的信息可能并不完全相同:個(gè)體在信心判斷中可能會(huì)丟失一部分關(guān)于刺激內(nèi)容的信息,也可能基于一些額外的推理過(guò)程獲得更豐富的信息(Hu et al., 2021; Jang et al., 2012; Maniscalco & Lau, 2012; Shekhar & Rahnev, 2021)。為了將信心判斷過(guò)程更好地納入貝葉斯決策理論的框架下,F(xiàn)leming和Daw (2017) 對(duì)傳統(tǒng)的貝葉斯決策理論進(jìn)行了改進(jìn),并在改進(jìn)后的理論中考慮了個(gè)體在決策過(guò)程和信心判斷過(guò)程中利用信息的差異。但是,另一些研究者認(rèn)為,即使考慮了個(gè)體在信心判斷過(guò)程中利用的獨(dú)特信息,信心判斷過(guò)程自身的內(nèi)在機(jī)制可能也與貝葉斯決策理論的觀點(diǎn)并不完全相符(Adler & Ma, 2018; Li & Ma, 2020)。關(guān)于信心判斷對(duì)應(yīng)的內(nèi)在心理過(guò)程是否為貝葉斯決策過(guò)程,目前仍然是一個(gè)存在爭(zhēng)論的話題,需要未來(lái)研究進(jìn)一步探索。
參考文獻(xiàn)
胡傳鵬, 孔祥禎, Wagenmakers, E.-J., Ly, A., 彭凱平(2018). 貝葉斯因子及其在JASP中的實(shí)現(xiàn). 心理科學(xué)進(jìn)展, 26(6), 951-965.
Adler, W. T., & Ma, W. J. (2018). Comparing Bayesian and non-Bayesian accounts of human confidence reports. PLoS Computational Biology, 14(11), e1006572.
Balakrishnan, J. D., & Ratcliff, R. (1996). Testing mod-els of decision making using confidence ratings in clas-sification. Journal of Experimental Psychology: Human Perception and Performance, 22(3), 615-633.
Banks, W. P. (1970). Signal detection theory and human memory. Psychological Bulletin, 74(2), 81-99.
Burgess, A. (1985). Visual signal detection.III.On Bayesian use of prior knowledge and cross correlation. Journal of the Optical Society of America A, 2(9), 1498-1507.
Criss, A. H., & McClelland, J. L. (2006). Differentiating the differentiation models: A comparison of the retrieving effectively from memory model (REM) and the subj-ective likelihood model (SLiM). Journal of Memory and Language, 55(4), 447-460.
Egan, J., Schulman, A. I., & Greenberg, G. Z. (1959). Operating characteristics determined by binary decisions and by ratings. The Journal of the Acoustical Society of America, 31(6), 768-773.
Fleming, S. M., & Daw, N. D. (2017). Self-evaluation of decision-making: A general bayesian framework for metacognitive computation. Psychological Review, 124(1), 91-114.
Glanzer, M., Hilford, A., Kim, K., & Maloney, L. T. (2019). Generality of likelihood ratio decisions. Cognition, 191, 103931.
Glanzer, M., Hilford, A., & Maloney, L. T. (2009). Like-lihood ratio decisions in memory: Three implied regu-larities. Psychonomic Bulletin & Review, 16(3), 431-455.
Green, D. M., & Swets, J. A. (1966). Signal detection theory and psychophysics. Wiley.
Hilford, A., Glanzer, M., Kim, K., & Maloney, L. T. (2019). One mirror effect: The regularities of recognition memory. Memory & Cognition, 47(2), 266-278.
Hilford, A., Maloney, L. T., Glanzer, M., & Kim, K. (2015). Three regularities of recognition memory: The role of bias. Psychonomic Bulletin & Review, 22(6), 1646-1664.
Hu, X., Zheng, J., Su, N., Fan, T., Yang, C., Yin, Y., Fleming, S. M., & Luo, L. (2021). A Bayesian inference model for metamemory. Psychological Review, 128(5), 824-855.
Jang, Y., Wallsten, T. S., & Huber, D. E. (2012). A stoc-hastic detection and retrieval model for the study of met-acognition. Psychological Review, 119(1), 186-200.
Kersten, D., Mamassian, P., & Yuille, A. (2004). Object perception as bayesian inference. Annual Review of Psychology, 55(1), 271-304.
Knill, D. C. (1998). Discrimination of planar surface slant from texture: Human and ideal observers compared. Vision Research, 38(11), 1683-1711.
Lau, H. C. (2007). A higher order Bayesian decision theory of consciousness. Progress in Brain Research, 168, 35-48.
Legge, G. E., Hooven, T. A., Klitz, T. S., Stephen Mansfield, J., & Tjan, B. S. (2002). Mr. Chips 2002: New insights from an ideal-observer model of reading. Vision Rese-arch, 42(18), 2219-2234.
Li, H.-H., & Ma, W. J. (2020). Confidence reports in decision-making with multiple alternatives violate the Bayesian confidence hypothesis. Nature Communications, 11(1), 2004.
Macmillan, N. A., & Creelman, C. D. (2004). Detection theory: A user’s guide. London: Psychology press.
Maloney, L. T., & Zhang, H. (2010). Decision-theoretic models of visual perception and action. Vision Research, 50(23), 2362-2374.
Mamassian, P. (2016). Visual confidence. Annual Review of Vision Science, 2(1), 459-481.
Maniscalco, B., & Lau, H. (2012). A signal detection theo-retic approach for estimating metacognitive sensitivity from confidence ratings. Consciousness and Cognition, 21(1), 422-430.
Mickes, L., Wixted, J. T., & Wais, P. E. (2007). A direct test of the unequal-variance signal detection model of recognition memory. Psychonomic Bulletin & Review, 14(5), 858-865.
Pouget, A., Drugowitsch, J., & Kepecs, A. (2016). Conf-idence and certainty: Distinct probabilistic quantities for different goals. Nature Neuroscience, 19(3), 366-374.
Ratcliff, R., McKoon, G., & Tindall, M. (1994). Empirical generality of data from recognition memory receiver-operating characteristic functions and implications for the global memory models. Journal of Experimental Psychology: Learning, Memory, and Cognition, 20(4), 763-785.
Rotello, C. M. (2017). Signal detection theories of Recog-nition memory. In J. Byrne (Ed.), Learning and Memory: A Comprehensive Reference (Second Edition) (pp. 201-225). Academic Press.
Semmler, C., Dunn, J., Mickes, L., & Wixted, J. T. (2018). The role of estimator variables in eyewitness identification. Journal of Experimental Psychology: Applied, 24(3), 400-415.
Shekhar, M., & Rahnev, D. (2021). The nature of meta-cognitive inefficiency in perceptual decision making. Psychological Review, 128(1), 45-70.
Stretch, V., & Wixted, J. T. (1998). Decision rules for recognition memory confidence judgments. Journal of Experimental Psychology: Learning, Memory, and Cognition, 24(6), 1397-1410.
Tanner, W. P., & Swets, J. A. (1954). A decision-making theory of visual detection. Psychological Review, 61(6), 401-409.
Turner, B. M., Van Zandt, T., & Brown, S. (2011). A dynamic stimulus-driven model of signal detection. Psychological Review, 118(4), 583-613.
Wickens, T. D. (2001). Elementary signal detection theory. New York: Oxford university press.
Wixted, J. T. (2007). Dual-process theory and signaldet-ection theory of recognition memory. Psychological Review, 114(1), 152-176.
Wixted, J. T. (2020). The forgotten history of signal detec-tion theory. Journal of Experimental Psychology: Lea-rning, Memory, and Cognition, 46(2), 201-233.
Wixted, J. T., & Gaitan, S. C. (2002). Cognitive theories as reinforcement history surrogates: The case of likelihood ratio models of human recognition memory. Animal Learning & Behavior, 30(4), 289-305.