• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      屢遭誤用和錯(cuò)批的心理統(tǒng)計(jì)

      2010-07-02 01:27:18溫忠麟
      關(guān)鍵詞:心理學(xué)男孩邏輯

      溫忠麟,吳 艷

      (華南師范大學(xué)心理應(yīng)用研究中心,廣東廣州510631)

      屢遭誤用和錯(cuò)批的心理統(tǒng)計(jì)

      溫忠麟,吳 艷

      (華南師范大學(xué)心理應(yīng)用研究中心,廣東廣州510631)

      統(tǒng)計(jì)在心理學(xué)界屢遭誤解。一方面,經(jīng)常有應(yīng)用工作者誤用統(tǒng)計(jì)方法或者錯(cuò)誤解讀統(tǒng)計(jì)結(jié)果;另一方面,學(xué)術(shù)期刊上不時(shí)有人對(duì)統(tǒng)計(jì)方法本身提出質(zhì)疑和錯(cuò)誤的批評(píng)。對(duì)于誤用,不是很難識(shí)別,但即使受過良好統(tǒng)計(jì)訓(xùn)練的人,對(duì)于錯(cuò)批都難以察覺,導(dǎo)致以訛傳訛。本文從條件概率例子談起,說明概率和統(tǒng)計(jì)是很容易出錯(cuò)的;然后討論零假設(shè)顯著性檢驗(yàn)是如何被誤用和錯(cuò)批的;最后根據(jù)心理測(cè)量發(fā)展的幾個(gè)里程碑,說明統(tǒng)計(jì)是測(cè)量的基礎(chǔ)。本文認(rèn)為,需要使用統(tǒng)計(jì)的心理學(xué)工作者,應(yīng)當(dāng)系統(tǒng)學(xué)習(xí)概率統(tǒng)計(jì)知識(shí)。

      統(tǒng)計(jì);條件概率;顯著性檢驗(yàn);測(cè)量

      半個(gè)多世紀(jì)以來,某些統(tǒng)計(jì)方法及其應(yīng)用在心理學(xué)界備受質(zhì)疑和爭(zhēng)論,特別是零假設(shè)顯著性檢驗(yàn)(null hypothesis significance testing,NHST)。質(zhì)疑文章中,影響最大的要數(shù)1994年Cohen在《American Psychologist》上發(fā)表的文章[1]。有意思的是,從Balluerka等人的綜述可以看出,盡管質(zhì)疑NHST的文章很多,但為NHST辯護(hù)的文章也不少[2]。在心理學(xué)界,類似的質(zhì)疑文章可以分為兩類:一類是糾錯(cuò),指出應(yīng)用工作者對(duì)統(tǒng)計(jì)的誤用和誤解(例見[3,4])。另一類是在糾錯(cuò)的基礎(chǔ)上,進(jìn)而質(zhì)疑統(tǒng)計(jì)本身,對(duì)統(tǒng)計(jì)的邏輯、方法和作用提出挑戰(zhàn)和批評(píng)。第一類質(zhì)疑是有益的,可以幫助應(yīng)用工作者提高統(tǒng)計(jì)知識(shí),少犯低級(jí)錯(cuò)誤;第二類質(zhì)疑既有正確的一面(指出誤用),也有認(rèn)識(shí)不足的地方(導(dǎo)致錯(cuò)批)。辛自強(qiáng)先生的《有關(guān)心理統(tǒng)計(jì)的三個(gè)疑問》一文[5],可以說屬于第二類。本文旨在提供多一些相關(guān)的論點(diǎn),讓讀者參考。

      一、從概率和條件概率談起

      統(tǒng)計(jì)的基礎(chǔ)是概率,例如,有關(guān)對(duì)NHST的討論就會(huì)牽涉到條件概率。如果缺乏概率知識(shí),則很難對(duì)統(tǒng)計(jì)有深刻的理解。概率統(tǒng)計(jì)有一套獨(dú)特的概念和思想方法,需要經(jīng)過系統(tǒng)訓(xùn)練才能掌握。下面先看一個(gè)非常簡(jiǎn)單的涉及概率和條件概率的例子。

      考慮生有兩個(gè)孩子的家庭,兩個(gè)都是男孩的概率多大?直觀來說,有三種可能的結(jié)果:兩個(gè)都是男孩,兩個(gè)都是女孩,一男一女。有人就會(huì)以為,兩個(gè)都是男孩的概率是1/3。稍有概率知識(shí)的人都知道,“一男一女”不是基本事件,而是(男孩,女孩)和(女孩,男孩)的復(fù)合事件。這樣,樣本空間包含下面4個(gè)等可能的基本事件:(男孩,男孩)、(男孩,女孩)、(女孩,男孩)和(女孩,女孩),所以兩個(gè)都是男孩的概率是1/4。

      前面這個(gè)問題還是比較容易理解的,接下來的這個(gè)問題可就難倒很多人了:如果知道其中有一個(gè)是男孩(即兩個(gè)孩子中至少有一個(gè)男孩),兩個(gè)都是男孩的概率多大?這是很簡(jiǎn)單的條件概率問題。很多人會(huì)這樣想:已經(jīng)知道一個(gè)是男孩,另一個(gè)不是男孩就是女孩,各有一半的可能。因此,兩個(gè)都是男孩的概率是1/2。錯(cuò)啦!因?yàn)橹榔渲杏幸粋€(gè)是男孩,所以(女孩,女孩)的可能被排除,這時(shí)的樣本空間包含下面3個(gè)等可能的基本事件:(男孩,男孩)、(男孩,女孩)、(女孩,男孩),所以兩個(gè)都是男孩的概率是1/3。這個(gè)問題是有名的“兩個(gè)孩子問題”[6,7]。

      現(xiàn)在修改上面的問題如下:如果知道其中有一個(gè)是男孩,名字叫建國(guó)①,兩個(gè)都是男孩的概率多大?面對(duì)此問題,大多數(shù)人都會(huì)迷惑:這個(gè)問題和上一個(gè)問題好像沒有什么區(qū)別,兩個(gè)都是男孩的概率應(yīng)當(dāng)還是1/3。又錯(cuò)啦!因?yàn)榇藭r(shí)的樣本空間包含的基本事件為:(建國(guó),男孩)、(建國(guó),女孩)、(男孩,建國(guó))、(女孩,建國(guó)),理論上說都是等可能的,所以兩個(gè)都是男孩的概率是1/2。

      如果說上面的例子還只是難倒普通人的話,下面的例子可是難倒了許多數(shù)學(xué)家,包括有名的數(shù)學(xué)家。

      假設(shè)你在參加一個(gè)游戲節(jié)目,可以在三個(gè)門中選擇一個(gè)。其中一個(gè)門后面是一輛汽車,另外兩個(gè)門后面各是一頭山羊。主持人知道每個(gè)門后面是什么。你的目標(biāo)是選中汽車。你選擇了一個(gè)門之后(例如1號(hào)門,但暫時(shí)不打開),主持人會(huì)打開所剩的兩個(gè)門中的一個(gè)(例如3號(hào)門),并且讓你看到門后面是一頭山羊。然后他對(duì)你說,“你要不要改變選擇,換成2號(hào)門?”

      改變選擇是否更加有利?這個(gè)問題看似非常簡(jiǎn)單,3號(hào)門被主持人打開了,剩下兩個(gè)門,不論是堅(jiān)持選1號(hào)門,還是換成選2號(hào)門,贏輸?shù)臋C(jī)會(huì)不都是一半一半?本文第一作者在英國(guó)Manchester大學(xué)進(jìn)修的時(shí)候,第一堂課老師就提出了這個(gè)問題,作為數(shù)理統(tǒng)計(jì)專業(yè)出身的人,很容易給出正確答案,但沒有想到其他聽課的人(全是大學(xué)數(shù)學(xué)系教師)都認(rèn)為改變選擇與否都一樣。

      這個(gè)問題稱為蒙提霍爾問題(The Monty Hall problem)②,最早出現(xiàn)在蒙提霍爾主持的美國(guó)電視游戲節(jié)目“來做個(gè)交易吧”(Let's Make a Deal),但讓這個(gè)問題出名的是《游行》(Parade)雜志“請(qǐng)問瑪麗蓮”(Ask Marilyn)專欄③。1990年9月9日瑪麗蓮在其專欄中回答這個(gè)問題:改變選擇的勝算機(jī)會(huì)比較大。她隨后收到了上萬封信,指出她錯(cuò)了。其中有上千封信是博士寫的,不少還是數(shù)學(xué)教授,他們特別生氣[6,8]。不相信瑪麗蓮答案的人中還包括二十世紀(jì)數(shù)學(xué)奇才、史上最多產(chǎn)的數(shù)學(xué)家埃爾德什(Paul Erd?s)④,即使有人給了他一個(gè)數(shù)學(xué)證明,他還是不相信。直到有一位同事給他看電腦模擬結(jié)果,他才承認(rèn)自己錯(cuò)了[9]。

      其實(shí),解答蒙提霍爾問題的道理很簡(jiǎn)單:如果你一開始就選對(duì)了汽車所在的門,那么你改變選擇就輸了;如果你一開始選錯(cuò)了,那么你改變選擇就贏了。而一開始就選對(duì)的概率是1/3,選錯(cuò)的概率是2/3。所以改變選擇能贏的概率是2/3。當(dāng)然,還可以通過直觀圖示或者通過條件概率、全概率公式計(jì)算。

      知名電視頻道Discovery通過動(dòng)畫的方式,非常形象地演示了游戲過程。為了讓觀眾容易明白,將3個(gè)門換成了100個(gè)盒子(排成10行10列)。把問題換成,100個(gè)有蓋的盒子,其中一個(gè)放有巧克力。讓你先選擇一個(gè)盒子,然后主持人在剩下的99個(gè)盒子中打開98個(gè)蓋子,里面都是空的,這時(shí)還剩下兩個(gè)盒子。主持人問你:“改變選擇嗎?”這時(shí),改變選擇能贏的概率是99/100。

      實(shí)際應(yīng)用中的許多概率統(tǒng)計(jì)問題遠(yuǎn)遠(yuǎn)不止這么簡(jiǎn)單,但從上述兩個(gè)簡(jiǎn)單的例子應(yīng)當(dāng)可以向讀者傳遞以下信息。

      1.一些概率統(tǒng)計(jì)問題看似簡(jiǎn)單,但其實(shí)很容易出錯(cuò)。我們的大腦生來就不是解決概率問題的料[9]。任何人,如果想正確、適當(dāng)?shù)貞?yīng)用概率統(tǒng)計(jì),系統(tǒng)的學(xué)習(xí)和訓(xùn)練都是不可缺少的。

      2.條件概率問題,問題的條件很重要。問題的背景、看問題的角度、設(shè)問的時(shí)間點(diǎn)、事件發(fā)生的過程等等,都可能是條件的一部分,影響結(jié)果。那些對(duì)NHST的檢驗(yàn)結(jié)果存在錯(cuò)誤解釋的人,很大程度上是不理解條件概率所致。

      3.概率統(tǒng)計(jì)是數(shù)學(xué)的一個(gè)分支,但作為研究隨機(jī)現(xiàn)象的概率統(tǒng)計(jì),與數(shù)學(xué)的其他分支有很不相同的思想方法。數(shù)學(xué)中還沒有其他哪個(gè)領(lǐng)域,比概率問題更容易令專家出錯(cuò)[10]。

      4.無論概率還是統(tǒng)計(jì),都有一套系統(tǒng)的、別的學(xué)科無法取代的思想方法,一個(gè)人不通過系統(tǒng)深入的學(xué)習(xí)和訓(xùn)練,是很難深刻理解的。

      下一節(jié)我們會(huì)看到,像Cohen那樣著名的心理統(tǒng)計(jì)專家,對(duì)NHST的推理邏輯都還理解得不到位。

      二、被誤解和錯(cuò)批的零假設(shè)顯著性檢驗(yàn)

      從數(shù)理統(tǒng)計(jì)的角度看,NHST好好的,沒有什么問題。但因?yàn)槠渲械摹帮@著性”(significance)這個(gè)專業(yè)術(shù)語(yǔ)被許多應(yīng)用工作者誤解了,當(dāng)作日常的術(shù)語(yǔ)去理解和詮釋,使得NHST擔(dān)當(dāng)了不該擔(dān)當(dāng)?shù)慕巧弧爸赜谩边^頭了。另一方面,反對(duì)NHST的人則誤解了它的作用和推理邏輯,把它貶得一文不值。我們有必要還它以本來的面目。

      1.零假設(shè)顯著性檢驗(yàn)方法簡(jiǎn)介

      以兩組均值差異檢驗(yàn)為例。在一個(gè)實(shí)驗(yàn)中,將被試隨機(jī)分為兩組(即兩個(gè)樣本),甲組為實(shí)驗(yàn)組(進(jìn)行實(shí)驗(yàn)處理),乙組為對(duì)照組(不做實(shí)驗(yàn)處理)。對(duì)兩組實(shí)驗(yàn)結(jié)果分別計(jì)算平均值。平均值的差異代表了兩組的整體差異,最基本的問題是,絕對(duì)差異(實(shí)驗(yàn)組-對(duì)照組)有多大?相對(duì)差異[(實(shí)驗(yàn)組-對(duì)照組)/對(duì)照組]有多大?這是小學(xué)算術(shù)就可以解決的問題。然而,樣本是總體中隨機(jī)抽取的,只要樣本不等于總體,每次抽取的樣本可以說是不會(huì)一樣的。即使實(shí)驗(yàn)處理沒有任何效應(yīng),兩組均值也不會(huì)剛好相等(除非巧合),即兩組均值總是有差異的。因此我們希望知道:兩組均值差異不會(huì)僅僅是抽樣引起的波動(dòng)吧?專業(yè)一點(diǎn)的表述是,兩個(gè)樣本來自同一個(gè)總體嗎?如果答案是否定的,就可以說明差異是由實(shí)驗(yàn)效應(yīng)引起的。

      NHST就是用來解決這個(gè)問題的一種統(tǒng)計(jì)方法。零假設(shè)H0通常是無差假設(shè),根據(jù)研究問題的背景確定一個(gè)備擇假設(shè)H1(常見的是單側(cè)區(qū)間或雙側(cè)區(qū)間)。在H0為真的條件下,推出一個(gè)檢驗(yàn)統(tǒng)計(jì)量。兩組均值差異檢驗(yàn)是t統(tǒng)計(jì)量,在指定顯著性水平α(通常是0.05)后,目前統(tǒng)計(jì)教科書介紹的檢驗(yàn)方式主要有下面三種[11]117-119,很容易證明,三種方式做出的檢驗(yàn)結(jié)果完全一致。

      方式1:根據(jù)顯著性水平查出相應(yīng)的t統(tǒng)計(jì)量臨界值(臨界值與H1也有關(guān),單側(cè)區(qū)間時(shí),臨界值的單側(cè)概率為α),如果由樣本計(jì)算的t值超出臨界值,拒絕H0,否則不拒絕H0。這是查統(tǒng)計(jì)表做檢驗(yàn)的年代最常用的方式。

      方式2:由樣本算出t值及其顯著性概率P(也稱為相伴概率,H1是單側(cè)區(qū)間時(shí),使用單側(cè)相伴概率),如果P<α,拒絕H0,否則不拒絕H0。這是使用計(jì)算機(jī)統(tǒng)計(jì)軟件后,最方便的做法。

      方式3:根據(jù)t分布算出兩總體均值差異的置信度為1-α(通常是95%)的置信區(qū)間(confidence interval),如果置信區(qū)間包含0,不拒絕H0,否則拒絕H0。報(bào)告置信區(qū)間可以了解差異大小和范圍,又可以做檢驗(yàn),提供的信息比較多,是當(dāng)今國(guó)際期刊鼓勵(lì)甚至要求的報(bào)告方式[12]。不過,當(dāng)H1是單側(cè)區(qū)間時(shí),報(bào)告置信區(qū)間使用的置信度為1-α,檢驗(yàn)時(shí)使用的置信度則為1-2α(單側(cè)概率為α),不熟悉的人容易出錯(cuò)。

      如果拒絕H0,通常的說法是均值差異顯著;如果不拒絕H0,通常的說法是均值差異不顯著。差異顯著的意思是,根據(jù)所得的樣本數(shù)據(jù)可以在統(tǒng)計(jì)上分辨出差異,這時(shí)應(yīng)當(dāng)將差異報(bào)告出來;差異不顯著未必沒有差異,而是根據(jù)所得的樣本數(shù)據(jù)在統(tǒng)計(jì)上不能分辨出差異。

      假設(shè)檢驗(yàn)和參數(shù)估計(jì)都屬于統(tǒng)計(jì)推斷,它們可以通過判決函數(shù)統(tǒng)一起來[13]。統(tǒng)計(jì)推斷與常規(guī)的推斷不一樣,是一種帶有風(fēng)險(xiǎn)的推斷。無論做出什么結(jié)論(差異顯著或不顯著),都有可能犯錯(cuò)誤。NHST的錯(cuò)誤分為兩類:第一類是H0為真卻被拒絕了(拒真),第一類錯(cuò)誤率就是顯著性水平α;第二類是H0不真卻沒有被拒絕(受偽),第二類錯(cuò)誤率記為β。錯(cuò)誤會(huì)帶來?yè)p失,平均損失就是風(fēng)險(xiǎn)[13]53。雖然根據(jù)現(xiàn)有樣本數(shù)據(jù)做出推斷有風(fēng)險(xiǎn),但與什么都不做所面臨的風(fēng)險(xiǎn)相比,風(fēng)險(xiǎn)會(huì)降低,這就是統(tǒng)計(jì)推斷的生命力所在。

      2.應(yīng)用工作者對(duì)零假設(shè)顯著性檢驗(yàn)的誤解

      從本文第一節(jié)關(guān)于條件概率的簡(jiǎn)單例子中我們已經(jīng)看到,對(duì)條件表述的任何改變,都可能導(dǎo)致很不同的結(jié)果。許多應(yīng)用工作者沒有注意這一點(diǎn),導(dǎo)致各種各樣的低級(jí)錯(cuò)誤。Nickerson根據(jù)過往心理學(xué)和其他社科文獻(xiàn),歸納出10多項(xiàng)關(guān)于NHST的誤解[14]。例如,以為顯著性概率P值是H0為真的概率,1-P值是H1為真的概率;以為顯著性意味著理論上或者實(shí)際應(yīng)用中的重要性;以為α是在已經(jīng)拒絕H0的條件下犯第一類錯(cuò)誤的概率,等等。

      特別是對(duì)于“差異顯著”,很容易被誤解為“差異重要”、“差異大”。為了避免這種錯(cuò)誤,有的統(tǒng)計(jì)著作已經(jīng)將“顯著”改為“有統(tǒng)計(jì)學(xué)意義”了,例如將“差異顯著”改為“差異具有統(tǒng)計(jì)學(xué)意義”[15]。這樣的改動(dòng),對(duì)數(shù)理統(tǒng)計(jì)專業(yè)的人來說,意義可能不大,但對(duì)于一般的應(yīng)用工作者,應(yīng)當(dāng)可以減少誤解的發(fā)生。

      本來,根據(jù)不同的顯著性水平將檢驗(yàn)結(jié)果說成“顯著”(0.05)、“非常顯著”(0.01)是一個(gè)很好的主意,告訴檢驗(yàn)結(jié)果的同時(shí)告知所用的顯著性水平,言簡(jiǎn)意賅。但因?yàn)椤安町惙浅o@著”容易被誤解成“差異非常重要”,所以有人對(duì)這類做法也反感。

      類似的一個(gè)術(shù)語(yǔ)是“接受零假設(shè)”。通常的數(shù)理統(tǒng)計(jì)著述上面會(huì)明說“接受零假設(shè)”,因?yàn)樾袃?nèi)人都知道“接受”背后的含義。例如,中科院院士陳希孺教授所著的、國(guó)內(nèi)非常權(quán)威的《數(shù)理統(tǒng)計(jì)引論》就有這樣的說法:“接受還是拒絕所提的假設(shè)”,這里所提的假設(shè)是指零假設(shè)[13]238。Balluerka等人也使用“接受零假設(shè)”的說法:第二類錯(cuò)誤是“當(dāng)H1為真時(shí)接受H0”[2]。但多數(shù)心理統(tǒng)計(jì)教科書都盡量避免使用“接受零假設(shè)”的說法,可能是擔(dān)心一般的應(yīng)用工作者望文生義,誤解了“接受”的意思。如果只是將“接受零假設(shè)”作為檢驗(yàn)結(jié)論,沒有在解釋結(jié)果時(shí)隨意引申,就不應(yīng)當(dāng)說是錯(cuò)誤的。

      如果用統(tǒng)計(jì)的人都能看懂陳希孺的統(tǒng)計(jì)專著,那么用什么術(shù)語(yǔ)都不要緊,因?yàn)樗麄冎佬g(shù)語(yǔ)的背后發(fā)生了什么事情。

      3.對(duì)零假設(shè)顯著性檢驗(yàn)質(zhì)疑的反駁

      2005年Balluerka等人歸納了文獻(xiàn)上對(duì)NHST的質(zhì)疑和反駁[2]。下面就Cohen(1994)提到的并且后來常被引用的三個(gè)質(zhì)疑[1],談?wù)勎覀兊挠^點(diǎn)。

      質(zhì)疑1:NHST不能提供研究者想要獲得的信息。

      前面說過,NHST的目的是根據(jù)樣本推斷差異是不是僅僅由抽樣引起。如果拒絕了零假設(shè),就可以推斷差異是由實(shí)驗(yàn)效應(yīng)引起的。當(dāng)然,不要忘記了統(tǒng)計(jì)推斷是帶有風(fēng)險(xiǎn)的。從這個(gè)角度看,NHST已經(jīng)提供了我們想要獲得的信息。

      如果研究者希望知道干預(yù)實(shí)驗(yàn)后差異是否足夠大[5],例如設(shè)定差異為10算是足夠大,這時(shí)將H0設(shè)為兩者均值之差等于10,NHST可以給出推斷。不過,如果研究者想要?jiǎng)e的信息,NHST或許真的無能為力。例如,已經(jīng)知道某人HIV檢驗(yàn)結(jié)果為陽(yáng)性,他得艾滋病的可能性多大?這個(gè)問題不能用NHST解決,但那不是NHST的錯(cuò)。比方說吧,一個(gè)人想補(bǔ)充淀粉,而牛奶不能提供,難道就說牛奶有問題,讓大家都不要喝牛奶嗎?

      其實(shí),NHST讓我們知道很多信息,下面僅列出三個(gè)。

      設(shè)想“上帝”手上有一個(gè)沒有任何作用的治療方案(相當(dāng)于H0為真),“發(fā)包”給很多人分別做實(shí)驗(yàn),NHST告訴我們,只有5%左右的實(shí)驗(yàn)會(huì)得到顯著效應(yīng)。這就是犯第一類錯(cuò)誤的含義。

      NHST還告訴我們,當(dāng)檢驗(yàn)結(jié)果是拒絕H0時(shí),可以降低對(duì)H0成立的信心(即提高對(duì)H1成立的信心);當(dāng)檢驗(yàn)結(jié)果不拒絕H0時(shí),則可以提高對(duì)H0成立的信心。Hagen(1997)舉了這樣的例子[17],當(dāng)α=0.05,β=0.6時(shí)(即檢驗(yàn)力為0.4),如果一開始研究者對(duì)H0和H1成立的信心都是50%,那么當(dāng)D*出現(xiàn)時(shí)(即拒絕H0時(shí)),H0成立的概率為:

      最后,用Cortina和Dunlap的觀點(diǎn)來結(jié)束對(duì)質(zhì)疑1的反駁,質(zhì)疑1說的并不反映NHST本身的缺點(diǎn),問題在于它提供的信息如何解釋[18]。

      質(zhì)疑2:零假設(shè)總是錯(cuò)的。

      Cohen(1990)認(rèn)為,零假設(shè)總是錯(cuò)的[19]。他(1994)還引用Tukey(1991)的話:“去問‘A和B的效應(yīng)有不同嗎’是愚蠢的,它們總是不同的——在小數(shù)點(diǎn)后某個(gè)數(shù)位上。”[1,20]

      有幾個(gè)理由讓不少人覺得零假設(shè)總是錯(cuò)的:(1)兩個(gè)樣本的均值總是不同的;(2)哪怕兩個(gè)樣本的均值只有細(xì)小的差異(比如0.2、0.02、0.0002),只要樣本容量N足夠大,檢驗(yàn)結(jié)果就是差異顯著,總能拒絕H0;(3)不斷實(shí)驗(yàn)H0遲早會(huì)被拒絕。

      對(duì)以上理由可以反駁如下。(1)零假設(shè)是對(duì)總體參數(shù)而言,樣本均值有差異,還是可能來自同一個(gè)總體,即H0為真。文獻(xiàn)上就有不少不能拒絕H0的實(shí)驗(yàn)報(bào)告,況且還有更多這樣的實(shí)驗(yàn)因?yàn)闆]有效應(yīng)而沒有發(fā)表,怎么能說零假設(shè)總是錯(cuò)的呢?(2)如果H0確實(shí)是真的,即兩個(gè)總體均值完全相同,抽樣分布理論告訴我們,不論N有多大,拒絕H0的概率還是0.05。不錯(cuò),如果兩個(gè)總體均值有微小的差異,只要N足夠大,總能拒絕H0。不過,如果N很大,兩個(gè)樣本均值的波動(dòng)會(huì)很小,計(jì)算到的均值就很精確,這時(shí)不用檢驗(yàn),看看兩者的絕對(duì)差異和相對(duì)差異,就已經(jīng)可以下結(jié)論了:差異微不足道!這種情況,不用NHST就可以解決問題了,難道也算是NHST的錯(cuò)嗎?(3)根據(jù)小概率的一個(gè)性質(zhì),一個(gè)H0為真的實(shí)驗(yàn)重復(fù)進(jìn)行,H0遲早會(huì)被拒絕,但這與H0總是錯(cuò)是兩碼事。

      總結(jié)一下,當(dāng)你得到兩個(gè)樣本,發(fā)現(xiàn)它們的均值有差異,問問它們的差異是不是由于抽樣引起的,這樣做怎么就“愚蠢”了呢?當(dāng)然,如果一眼就可以判定差異微不足道,確實(shí)沒有必要再問差異是不是由于抽樣引起的,當(dāng)作沒有差異就成了。

      質(zhì)疑3:NHST本身存在邏輯上的漏洞。

      Cohen(1994)描述了NHST的邏輯(簡(jiǎn)稱邏輯A)[1]:

      如果零假設(shè)是正確的,那么這樣的結(jié)果是很不可能的(比如0.05);

      這樣的結(jié)果已經(jīng)出現(xiàn)了,

      因此零假設(shè)很不可能是正確的。

      這是一種帶有概率性質(zhì)的推理。Pollard和Richardson、還有Cohen都舉了例子,說明有時(shí)候這樣的推理結(jié)果完全是錯(cuò)誤的:結(jié)果出現(xiàn)了,但零假設(shè)卻100%正確[1,16]。

      看過Cohen(1994)文章的讀者大概都會(huì)以為NHST的邏輯就是那樣,連反駁他的人,都只是試圖為這種邏輯辯護(hù)。例如,Hagen認(rèn)為邏輯形式正確的論證并不總是合適的;即便一個(gè)論證沒有邏輯上的正確性,也可能是合理的[17]。

      爭(zhēng)論的雙方都沒有能掙脫形式邏輯的桎梏。其實(shí),NHST的邏輯(簡(jiǎn)稱邏輯B)是這樣的:

      如果零假設(shè)是正確的,那么這樣的結(jié)果是很不可能的(0.05);

      一次試驗(yàn)中這樣的結(jié)果不會(huì)出現(xiàn)(小概率原理);

      這樣的結(jié)果已經(jīng)出現(xiàn)了,就推斷零假設(shè)不正確;

      上述推斷可能出錯(cuò)(小概率原理出錯(cuò)),出錯(cuò)率是0.05。

      兩個(gè)邏輯有什么不同?關(guān)鍵在于邏輯B是帶有風(fēng)險(xiǎn)的推理,明說推理可能出錯(cuò),出錯(cuò)率是多少。但邏輯A不帶風(fēng)險(xiǎn),沒有說推理可能出錯(cuò),一個(gè)符合前提條件但零假設(shè)100%正確的例子就成了足以推翻整個(gè)推理邏輯的反例。按照邏輯B,一個(gè)那樣的反例是無能為力的。有興趣的讀者不妨比較并推敲一下,Pollard等人[16]和Cohen[1]的例子可以反駁邏輯A,但不能反駁邏輯B。要反駁邏輯B,需要有一個(gè)這樣的例子:零假設(shè)是正確的,重復(fù)實(shí)驗(yàn)多次,結(jié)果“零假設(shè)不正確”出現(xiàn)的比例“顯著”高出0.05(可見顯著性檢驗(yàn)多重要,否則連這個(gè)反例都不知道如何去描述)。在滿足NHST全部條件的情況下,概率理論告訴我們,不存在這樣的反例。所以,NHST并不存在所謂的邏輯漏洞。

      正如Hagen指出的,Cohen(1994)的那個(gè)例子的假設(shè)和統(tǒng)計(jì)上的假設(shè)不是一回事[17]。在Cohen例子中,H0:被試是正常人,H1:被試是精神病人。首先,在NHST中,不可能對(duì)每一個(gè)被試,判斷是H0真還是H1真,因?yàn)榧僭O(shè)是對(duì)總體而言的。但Cohen的例子,可以對(duì)每一個(gè)被試,判斷是H0真還是H1真。其次,NHST中的被試,不論是來自哪一個(gè)樣本(即不論是實(shí)驗(yàn)組還是對(duì)照組),都生活在同一個(gè)世界,H0和H1中有一個(gè)為真,兩者不會(huì)同時(shí)為真。但Cohen的例子中,正常人來自H0為真的世界,精神病人來自H1為真的世界,兩組被試來自不同的世界。第三,在NHST中,在零假設(shè)為真的前提下,可以得到檢驗(yàn)統(tǒng)計(jì)量的抽樣分布。但在Cohen的例子中,在零假設(shè)為真的前提下(即被試是正常人),不能得到任何抽樣分布的信息。

      Pollard和Richardson的那個(gè)“國(guó)會(huì)議員很不可能是美國(guó)人”的例子[16]也有完全一樣的問題。用這些與NHST風(fēng)馬牛不相及的例子指證NHST的邏輯有漏洞,不知蒙蔽了多少讀者。時(shí)至今日,全世界都還有人引用Cohen(1994)的文章來對(duì)NHST說事,可見其謬論影響之深。

      4.根據(jù)研究目的適當(dāng)?shù)貓?bào)告統(tǒng)計(jì)結(jié)果

      只要問題合適,NHST是有用的。上世紀(jì)末心理學(xué)界“禁止報(bào)告假設(shè)檢驗(yàn)”的聲音可謂甚囂塵上,但美國(guó)心理協(xié)會(huì)(APA)的專責(zé)委員會(huì)Task Force on Statistical Inference(TFSI)沒有同意[12],這自有它的道理。Howard舉了物理學(xué)、宇宙學(xué)、心理學(xué)、地球物理學(xué)等學(xué)科的6個(gè)例子,說明NHST可以有實(shí)質(zhì)性的科學(xué)貢獻(xiàn)[21]。至少可以這樣說,雖然NHST不是什么事情都能解決,但在合適的場(chǎng)合,是有作用的。沒有哪種方法是萬能的,但NHST被廣泛應(yīng)用的事實(shí)告訴我們,NHST真是一個(gè)方法上的重要發(fā)明!

      以差異檢驗(yàn)為例,一種報(bào)告NHST的方式是在報(bào)告差異的基礎(chǔ)上,報(bào)告置信度和置信區(qū)間,并做出是否拒絕H0的檢驗(yàn)結(jié)論。另一種其實(shí)是更加流行的方式,在報(bào)告差異的基礎(chǔ)上,報(bào)告統(tǒng)計(jì)量的值和顯著性概率,并做出是否拒絕H0的檢驗(yàn)結(jié)論。如果后面一種方式能加上差異估計(jì)的標(biāo)準(zhǔn)誤,提供的信息已經(jīng)和前面一種方式的相當(dāng)。

      當(dāng)然,僅僅報(bào)告檢驗(yàn)結(jié)果顯然是不夠的,應(yīng)當(dāng)根據(jù)研究目的報(bào)告更多有用的信息,例如報(bào)告效果量(effect size)。但無論是報(bào)告效果量,還是報(bào)告置信區(qū)間,都不能取代報(bào)告檢驗(yàn)結(jié)果。與各種被定義出來的效果量相比,最易理解并為大家熟知的還是絕對(duì)差異和相對(duì)差異。就是說,無論哪種方式報(bào)告結(jié)果,都應(yīng)當(dāng)認(rèn)真檢視絕對(duì)差異和相對(duì)差異,以判斷是否有實(shí)質(zhì)性差異(substantial difference)出現(xiàn)。以男女職員收入差異為例,在平均月收入只有50元的年代,男女均值相差5元已經(jīng)是實(shí)質(zhì)性差異。但在平均月收入有1 000元的年代,男女均值相差10元也沒有實(shí)質(zhì)性差異。只有當(dāng)差異既有顯著性又有實(shí)質(zhì)性的時(shí)候,才能得出男女收入有差異的結(jié)論。事情就這么簡(jiǎn)單,只要做做算術(shù),也就不會(huì)將“差異顯著”理解為“差異重要”、“差異大”之類的了。不過,因?yàn)樾睦韺W(xué)研究中的許多變量缺少有實(shí)際意義的單位,所以報(bào)告效果量比較合適。效果量同時(shí)反映了差異和取樣波動(dòng),可以更好地衡量實(shí)驗(yàn)效應(yīng)。

      或許有人會(huì)問,多大的差異才算有實(shí)質(zhì)性差異?相似的問題還有,效果量多大才算有效應(yīng)?如果要回答這樣的問題,又得兜回NHST的邏輯和做法:確定臨界值,根據(jù)樣本結(jié)果對(duì)總體做出推斷。報(bào)告效果量也好,報(bào)告置信區(qū)間也好,是可以增加信息(所以值得提倡),但如果想取代NHST,還是逃不脫NHST的邏輯。

      三、統(tǒng)計(jì)是測(cè)量的基礎(chǔ)

      1.心理統(tǒng)計(jì)關(guān)鍵在于應(yīng)用適當(dāng)

      “心理量能不能做統(tǒng)計(jì)”[5],這個(gè)問題意義不大,因?yàn)榇鸢甘强隙ǖ模澜绮恢卸嗌偃嗽趶氖逻@項(xiàng)工作。能不能是一回事,好不好是另一回事。有意義的問題應(yīng)當(dāng)是:“不同的心理量如何統(tǒng)計(jì)才是適當(dāng)?shù)???/p>

      是的,統(tǒng)計(jì)經(jīng)常被濫用和誤用,主要原因還是應(yīng)用工作者的統(tǒng)計(jì)知識(shí)不足。如果真正理解統(tǒng)計(jì),教科書上說的有些不能的事情卻是可以進(jìn)行的。例如,“性別”是類別變量,屬于最低級(jí)別了,不能計(jì)算平均值。但如果將“男”編碼為1,“女”編碼為0,對(duì)性別計(jì)算平均值,正好就是男被試所占的比例。當(dāng)然,如果此時(shí)仍然將平均值按通常的變量均值理解,是錯(cuò)誤的。又如,要計(jì)算數(shù)學(xué)成績(jī)與性別的相關(guān)系數(shù),許多教科書上說要按點(diǎn)二列相關(guān)公式計(jì)算,其實(shí)直接求數(shù)學(xué)成績(jī)與性別(按上面的方法編碼)的皮爾遜相關(guān)系數(shù),結(jié)果和按點(diǎn)二列相關(guān)公式計(jì)算的相同。實(shí)際上,只有兩個(gè)取值的類別變量,在0-1編碼后,就可以作為等距變量進(jìn)行運(yùn)算了。這種變量的取值只有一個(gè)距離,自然是等距的。

      對(duì)5點(diǎn)或以上的心理量表(或類似量表)得到的變量當(dāng)作等距變量處理,是國(guó)際上包括心理學(xué)在內(nèi)的社科研究的通行做法。針對(duì)這種情況,溫忠麟的統(tǒng)計(jì)書特別指出,“在心理與教育統(tǒng)計(jì)中,習(xí)慣上經(jīng)常將量表題目測(cè)量的數(shù)據(jù)當(dāng)作尺度測(cè)量數(shù)據(jù)來分析,特別是間隔均勻的五點(diǎn)以上量表。”[11]12過往的實(shí)踐表明,這種做法行之有效,根據(jù)統(tǒng)計(jì)結(jié)果發(fā)現(xiàn)了(或者驗(yàn)證了)許多集體性規(guī)律,并且在實(shí)踐中得到檢驗(yàn)。例如,1980年代中期著名教育心理學(xué)家馬什(HerbertW.Marsh)在自我概念研究中得到的內(nèi)外參照模型(internal/external frame of reference model)[22]、大魚小塘效應(yīng)(big-fish-little-pond effect)[23,24]等,就是將量表數(shù)據(jù)當(dāng)作等距數(shù)據(jù)進(jìn)行分析得到驗(yàn)證的,得到國(guó)際上普遍認(rèn)同。

      這樣理解吧,一方面,像溫度那樣的等距變量,也不是一開始有溫度測(cè)量就是等距的,而是有一個(gè)發(fā)展過程;另一方面,當(dāng)人們面對(duì)“完全不同意—完全同意”那樣的5級(jí)記分量表時(shí),很多人的心目中會(huì)習(xí)慣地將其中的“1、2、3、4、5”當(dāng)作是等距的分?jǐn)?shù)來回應(yīng)問卷(利用項(xiàng)目反應(yīng)理論可以知道被試心目中是不是這樣)。但如果面對(duì)的答案是“優(yōu)、良、中、差”,人們心目中可能就難有等距的意識(shí)了,可見如何設(shè)計(jì)量表很重要。

      按神經(jīng)語(yǔ)言程序?qū)W(NLP)的一個(gè)信念來說就是,有效用(比只是強(qiáng)調(diào)道理)更重要[25]。所以,我們一方面要反對(duì)濫用統(tǒng)計(jì);另一方面,一些行之有效、在國(guó)際上流行的做法,還是可以照跟的吧。

      2.測(cè)量學(xué)的突破有賴統(tǒng)計(jì)學(xué)和其他學(xué)科的進(jìn)步

      大家知道,研究物質(zhì)世界和研究精神世界是很不同的,研究自然科學(xué)和研究社會(huì)科學(xué)也很不同。所以,要求心理測(cè)量和物理測(cè)量一樣精確是不現(xiàn)實(shí)的。沒錯(cuò),對(duì)心理的測(cè)量是間接的、推測(cè)式的。但絕大多數(shù)的物理測(cè)量不也是間接的嗎?就說溫度吧,使用水銀溫度計(jì)測(cè)量,測(cè)量到的是水銀柱的高度,不是溫度本身。從十六世紀(jì)最早的溫度計(jì)出現(xiàn)以來,有煤油溫度計(jì)、酒精溫度計(jì)、水銀溫度計(jì)、氣體溫度計(jì)、電阻溫度計(jì)、溫差電偶溫度計(jì)、輻射溫度計(jì)和光測(cè)溫度計(jì)等等。從中我們可以總結(jié)出:(1)測(cè)量通常不是直接的,而是根據(jù)一定的法則(如熱脹冷縮原理),對(duì)事物的特征進(jìn)行間接度量。(2)測(cè)量工具不是一下子就很完美,而是有賴于其他學(xué)科的發(fā)展(如電子學(xué)、光學(xué))帶來測(cè)量方法的改進(jìn)。

      心理測(cè)量也有相似之處。心理測(cè)量的每一次重大進(jìn)展,都離不開統(tǒng)計(jì)的發(fā)展和其他學(xué)科(如計(jì)算機(jī))的進(jìn)步。

      100年前,因子分析的發(fā)明是心理測(cè)量的重要里程碑。斯皮爾曼(Charles Spearman)率先使用的因子分析,可以說是心理學(xué)家對(duì)統(tǒng)計(jì)學(xué)的最大貢獻(xiàn)。時(shí)至今日,因子分析對(duì)心理測(cè)量的影響有增無減。后來發(fā)展的驗(yàn)證性因子分析(更一般的是結(jié)構(gòu)方程分析),對(duì)量表的設(shè)計(jì)、修訂和評(píng)價(jià)有非常重要的作用,包括:(1)驗(yàn)證題目與因子的從屬關(guān)系;(2)驗(yàn)證量表的維度;(3)驗(yàn)證量表的結(jié)構(gòu);(4)評(píng)估測(cè)驗(yàn)的構(gòu)想效度;(5)評(píng)估測(cè)驗(yàn)的信度;(6)同屬、等價(jià)和平行測(cè)驗(yàn)的檢驗(yàn)[26,27]??梢赃@樣說,一個(gè)人如果不會(huì)使用因子分析,很難做出一套好的心理量表。

      項(xiàng)目反應(yīng)理論(IRT)的出現(xiàn),是心理測(cè)量的又一個(gè)里程碑,通過數(shù)學(xué)模型,可以將被試的潛在特質(zhì)估計(jì)出來。IRT在能力測(cè)驗(yàn)和人才選拔等方面有重要作用。然而,如果沒有概率和統(tǒng)計(jì)學(xué)的進(jìn)步(如EM算法等的出現(xiàn))和計(jì)算機(jī)的發(fā)展,IRT只能是紙上談兵。

      磁共振和腦成像技術(shù),很可能帶來心理測(cè)量的一場(chǎng)革命。有腦部的圖像了,夠“直接”吧,但那不過是腦部生理現(xiàn)象的反映,要想從中讀出“心理”,還需要發(fā)現(xiàn)各種“生理—心理法則”和相關(guān)模型。更重要的是,隨之而來的是巨量的數(shù)據(jù),有待出現(xiàn)更強(qiáng)大有力的數(shù)據(jù)分析工具,以獲取數(shù)據(jù)堆中的心理信息。說不定,許多心理特質(zhì)就在圖像里、數(shù)據(jù)堆里,等著新的方法去發(fā)掘呢。隨著腦成像技術(shù)的進(jìn)步和統(tǒng)計(jì)技術(shù)的發(fā)展,心理測(cè)量有可能變得相對(duì)直接起來。

      綜上所述,心理測(cè)量的發(fā)展離不開心理統(tǒng)計(jì)和其他學(xué)科的發(fā)展。如果說,能夠帶來根本意義上的心理學(xué)研究范式革命的是測(cè)量學(xué)[5],那么,能帶來測(cè)量學(xué)范式革命的是測(cè)量以外的學(xué)科,包括統(tǒng)計(jì)學(xué)和光、電、磁技術(shù)。

      無可否認(rèn),心理學(xué)工作者的根本任務(wù)是研究心理,包括解決心理測(cè)量問題。為了解決心理測(cè)量問題,心理學(xué)工作者應(yīng)當(dāng)具備良好的統(tǒng)計(jì)基礎(chǔ)。這就好比一個(gè)木匠,他的任務(wù)是做家具,但他必須熟練掌握要用到的工具。

      四、權(quán)當(dāng)結(jié)語(yǔ)

      統(tǒng)計(jì)學(xué)對(duì)科學(xué)的作用和貢獻(xiàn),應(yīng)當(dāng)不是心理學(xué)界討論的事情。用社會(huì)學(xué)家一個(gè)所謂的“科學(xué)環(huán)”模型(見文獻(xiàn)[5]),既不能說明統(tǒng)計(jì)對(duì)科學(xué)研究有多重要,也不能說明統(tǒng)計(jì)對(duì)科學(xué)研究并非必要。將統(tǒng)計(jì)方法和科學(xué)方法論中的方法相提并論,沒有什么意義,那是不同層次的概念。那個(gè)“科學(xué)環(huán)”模型不能說明微分方程、代數(shù)學(xué)對(duì)科學(xué)研究是否必要,自然也說明不了統(tǒng)計(jì)對(duì)科學(xué)研究是否必要。

      統(tǒng)計(jì)學(xué)遠(yuǎn)遠(yuǎn)不止心理學(xué)工作者理解的那一些。統(tǒng)計(jì)學(xué)在科學(xué)研究中誕生成長(zhǎng),已經(jīng)成為自然科學(xué)和社會(huì)科學(xué)研究不可缺少、不可替代的一種方法。統(tǒng)計(jì)學(xué)在熱力學(xué)、量子力學(xué)、人口學(xué)、流行病學(xué)等科學(xué)領(lǐng)域的作用,大概許多人都聽說過吧。所以,任何否定統(tǒng)計(jì)在科學(xué)研究中作用的論點(diǎn)是站不住腳的。

      數(shù)理統(tǒng)計(jì)工作者和心理學(xué)工作者的關(guān)系,可以比擬為鐵匠和木匠的關(guān)系。鐵匠制造了各種各樣的工具,如斧頭、鋸子和刨子等,但鐵匠的關(guān)注點(diǎn)不是在具體場(chǎng)合如何使用這些工具。木匠如果要做一張漂亮的桌子,不僅需要知道桌子式樣和尺寸,而且要能嫻熟地使用工具。木匠可以不制造工具,但使用工具那是木匠的事情。同理,心理學(xué)工作者可以不用發(fā)展統(tǒng)計(jì)方法(不過有不少統(tǒng)計(jì)方法是因?yàn)樾睦碛?jì)量的需要而產(chǎn)生的),但使用心理統(tǒng)計(jì)那是心理學(xué)工作者的事情。好端端的NHST為什么有那么多的誤解和誤用,主要原因是部分心理學(xué)工作者的統(tǒng)計(jì)知識(shí)不夠。一個(gè)心理學(xué)工作者,需要使用統(tǒng)計(jì)卻不好好學(xué)習(xí)統(tǒng)計(jì),等到要用的時(shí)候找數(shù)學(xué)系的人幫忙,就像木匠要做家具用到鋸子的時(shí)候卻不會(huì)用,找鐵匠幫忙,行不通吧?

      確實(shí),有些心理學(xué)家不懂統(tǒng)計(jì),照樣可以成為一流的心理學(xué)家。但如果心理學(xué)工作者需要使用統(tǒng)計(jì)的話,系統(tǒng)的學(xué)習(xí)和訓(xùn)練是必要的。不少心理學(xué)工作者,只學(xué)了一些基本的統(tǒng)計(jì)知識(shí),就開始應(yīng)用了,出現(xiàn)誤用的情況,正說明還應(yīng)當(dāng)加強(qiáng)統(tǒng)計(jì)的訓(xùn)練。即使是對(duì)統(tǒng)計(jì)很在行的人,如果要批評(píng)統(tǒng)計(jì)方法本身,也應(yīng)當(dāng)小心,以免造成類似于錯(cuò)批NHST的那種情況。如果說統(tǒng)計(jì)學(xué)有“錯(cuò)”,那就“錯(cuò)”在經(jīng)常讓人錯(cuò)了還不知道。

      注 釋:

      ① 據(jù)2009年9月30日《法制晚報(bào)》網(wǎng)站報(bào)道,全國(guó)有97萬多男性叫建國(guó)。http://www.fawan.com/Article/Print.asp?ArticleID=242858

      ② http://en.wikipedia.org/wiki/Monty_Hall_problem

      ③ http://www.parade.com/askmarilyn/

      ④ 希望了解埃爾德什的讀者,可參閱[美]霍夫曼著、米緒軍等譯的《數(shù)字情種——埃爾德什傳》(上??萍冀逃霭嫔?,2000年版)。

      [1] COHEN J.The Earth is Round(p<.05).American Psychologist,1994,49(12):997-1003.

      [2] BALLUERKA N,GóMEZ J,HIDALGO D.The Controversy over Null Hypothesis Significance Testing Revisited.Methodology.2005,1(2):55-70.

      [3] 邊玉芳.警惕心理學(xué)研究中的統(tǒng)計(jì)誤用.心理科學(xué)進(jìn)展,2002,10(4):447-452.

      [4] 陳啟山.心理學(xué)研究中應(yīng)用統(tǒng)計(jì)方法應(yīng)注意的幾個(gè)問題.心理與行為研究,2006,4(3):200-206.

      [5] 辛自強(qiáng).有關(guān)心理統(tǒng)計(jì)的三個(gè)疑問.華南師范大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2010,(1):39-46.

      [6] MLODINOW L.The Drunkard'sWalk:How Randomness Rules Our Lives.New York:Knopf Publishing Group,2008.

      [7] FOX CR,LEVAV J.Partition-edit-count:Naive Extensional Reasoning in Judgment of Conditional Probability.Journal of Experimental Psychology-General,2004,133(4):626-642.

      [8] POSNER G P.Nation's Mathematicians Guilty of“Innumeracy”.Skeptical Inquirer,1991,15(4):342-345.

      [9] SCHECHTER B.My Brain is Open:The Mathematical Journey of Paul Erd?s.New York:Touchstone,1998.

      [10] GARDNER M.Mathematical Games.Scientific American,1959,10:180-182.

      [11] 溫忠麟.心理與教育統(tǒng)計(jì).廣州:廣東高等教育出版社,2006.

      [12] WILKINSON L,The Task Force on Statistical Inference.Statistical Methods in Psychology Journals:Guidelines and Explanations.American Psychologist,1999,54(8):594-604.

      [13] 陳希孺.數(shù)理統(tǒng)計(jì)引論.北京:科學(xué)出版社,1981.

      [14] NICKERSON R S.Null Hypothesis Significance Testing:A Review of an Old and Continuing Controversy.Psychological Methods,2000,5(2):241-301.

      [15] 張厚璨,徐建平.現(xiàn)代心理與教育統(tǒng)計(jì)學(xué)(第3版).北京:北京師范大學(xué)出版社,2009.

      [16] POLLARD P,RICHARDSON JT E.On the Probability of Making Type IErrors.Psychological Bulletin,1987,102(1):159-163.

      [17] HAGEN R L.In Praise of the Null Hypothesis Statistical Test.American Psychologist,1997,52(1):15-24.

      [18] CORTINA JM,DUNLAPW P.On the Logic and Purpose of Significance Testing.Psychological Methods,1997,2(2):161-172.

      [19] COHEN J.Things IHave Learned(So Far).American Psychologist,1990,45(12):1304-1312.

      [20] TUKEY JW.The Philosophy of Multiple Comparisons.Statistical Science,1991,6:100-116.

      [21] WAINER H.One Cheer for Null Hypothesis Significance Testing.Psychological Methods,1999,4(2):212-213.

      [22] MARSH H W.Verbal and Math Self-Concepts:An Internal/External Frame of Reference Model.American Educational Research Journal,1986,23(1):129-146.

      [23] MARSH H W.The Big-fish-little-pond Effect on Academic Self-concept.Journal of Educational Psychology,1987,79(3):280-295.

      [24] MARSH H W,HAU K T.Big Fish Little Pond Effect on Academic Self-Concept:A Cross-Cultural(26 country)Test of the Negative Effects of Academically Selective Schools.American Psychologist,2003,58:364-376.

      [25] 李中瑩.NLP-幫助人生變得更成功快樂的學(xué)問.香港:專業(yè)效能管理出版社,2001.

      [26] 侯杰泰,溫忠麟,成子娟.結(jié)構(gòu)方程模型及其應(yīng)用.北京:教育科學(xué)出版社,2004.

      [27] BOLLEN K A.Structural Equations with Latent Variables.New York:Wiley,1989.

      【責(zé)任編輯:王建平】

      B841

      A

      1000-5455(2010)01-0047-08

      2009-10-26

      溫忠麟(1960—),男,廣東五華人,華南師范大學(xué)心理應(yīng)用研究中心教授、博士生導(dǎo)師;吳艷(1980—),女,湖南漣源人,華南師范大學(xué)心理應(yīng)用研究中心博士研究生.

      猜你喜歡
      心理學(xué)男孩邏輯
      刑事印證證明準(zhǔn)確達(dá)成的邏輯反思
      法律方法(2022年2期)2022-10-20 06:44:24
      邏輯
      創(chuàng)新的邏輯
      男孩的『自信缺失癥』
      男孩今年六十歲
      北極光(2019年12期)2020-01-18 06:22:18
      爆笑心理學(xué)
      爆笑心理學(xué)
      爆笑心理學(xué)
      爆笑心理學(xué)
      女人買買買的神邏輯
      37°女人(2017年11期)2017-11-14 20:27:40
      文安县| 米林县| 斗六市| 峡江县| 连云港市| 安仁县| 伊金霍洛旗| 社旗县| 武安市| 海阳市| 邵阳市| 永靖县| 恭城| 东至县| 绿春县| 额尔古纳市| 铅山县| 双城市| 华安县| 高阳县| 双城市| 舟山市| 隆化县| 汉沽区| 天门市| 栖霞市| 延庆县| 玉林市| 安陆市| 修水县| 永兴县| 徐州市| 大邑县| 永靖县| 靖宇县| 伊宁县| 辽阳市| 江津市| 兴隆县| 清水县| 获嘉县|