黃成毅 周海霞
摘 要:初涉研究的大學(xué)生容易淪為追“星”族,在畢業(yè)論文中過(guò)分強(qiáng)調(diào)統(tǒng)計(jì)學(xué)意義上的顯著性,常使用“邊緣顯著”來(lái)掩蓋研究中的所謂不完美。本文力求從教學(xué)的角度,分析其教學(xué)邏輯、提煉教學(xué)要點(diǎn),為研究方法類(lèi)課程的老師提供教學(xué)參考,以幫助學(xué)生理清“邊緣顯著”的實(shí)質(zhì),樹(shù)立正確的假設(shè)檢驗(yàn)觀。
關(guān)鍵詞:邊緣顯著;假設(shè)檢驗(yàn);α值
引 言
假設(shè)檢驗(yàn)對(duì)犯I型錯(cuò)誤的概率α取值標(biāo)準(zhǔn)歷來(lái)爭(zhēng)議很大。為什么α不能是0.06而選擇了0.05,兩者有質(zhì)的差別么?Rosnow(1989)就曾指出,其實(shí)上帝愛(ài)0.06就像愛(ài)0.05一樣多。在一次判斷中α的標(biāo)準(zhǔn)顯然只能有一個(gè),學(xué)界公認(rèn)的0.05為拒絕H0的臨界值,為什么現(xiàn)在大量研究又將其寬限到0.10甚至更大值?這可謂實(shí)踐中“游動(dòng)的α”(Goodman, 1993)。隨著“邊緣顯著”說(shuō)法的興起,學(xué)術(shù)新人更容易標(biāo)準(zhǔn)游離。因此,這需要我們?nèi)チ私猞恋?.05和0.10取值的前世今生,在教學(xué)中理清思路和要點(diǎn),以幫助學(xué)生在研究中顯著性水平的合理選擇和表達(dá)。
一、理清顯著性檢驗(yàn)中P和α的關(guān)系
首先,學(xué)生容易將P和α兩者混淆,因?yàn)槎咴诩僭O(shè)檢驗(yàn)中有等價(jià)的功效,而它們最終又都與是否拒絕H0相關(guān),所以二者含義應(yīng)該一致。其實(shí),F(xiàn)isher的p<0.05和Neyman-Pearson的α=0.05中的共同數(shù)值0.05,二者的理論來(lái)源相異,含義不同。數(shù)α稱為顯著性水平,而p值是顯著性概率。從理論來(lái)源來(lái)看,α與N-P的假設(shè)檢驗(yàn)理論相關(guān)聯(lián),p則與Fisher的顯著性檢驗(yàn)理論相聯(lián)系(鮑貴,席雁,2010)。因此,教學(xué)中應(yīng)先澄清兩者的關(guān)系。
二、簡(jiǎn)述0.05顯著標(biāo)準(zhǔn)的歷史由來(lái)
Fisher被認(rèn)為是正式提出這一統(tǒng)計(jì)顯著性標(biāo)準(zhǔn)的人。他在1925年《研究者的統(tǒng)計(jì)方法》一書(shū)中首次將0.05作為具有統(tǒng)計(jì)顯著意義的最大可接受值,但他在1926年《田間試驗(yàn)的安排》一文中又承認(rèn)確實(shí)可用其它值來(lái)判斷顯著性。他也曾指出,沒(méi)有一個(gè)科研工作者擁有一個(gè)年復(fù)一年,在所有情況下用來(lái)拒絕虛無(wú)假設(shè)的固定顯著性水平,更應(yīng)關(guān)注現(xiàn)實(shí)的證據(jù)和自己的想法。所以,這種規(guī)定和劃分并沒(méi)有一種絕對(duì)的算法和理論,甚至還帶有一定的主觀估計(jì)性,但一個(gè)合適的概率值被大家認(rèn)可為是“不太可能發(fā)生”事件,且有一位權(quán)威的數(shù)學(xué)家正式地提出,那么這種值更容易被接受、延用而成為慣例。但這種“非絕對(duì)唯一性”就隱含著日后出現(xiàn)另一“合理范圍取值”的可能性。正如越來(lái)越多研究者在接受的“邊緣顯著”這一說(shuō)法。
三、引發(fā)邊緣顯著“合理性”的質(zhì)疑
α=0.05仍是最被認(rèn)可的臨界值,但研究者很容易被這一值所困擾,特別是所得P值只是略大于它時(shí)。其實(shí)P值很容易受到樣本量、標(biāo)準(zhǔn)差的影響,但通常研究者又不愿意再耗精力去擴(kuò)大樣本或多次研究。這種愛(ài)恨交加下,“邊緣顯著”的出現(xiàn)似乎有它的必然性。雖然研究者不應(yīng)該迷信和固守于慣例中的顯著性水平,但有學(xué)者也指出,嚴(yán)格意義上講,統(tǒng)計(jì)中只有顯著和不顯著兩種結(jié)果,加上極其或邊緣這樣的修飾語(yǔ)是不合適的,即使0.05這個(gè)值顯得有些武斷,但這個(gè)值還是相對(duì)寬松的(Dawn Iacobucci, 2005)。即便允許有高于0.05的水平設(shè)置,但也不應(yīng)該出現(xiàn)“邊緣顯著”這樣的概念。若將這種決斷權(quán)部分移交給研究者,必然會(huì)引來(lái)新的麻煩。如果接受這一發(fā)展趨勢(shì),其容忍的度跟0.05這一標(biāo)準(zhǔn)一樣,也會(huì)引發(fā)爭(zhēng)議。
四、明確當(dāng)前“邊緣顯著”的容忍度
最早對(duì)于0.10這一標(biāo)準(zhǔn)可上溯到20世紀(jì)初。Kendall(1914)曾指出:“想像一下如果我們接受了P=0.01,無(wú)論在什么情況下我們都可以采用這條分界線么?這一概率多大程度會(huì)對(duì)研究者的決斷產(chǎn)生影響更多取決于研究者的謹(jǐn)慎程度了。有些人會(huì)認(rèn)為這個(gè)概率已足以說(shuō)明問(wèn)題,其他人則可能更保守而需要更小的值,這是一種個(gè)人的取向。
目前邊緣顯著通常用在P值大于0.05,但其值又不超過(guò)0.10時(shí)。例如,通過(guò)對(duì)中國(guó)知網(wǎng)期刊和學(xué)位數(shù)據(jù)庫(kù)(2000年后)的搜索,共匯集80篇(國(guó)內(nèi))心理學(xué)論文。其中共有7篇論文對(duì)“邊緣顯著”的劃定不在0.05至0.10的范圍(最小為0.048,最大為0.11)。但國(guó)外有報(bào)告指出有一例研究的P值達(dá)到0.24,但仍將兩組差異歸為邊緣顯著(Dar, etal., 1994)。顯然,研究者的這種寬容態(tài)度不可取。
五、增強(qiáng)P值大于0.05時(shí)的理智感
出現(xiàn)“邊緣顯著”的字樣,不管他的α取值是如何的“邊緣”,都應(yīng)該視他拒絕了H0。而讀者則更要關(guān)注研究者是否結(jié)合效應(yīng)量來(lái)輔助說(shuō)明他的最終結(jié)論,尤其不能將“邊緣顯著”理解為變量間的關(guān)聯(lián)或差異“有些顯著”或者“快要顯著了”。這種“邊緣”本就是相對(duì)于傳統(tǒng)的α最大可接受值0.05而言的。
不管用邊緣、趨向,還是接近、幾乎顯著,都應(yīng)該報(bào)告P值、樣本量等,并對(duì)為什么在此研究中接受邊緣顯著作出說(shuō)明,尤其要報(bào)告效應(yīng)量進(jìn)行合理分析。在討論結(jié)果時(shí)還可以考慮作方向性的描述,不簡(jiǎn)單跟從統(tǒng)計(jì)的冰冷數(shù)字作“全或無(wú)”的判斷,為讀者傳達(dá)出更有啟示性的建議,并有后續(xù)研究的改進(jìn)措施,推動(dòng)達(dá)成更可靠的結(jié)論。這些是老師在作為學(xué)生研究引路人之初,以“邊緣”顯著為契機(jī),理應(yīng)筑牢的科學(xué)態(tài)度。
參考文獻(xiàn)
[1] Rosnow, Ralph L. Robert Rosenthal, Statistical Procedures and the Justification of Knowledge in Psychological Science[J]. American Psychologist, 1989,44(10): 1276-1284.
[2] Goodman, S.N.p values, hypothesis tests, and likelihood: Implications for epidemiology of a neglected historical debate[J].American Journal of Epidemiology, 1993, 137, 485-496.
[3] 鮑貴,席雁.統(tǒng)計(jì)顯著性檢驗(yàn):?jiǎn)栴}與思考[J].南京工程學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版),2010,10(04):27-32.
[4] Fisher R A . Theory of Statistical Estimation[J]. Mathematical Proceedings of the Cambridge Philosophical Society, 1925, 22:700-725.
[5] Kendall, & Maurice G. (0). An introduction to the theory of statistics[M]. Charles Griffin,1914.
[6] Dar R , Serlin R C , Omer H . Misuse of statistical test in three decades of psychotherapy research[J]. Journal of Consulting & Clinical Psychology, 1994, 62(1):75-82.
基金項(xiàng)目:重慶三峽學(xué)院高等教育教學(xué)改革研究項(xiàng)目(JGYB2008)。