華北理工大學(xué)外國(guó)語(yǔ)學(xué)院 秦學(xué)鋒 吳 艷 呂 黛
?
語(yǔ)塊對(duì)英語(yǔ)寫作影響的效應(yīng)量研究
華北理工大學(xué)外國(guó)語(yǔ)學(xué)院 秦學(xué)鋒 吳 艷 呂 黛
摘 要:基于假設(shè)檢驗(yàn)的統(tǒng)計(jì)分析只能回答研究效應(yīng)是否存在。效應(yīng)量是評(píng)價(jià)研究效果真實(shí)大小和意義的統(tǒng)計(jì)指標(biāo)。本文在8個(gè)語(yǔ)塊對(duì)英語(yǔ)寫作影響的研究結(jié)果基礎(chǔ)上,通過(guò)計(jì)算效應(yīng)量,分析、解釋每個(gè)研究的效應(yīng)量大小和實(shí)際意義。效應(yīng)量在外語(yǔ)研究中的使用有利于科學(xué)評(píng)價(jià)研究的真實(shí)效果。
關(guān)鍵詞:效應(yīng)量 實(shí)際意義 語(yǔ)塊 英語(yǔ)寫作
近年來(lái),語(yǔ)塊在提高英語(yǔ)學(xué)習(xí)者寫作中的作用引起了國(guó)內(nèi)外語(yǔ)教師和研究者的重視。一些學(xué)者圍繞語(yǔ)塊對(duì)英語(yǔ)寫作的影響開(kāi)展了實(shí)證研究,結(jié)果顯示使用語(yǔ)塊能夠促進(jìn)語(yǔ)言表達(dá)的流利性、準(zhǔn)確性和得體性,從而有效提高學(xué)習(xí)者的外語(yǔ)寫作水平。然而,這些研究結(jié)果主要依據(jù)了假設(shè)檢驗(yàn)的統(tǒng)計(jì)學(xué)顯著性結(jié)果。由于假設(shè)檢驗(yàn)的顯著性結(jié)果受樣本大小的影響較大,其結(jié)果達(dá)到統(tǒng)計(jì)學(xué)意義上的顯著性(statistical significance),并不能代表實(shí)際效果的顯著性(practical significance)。對(duì)此,國(guó)內(nèi)外學(xué)者提出,在運(yùn)用假設(shè)檢驗(yàn)的基礎(chǔ)上,單個(gè)實(shí)證研究必須計(jì)算、報(bào)道研究結(jié)果的效應(yīng)量(effect sizes,es),為評(píng)估研究效果的真實(shí)效應(yīng)大小提供科學(xué)依據(jù)。
通過(guò)分析國(guó)內(nèi)語(yǔ)塊對(duì)英語(yǔ)寫作影響的實(shí)證研究文獻(xiàn)發(fā)現(xiàn),國(guó)內(nèi)學(xué)者的研究結(jié)果中尚沒(méi)有對(duì)效應(yīng)量的計(jì)算和報(bào)道。因此,本文將以國(guó)內(nèi)語(yǔ)塊對(duì)英語(yǔ)寫作影響的實(shí)證研究為例,在所報(bào)道的數(shù)據(jù)基礎(chǔ)上進(jìn)一步計(jì)算,呈現(xiàn)研究結(jié)果的效應(yīng)量,以期引起國(guó)內(nèi)外語(yǔ)教學(xué)研究領(lǐng)域?qū)π?yīng)量的重視,從而為運(yùn)用元分析方法綜合評(píng)價(jià)語(yǔ)塊對(duì)英語(yǔ)寫作影響的實(shí)際效果提供數(shù)據(jù)支持。
假設(shè)檢驗(yàn)只能幫助回答“研究效果是否存在”這一問(wèn)題,并不能回答“研究效果有多大”。研究者認(rèn)為,當(dāng)統(tǒng)計(jì)結(jié)果的概率小于設(shè)定的顯著性水平(如α=.05),即達(dá)到統(tǒng)計(jì)學(xué)意義上的顯著性時(shí),得出拒絕原假設(shè)而接受被擇假設(shè)的結(jié)論,從而認(rèn)為研究效果具有顯著性。然而,這一結(jié)論僅表示研究效果存在,并不能回答研究效果有多大,是否在教育學(xué)、心理學(xué)或特定研究領(lǐng)域中具有實(shí)際意義不得而知。換句話說(shuō),假設(shè)檢驗(yàn)結(jié)果達(dá)到統(tǒng)計(jì)學(xué)意義并不代表研究結(jié)果具有實(shí)際意義。相反,假設(shè)檢驗(yàn)結(jié)果沒(méi)有統(tǒng)計(jì)學(xué)意義,也并不代表不具有實(shí)際意義。兩者的真實(shí)含義通常容易被混淆。
受樣本大小的影響較大,假設(shè)檢驗(yàn)結(jié)果中存在兩種現(xiàn)象:一是在研究樣本較大的情況下,即使微小的差別或關(guān)系也能呈現(xiàn)出統(tǒng)計(jì)學(xué)上的顯著性,但其實(shí)際意義可能并不大;二是如果研究樣本太小,即使存在較大的差別或關(guān)系也無(wú)法呈現(xiàn)出統(tǒng)計(jì)學(xué)上的顯著性,而現(xiàn)實(shí)中研究結(jié)果的實(shí)際意義卻不容忽視。
為給客觀評(píng)估研究效果的真實(shí)大小和意義提供依據(jù),克服樣本大小對(duì)研究效果的影響,統(tǒng)計(jì)學(xué)家提出了效應(yīng)量(effect sizes,es)這一概念,用來(lái)估計(jì)研究效果的真實(shí)大小或強(qiáng)度。效應(yīng)量最大特點(diǎn)是不受樣本大小影響,是以標(biāo)準(zhǔn)差為單位的統(tǒng)計(jì)指數(shù)(即標(biāo)準(zhǔn)分Z-score),可用來(lái)比較不同測(cè)量單位結(jié)果間的大小。社會(huì)學(xué)、教育學(xué)和心理學(xué)等領(lǐng)域,根據(jù)研究設(shè)計(jì)的不同,常用的效應(yīng)量有兩類:一類是評(píng)價(jià)差異大小的簇效應(yīng)量,主要指標(biāo)準(zhǔn)化均值差;另一類是評(píng)價(jià)相關(guān)強(qiáng)度大小的簇效應(yīng)量,主要為相關(guān)系數(shù)。
針對(duì)效應(yīng)量大小的評(píng)判標(biāo)準(zhǔn),研究者以行為科學(xué)研究為基礎(chǔ),提出衡量效應(yīng)量的參考標(biāo)準(zhǔn):對(duì)于d簇效應(yīng)量,0.2為小效應(yīng)、0.5為中效應(yīng)、0.8為大效應(yīng);對(duì)于r簇效應(yīng)量,0.10小效應(yīng)、0.30為中效應(yīng)、0.50為大效應(yīng)。還有學(xué)者提出評(píng)價(jià)二語(yǔ)研究領(lǐng)域中效應(yīng)量大小的參考標(biāo)準(zhǔn),對(duì)于組間設(shè)計(jì)中的d簇效應(yīng)量,0.40為小效應(yīng)量、0.70為中效應(yīng)量、1.00為大效應(yīng)量;對(duì)于組內(nèi)設(shè)計(jì)中的d簇效應(yīng)量,0.60為小效應(yīng)量、1.00為中效應(yīng)量、1.40為大效應(yīng)量;對(duì)于r簇效應(yīng)量,0.25為小效應(yīng)量、0.40為中效應(yīng)量、0.60為大效應(yīng)量??梢钥闯觯罢叩臉?biāo)準(zhǔn)低于后者提出的標(biāo)準(zhǔn)。
盡管上述兩個(gè)參考標(biāo)準(zhǔn)因?yàn)檠芯款I(lǐng)域的不同在大小等級(jí)劃分上存在差異,但d簇效應(yīng)量是以標(biāo)準(zhǔn)差為單位的標(biāo)準(zhǔn)分,不同研究中的效應(yīng)量都可參照正態(tài)分布表對(duì)研究結(jié)果進(jìn)行解釋。對(duì)照正態(tài)分布表可以確定正態(tài)曲線下低于某一標(biāo)準(zhǔn)分的面積或累積百分比。
例如,一次組間實(shí)驗(yàn)的效應(yīng)量為0.2,即實(shí)驗(yàn)組均值高于對(duì)照組均值0.2個(gè)標(biāo)準(zhǔn)差,差正態(tài)分布表可知對(duì)照組中58%的樣本低于實(shí)驗(yàn)組的平均分。而兩個(gè)變量的相關(guān)系數(shù)r本身就可以作為效應(yīng)量,r的平方值(表示為R2,稱為決定系數(shù))可以解釋為兩個(gè)變量間的共同變異量。又如,一項(xiàng)研究中兩個(gè)變量間的相關(guān)系數(shù)r,即效應(yīng)量,為0.3,其平方值R2=0.09,表示兩個(gè)變量間的共同變異量為9%,或者說(shuō)一個(gè)變量解釋了另一個(gè)變量9%的變異。需要指出的是,研究者不要把參考標(biāo)準(zhǔn)作為教條,應(yīng)該根據(jù)具體研究領(lǐng)域和研究問(wèn)題對(duì)效應(yīng)量的大小做出解釋,否則會(huì)得出錯(cuò)誤結(jié)論。
1. 研究問(wèn)題。本次研究?jī)H在已有文獻(xiàn)的基礎(chǔ)上計(jì)算單個(gè)研究的效應(yīng)量(es),旨在計(jì)算和呈現(xiàn)現(xiàn)有文獻(xiàn)中單個(gè)研究的效應(yīng)量的大小。
2. 研究數(shù)據(jù)。本次研究從外語(yǔ)類中文核心期刊中選取已公開(kāi)發(fā)表的8篇研究語(yǔ)塊對(duì)英語(yǔ)寫作影響的實(shí)證研究論文。研究均采用組間實(shí)驗(yàn)設(shè)計(jì),統(tǒng)計(jì)方法為獨(dú)立樣本T檢驗(yàn)。為計(jì)算每個(gè)研究的效應(yīng)量,從每篇論文中提取的數(shù)據(jù)包括實(shí)驗(yàn)組和對(duì)照組的樣本量ne、nc,平均分me、mc,標(biāo)準(zhǔn)差se、sc和顯著性值p(見(jiàn)下表)。
語(yǔ)塊對(duì)英語(yǔ)寫作影響研究的統(tǒng)計(jì)數(shù)據(jù)匯總表
注:1. 陳東嵐(2015);2. 伍萍(2014);3. 郭月琴、吳秀娟(2013); 4. 樓捷(2011);5. 徐軍、黃永華(2011); 6.肖武云(2011);7. 蓋淑華(2010);8. 鄧鸝鳴、王香云(2007)。為便于計(jì)算,作者將部分?jǐn)?shù)據(jù)四舍五入后保留小數(shù)點(diǎn)后兩位數(shù)。
3. 研究工具。本次研究使用了由Wilson設(shè)計(jì)的在線效應(yīng)量計(jì)算工具(Standardized Mean Difference),用于計(jì)算每個(gè)研究的效應(yīng)量d,即標(biāo)準(zhǔn)化均值差方(standardized-mean-difference)。使用者只需在線輸入實(shí)驗(yàn)組和對(duì)照組的樣本量、平均值和標(biāo)準(zhǔn)差即可計(jì)算出效應(yīng)量。
本次研究的目的僅在以現(xiàn)有文獻(xiàn)為例,在所提供數(shù)據(jù)的基礎(chǔ)上計(jì)算每個(gè)研究的效應(yīng)量。上表呈現(xiàn)了本次選取的8個(gè)語(yǔ)塊對(duì)英語(yǔ)寫作影響的實(shí)證研究的數(shù)據(jù)。所有研究的假設(shè)檢驗(yàn)均達(dá)到了統(tǒng)計(jì)學(xué)意義上的顯著性水平,由此證明了語(yǔ)塊使用在提高英語(yǔ)寫作水平上有效性。但研究結(jié)果僅回答了研究效果的存在,并沒(méi)有回答研究效果的大小。從表中呈現(xiàn)的效應(yīng)量可知,語(yǔ)塊使用對(duì)英語(yǔ)寫作均產(chǎn)生了積極作用,但每個(gè)研究的實(shí)際意義并不相同,存在很大差別。根據(jù)Cohen(1988)的參考標(biāo)準(zhǔn),郭月琴、吳秀娟(2013)的研究效應(yīng)量(d=0.44)和徐軍、黃永華(2011)的研究效應(yīng)量(d=0.54),接近中等效應(yīng)量;其他6個(gè)研究的效應(yīng)量均為大效應(yīng)量。根據(jù)Plonsky和Oswald(2014)的評(píng)價(jià)二語(yǔ)研究領(lǐng)域中組間設(shè)計(jì)效應(yīng)量大小的參考標(biāo)準(zhǔn),郭月琴、吳秀娟(2013)的研究效應(yīng)量(d=0.44)和徐軍、黃永華(2011)的研究效應(yīng)量(d=0.54)則趨向于小效應(yīng)量,陳東嵐(2015)的效應(yīng)量介于中效應(yīng)量和大效應(yīng)量之間,其他5個(gè)研究的效應(yīng)量為大效應(yīng)量。盡管兩個(gè)參考標(biāo)準(zhǔn)有所不同,但都反映了語(yǔ)塊使用對(duì)提高學(xué)生英語(yǔ)寫作水平除具有統(tǒng)計(jì)學(xué)顯著意義外,還具有不同程度的實(shí)際意義。
為更直觀解釋和理解效應(yīng)量在實(shí)際教學(xué)中的作用和意義,通過(guò)對(duì)照正態(tài)分布表,每個(gè)研究的效應(yīng)量可以從兩方面解釋:一是對(duì)照組學(xué)生低于實(shí)驗(yàn)組均值的百分比,二是實(shí)驗(yàn)組均值在對(duì)照組中的排名(見(jiàn)上表)。
例如,陳東嵐(2015)研究中語(yǔ)塊使用對(duì)提高英語(yǔ)寫作水平的效應(yīng)量為0.81,表示在對(duì)照組中79%的學(xué)生(39人)的成績(jī)低于實(shí)驗(yàn)組均值(10.78),這一均值在對(duì)照組50名學(xué)生的成績(jī)中排在第11位。鄧鸝鳴、王香云(2007)研究中語(yǔ)塊使用對(duì)提高英語(yǔ)寫作水平的效應(yīng)量為2.97,表示對(duì)照組100%的學(xué)生(34人)的成績(jī)低于實(shí)驗(yàn)組均值(6.86),這一均值高于對(duì)照組中所有34名學(xué)生的成績(jī),排在第1位。通過(guò)這兩種解釋,普通讀者可以更直觀地看出語(yǔ)塊使用對(duì)提高英語(yǔ)寫作水平的實(shí)際意義和作用。
導(dǎo)致各個(gè)研究效應(yīng)量不同的原因與研究設(shè)計(jì)中的多個(gè)因素有關(guān)系:
一是研究樣本特征不同,如有的研究樣本來(lái)自重點(diǎn)大學(xué),有的來(lái)自非重點(diǎn)大學(xué);有的研究樣本為一年級(jí)學(xué)生,有的為二年級(jí)學(xué)生;有的為英語(yǔ)專業(yè)學(xué)生,有的為非英語(yǔ)專業(yè)學(xué)生等。二是研究時(shí)長(zhǎng)不同。如有的研究持續(xù)一個(gè)學(xué)期,而有的研究持續(xù)兩個(gè)學(xué)期。三是研究工具不同。實(shí)驗(yàn)后期進(jìn)行測(cè)試時(shí),各個(gè)研究在寫作的內(nèi)容和難易度等方面的要求不一致,寫作時(shí)間可能也不同。四是語(yǔ)塊教學(xué)內(nèi)容不同。主要表現(xiàn)為實(shí)驗(yàn)中學(xué)生所學(xué)語(yǔ)塊的來(lái)源不同,如教材不同等。五是語(yǔ)塊教學(xué)方式不同,如有的研究中實(shí)驗(yàn)班和對(duì)照班為同一教師,有的為不同教師;有的采用討論式教學(xué),有的采用自主學(xué)習(xí)方法。這些因素對(duì)研究效果產(chǎn)生的影響,可以在元分方法中作為調(diào)節(jié)變量,探索導(dǎo)致研究間系統(tǒng)變異的來(lái)源和大小,從而更全面、科學(xué)地認(rèn)識(shí)和評(píng)價(jià)語(yǔ)塊對(duì)英語(yǔ)寫作影響的真實(shí)效應(yīng)和實(shí)際意義。
基于概率的統(tǒng)計(jì)假設(shè)檢驗(yàn)只能回答研究效應(yīng)是否存在,效應(yīng)量的使用可以克服樣本大小對(duì)假設(shè)檢驗(yàn)結(jié)果的影響,是評(píng)價(jià)研究效果真實(shí)大小的統(tǒng)計(jì)指標(biāo)。由于效應(yīng)量是以標(biāo)準(zhǔn)差為單位的標(biāo)準(zhǔn)分,可以用來(lái)比較針對(duì)同一研究問(wèn)題不同研究設(shè)計(jì)研究間的真實(shí)效應(yīng)。本文以8個(gè)研究為例,介紹并呈現(xiàn)語(yǔ)塊對(duì)英語(yǔ)寫作影響的效應(yīng)量大小和實(shí)際意義,以期引起國(guó)內(nèi)外語(yǔ)研究者對(duì)效應(yīng)量的重視,從而提高研究水平和研究質(zhì)量,為以后運(yùn)用元分析方法整合同一研究問(wèn)題的所有單個(gè)研究綜合評(píng)價(jià)研究效應(yīng)、探討研究設(shè)計(jì)中的調(diào)節(jié)變量對(duì)研究效應(yīng)的影響等提供科學(xué)依據(jù)。
注釋:
[1]Wilson的在線效應(yīng)量網(wǎng)址為:http://cebcp.org/practicalmeta-analysis-effect-size-calculator/.
參考文獻(xiàn):
[1]Borenstein, M., Hedges, L. V., Higgins, J. P. T., & Rothstein, H. R.Introduction to Meta-Analysis [M]. Hoboken, NJ: Wiley,2009
[2]Coe.R.It’s the effect size.stupid: What effect size is and why it is important,2002.accessed from www.leeds.ac.uk/educol/ documents/00002182.htm
[3]Cohen. J.Statistical power analysis for the behavioral sciences (2nd ed).Hillsdale. NJ: Erlbaum,1988
[4]Cumming.G.The new statistics: Why and how.Psychological Science, 2014
Cumming.G.Understanding the New Statistics: Effect Sizes. Confidence Intervals. and Meta-Analysis[J].New York: Routledge,2012
[5]Ellis.P.D.The Essential Guide to Effect Sizes: Statistical Power. Meta-analysis. and the Interpretation of Research Results[M]. Cambridge: Cambridge University Press,2010
[6]Kirk.R.E.Practical significance: a concept whose time has come[J]. Educational and Psychological Measurement,1996
[7]Lipsey, M.W&Wilson.D.B.Practical meta—analysis[M]. Thousand Oaks: SAGE,2001
Plonsky, L., & Oswald, F. L. How big is “Big”? Interpreting effect sizes in L2 research[J]. Language Learning, 2012
[8]鮑 貴,席 雁.統(tǒng)計(jì)顯著性檢驗(yàn):問(wèn)題與思考[J].南京工程學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版),2010
[9]陳東嵐.語(yǔ)言意識(shí)驅(qū)動(dòng)下的語(yǔ)塊教學(xué)法在大學(xué)英語(yǔ)寫作教學(xué)中的運(yùn)用[J].外語(yǔ)學(xué)刊,2015
[10]鄧鸝鳴,王香云.背誦式語(yǔ)言輸入對(duì)中國(guó)學(xué)生二語(yǔ)寫作能力發(fā)展的有效性研究[J].外語(yǔ)教學(xué),2007
[11]蓋淑華.最近發(fā)展區(qū)域中的詞塊習(xí)得實(shí)證研究— 基于支架式教學(xué)的實(shí)證研究[J].外語(yǔ)與外語(yǔ)教學(xué),2010
[12]郭曉英, 毛紅梅.語(yǔ)塊教學(xué)對(duì)英語(yǔ)寫作能力影響的實(shí)驗(yàn)研究[J].山東外語(yǔ)教學(xué), 2010
[13]郭月琴, 吳秀娟.CLIL 模式在大學(xué)英語(yǔ)寫作中的應(yīng)用探究[J].外國(guó)語(yǔ)文, 2013
[14]樓 捷.論網(wǎng)絡(luò)語(yǔ)料庫(kù)輔助對(duì)英語(yǔ)寫作語(yǔ)塊運(yùn)用能力的影響[J].外語(yǔ)與外語(yǔ)教學(xué),2011
[15]權(quán)朝魯.效果量的意義及測(cè)定方法[J].心理學(xué)探新,2003
[16]肖武云.基于語(yǔ)塊的以寫促說(shuō)的教學(xué)模式實(shí)證研究[J].外語(yǔ)界,2011
[17]徐 軍,黃永華.詞塊在師范學(xué)生英語(yǔ)作文中的應(yīng)用[J].山東外語(yǔ)教學(xué),2011
[18]鄭昊敏,溫忠麟,吳 艷.心理學(xué)常用效應(yīng)量的選用與分析[J].心理科學(xué)進(jìn)展,2011
文章編號(hào):ISSN2095-6711/Z01-2016-01-0193
當(dāng)代教育實(shí)踐與教學(xué)研究2016年1期