記得在上大學(xué)時,一位給我們講授心理學(xué)研究方法的老師曾經(jīng)說過:“學(xué)習(xí)統(tǒng)計就像是往沙漠里面澆水”。時至今日,我仿佛依然能夠感受到當(dāng)時這句話在我心中引起的那種強烈共鳴。沒錯,我在統(tǒng)計學(xué)習(xí)上沒少下工夫,但卻收效甚微?;撕芏鄷r間去區(qū)分那些看上去長得很像的術(shù)語,試著努力地記住每一個公式的適用范圍,幾乎是懷著畢恭畢敬的心情去演算練習(xí)題……但是,在這門課程結(jié)束不久之后,我發(fā)現(xiàn)自己對各種統(tǒng)計方法的認(rèn)識還是非常模糊。直到開始撰寫畢業(yè)設(shè)計論文的時候,我還是對數(shù)據(jù)統(tǒng)計存在畏懼感。在完成論文的過程中,我對老師的話有了新的理解:如果沙漠里面存在一片綠洲,澆進(jìn)去的水就會蒸發(fā)得慢一些,研究項目就是沙漠中的綠洲。
學(xué)生進(jìn)行STEM項目研究的過程,是學(xué)習(xí)像科學(xué)家和工程師那樣思考和行動的過程。只有通過基本的統(tǒng)計方法對數(shù)據(jù)進(jìn)行整理和分析,才能有足夠的證據(jù)解釋和說明研究的問題,驗證假設(shè)是否得到支持,以及圍繞某一個課題進(jìn)行深入細(xì)致的探討。從某種程度上看,數(shù)據(jù)統(tǒng)計可以算是科學(xué)研究中用于交流的“通用語言”,因此,學(xué)習(xí)和運用數(shù)據(jù)統(tǒng)計方法,屬于科學(xué)研究中的基本方法訓(xùn)練。最近,在我翻譯《STEM項目學(xué)生研究手冊》(以下簡稱《研究手冊》)的相關(guān)章節(jié)時,其中的數(shù)據(jù)分析和圖表展示方法介紹,給我的“沙漠”再次澆了一點水。也許是將高中生作為閱讀對象的緣故,這本《研究手冊》用淺顯易懂的句子解釋了統(tǒng)計學(xué)中的專業(yè)術(shù)語,跳過了枯燥公式演繹推導(dǎo)環(huán)節(jié),用實例告訴學(xué)生各種方法所適用的情況,有什么需要注意的問題。本書作者的撰文思路和語言風(fēng)格,讓我直觀地看到數(shù)據(jù)統(tǒng)計和圖表展示在STEM項目完成過程中的關(guān)鍵性作用。而且,如果運用得當(dāng)?shù)脑?,它們還會使學(xué)生的項目變得更加出色。
我有一位朋友在大學(xué)里當(dāng)老師,他最近幾年一直在指導(dǎo)學(xué)生的畢業(yè)論文。當(dāng)我向他咨詢學(xué)生在研究過程中數(shù)據(jù)統(tǒng)計方面出現(xiàn)的問題時,他很激動地表示“有話說”,并很快給我列出了他指導(dǎo)的學(xué)生中最常見的幾個問題。當(dāng)我再次仔細(xì)閱讀《研究手冊》的相關(guān)章節(jié)時,我發(fā)現(xiàn),這些常常出現(xiàn)在大學(xué)生的研究中的數(shù)據(jù)統(tǒng)計問題,在這本針對高中生的項目指南中就已經(jīng)提到了,并且給出了有效的解決建議。
問題1:學(xué)生對研究結(jié)果預(yù)測的主觀愿望過于強烈,在進(jìn)行統(tǒng)計分析時,他們更喜歡那些符合自己預(yù)期的數(shù)據(jù),而對那些看上去不太“美觀”的數(shù)據(jù)結(jié)果采取選擇性地忽略,甚至非常草率地刪除或者舍棄掉。
《研究手冊》在實驗記錄和數(shù)據(jù)分析章節(jié)中反復(fù)強調(diào):不要先人為主地看待你的研究和數(shù)據(jù)結(jié)果。書中還提到一些很實用的操作方法來避免這個問題。例如,永遠(yuǎn)不要在實驗記錄本中撕頁或者刪除文本;永遠(yuǎn)不要用修正液覆蓋錯誤和修改的地方,而是在相應(yīng)部分輕輕劃一道刪除線。當(dāng)使用電腦進(jìn)行統(tǒng)計計算時,即使發(fā)現(xiàn)數(shù)據(jù)運算結(jié)果對于你的假設(shè)沒有顯著作用,也不要輕易刪除數(shù)據(jù)。
問題2:在統(tǒng)計學(xué)課堂上,學(xué)生常把大量的時間花在對統(tǒng)計的原理和公式推導(dǎo)的學(xué)習(xí)上,對數(shù)據(jù)進(jìn)行實際操作計算的經(jīng)驗相對較少。當(dāng)我問學(xué)生關(guān)于平均數(shù)差異檢驗、方差分析、回歸分析的原理,大多數(shù)人都能回答上來。然而,當(dāng)我要求他們針對一些具體數(shù)據(jù),根據(jù)自己的研究假設(shè)去進(jìn)行方差分析或者回歸分析時,用不了多久,他們就會跑回來問我:“老師,方差分析中的自變量可以有多個嗎?回歸分析中的自變量可以同時有多個嗎?”
正如我在前面提到的那樣,這本《研究手冊》指導(dǎo)我們有效地避免這個問題,因為它在寫法上更側(cè)重于技能的實際運用。例如在計算一組數(shù)據(jù)的標(biāo)準(zhǔn)差時,有總體標(biāo)準(zhǔn)差和樣本標(biāo)準(zhǔn)差兩種方程,書中并沒有從原理上詳細(xì)剖析兩個方程的區(qū)別,只是簡單直接地告訴讀者:“標(biāo)準(zhǔn)差是一個高估值,來彌補犯錯誤的可能性,STEM研究中使用樣本標(biāo)準(zhǔn)差計算方程更恰當(dāng)”
(第103頁)。對于比較復(fù)雜的推斷性統(tǒng)計問題,《研究手冊》也是采用舉重若輕的介紹方法。學(xué)生不是很難理解方差分析中自變量可以有多少個嗎?該書作者給了一個中學(xué)生很容易讀懂的例子:“在比較一個彈射器以3種不同彈力發(fā)射1顆4千克彈丸的平均距離時,可以用方差分析進(jìn)行檢驗?!保ǖ?34頁)
問題3:大多數(shù)學(xué)生在原始數(shù)據(jù)的處理方面存在欠缺。開始正式的數(shù)據(jù)統(tǒng)計之前,研究者通常需要對原始數(shù)據(jù)進(jìn)行處理,例如,缺失數(shù)據(jù)的處理,是否有特異值,是否存在錄入錯誤,數(shù)據(jù)是否呈正態(tài)分布等。我發(fā)現(xiàn)大多數(shù)學(xué)生認(rèn)為這個環(huán)節(jié)可有可無,當(dāng)他們收集到實驗的原始數(shù)據(jù)之后,就興致勃勃地開始進(jìn)行描述統(tǒng)計和推斷統(tǒng)計。這時我就會問他們一個問題:你怎么判斷原始數(shù)據(jù)是否滿足正態(tài)分布?如果數(shù)據(jù)不是正態(tài)分布,做出來的方差分析會有什么后果?到這個時候,大多數(shù)學(xué)生才恍然大悟。但是,緊接著他們可能會說出一句更雷人的話:“老師,我們不知道怎么做正態(tài)分布檢驗?!?/p>
遇到這樣的學(xué)生應(yīng)該怎么辦?《研究手冊》的作者可能已經(jīng)與這樣的學(xué)生打過交道,因為書中“描述統(tǒng)計”一章詳細(xì)地介紹了離群值的判斷和處理方法,以避免“雷人”的問題再次出現(xiàn)。作者首先告訴學(xué)生出現(xiàn)離群值并不可怕,因為“專業(yè)的科學(xué)家在使用新的方法時也有可能出錯,這很常見”(第101頁)?!叭绻愦_認(rèn)離群值的出現(xiàn)是由于自己的錯誤、儀器故障,或者其他你知道的與離群值無關(guān)的原因?qū)е碌模敲?,你可以在對?shù)據(jù)進(jìn)行計算和分析時把它剔除掉”(第101頁)。但是,別忘了“在結(jié)果中還是要提到離群值,并且在論文的結(jié)論部分要進(jìn)行分析和解釋”(第101頁)。這才是科學(xué)研究應(yīng)有的嚴(yán)謹(jǐn)態(tài)度。作者給學(xué)生介紹了“經(jīng)驗法則”,通過四分位距的計算結(jié)果輔助判斷某個數(shù)據(jù)是否屬于離群值。至于判斷總體數(shù)據(jù)分布是否為正態(tài),作者并沒有向高中生提出這么高的數(shù)學(xué)要求,她只是提到“當(dāng)數(shù)據(jù)呈非正態(tài)分布時,集中趨勢的值可能會有變化”(第99頁),“可以從正態(tài)分布數(shù)據(jù)的平均值和標(biāo)準(zhǔn)差中推斷出數(shù)據(jù)的更多信息”(第104頁)。
問題4:缺乏制作圖表的激情。學(xué)生在進(jìn)行實驗室數(shù)據(jù)或調(diào)查數(shù)據(jù)的統(tǒng)計分析時,很多人不會使用圖表呈現(xiàn)自己的結(jié)果。例如,在描述兩個變量是否存在線性關(guān)系時,大多數(shù)人只知道用相關(guān)系數(shù)或回歸系數(shù)表示,卻不會使用散點圖呈現(xiàn)。在描述一個變量是否隨時間變化時,很多人不清楚可以用折線圖或曲線圖表示。一些學(xué)生想到了要用圖表呈現(xiàn)數(shù)據(jù)統(tǒng)計結(jié)果,但是他們只會把統(tǒng)計軟件中輸出的圖表直接拷貝到實驗報告中,導(dǎo)致后期無法修改圖表。一些學(xué)生不會自己在文字編輯軟件中繪制圖表,更談不上制作美觀的圖表。
圖形和表格是用一種可視化的方法展現(xiàn)原始數(shù)據(jù)、描述統(tǒng)計結(jié)果和推斷統(tǒng)計結(jié)果。使用圖表的目的不僅僅是美觀,更重要的是突顯那些從研究中得到的重要發(fā)現(xiàn)。該書按照定量和定性數(shù)據(jù)兩類介紹了圖表的使用和繪制技巧,每一種圖表都輔以實例,讓學(xué)生一目了然。作者還提到了圖表的標(biāo)題、標(biāo)注和圖例使用中需要注意的一些小細(xì)節(jié),例如,“標(biāo)注必須要清楚地表現(xiàn)出圖表要展示的信息,數(shù)軸、表格的行列名稱都要有明確的詞語和單位描述”(第128頁)。
問題5:在計算完成后,不知道如何對數(shù)據(jù)結(jié)果進(jìn)行解釋。經(jīng)常會有學(xué)生來問我:“老師,我的結(jié)果計算出來了,但是我不知道應(yīng)該看哪個?有很多個F值,我應(yīng)該看哪一個,是修正的還是未修正的。在修正的F值后,哪一種修正更好,F(xiàn)值顯著了,這兩個變量是什么關(guān)系?……”
學(xué)生不知道怎么解釋數(shù)據(jù)這個現(xiàn)象反映出來的問題本質(zhì)是,他們沒有搞清楚自己為什么要進(jìn)行數(shù)據(jù)統(tǒng)計。其實,數(shù)據(jù)統(tǒng)計運算不是盲目的,而是要驗證研究結(jié)果是否支持假設(shè),從大的方面來說,是要為解決某一個問題而進(jìn)行的。《研究手冊》中給學(xué)生列出了3個問題,幫助他們審視自己的數(shù)據(jù)。這3個問題是:“數(shù)據(jù)真實地反映了什么,從數(shù)據(jù)中還能提出哪些問題?”“數(shù)據(jù)如何反映兩個變量之間的關(guān)系?”“數(shù)據(jù)能支持假設(shè)嗎f3efa7fc9b27bace0aab67d52dcb4180?”在這3個問題之下,作者從大量STEM學(xué)生項目經(jīng)驗中總結(jié)出一系列關(guān)于“為什么”和“如何”的問題,幫助學(xué)生更加深入地思考自己的數(shù)據(jù)結(jié)果。最后還不忘提醒學(xué)生:“得到不支持假設(shè)的數(shù)據(jù)也是有價值的。無論如何,都不能改變假設(shè)來匹配數(shù)據(jù),或者改變數(shù)據(jù)來迎合假設(shè)!”
從研究假設(shè)出發(fā),對實驗中收集到的數(shù)據(jù)進(jìn)行統(tǒng)計和分析,這個過程需要研究者具備足夠的耐心、細(xì)致和敏銳的觀察力。關(guān)于數(shù)據(jù)分析這個事,還有一點你應(yīng)該知道的是:無論多“大牌”的科學(xué)家和工程師,在某一篇研究論文中反映出來的數(shù)據(jù)分析工作量,永遠(yuǎn)比他們研究過程中實際運算的少得多。數(shù)據(jù)分析的過程和結(jié)果,在研究論文中的結(jié)果和討論部分會用到,但是這兩個部分對結(jié)果數(shù)據(jù)使用的要求有差異。結(jié)果部分只是列數(shù)據(jù)進(jìn)行描述,而不必進(jìn)行解釋和分析;討論部分,研究者則需要對結(jié)果數(shù)據(jù)的所有特征和趨勢進(jìn)行解釋、分析和討論。
“聽到的會忘記,看到的能記住,只有真正做過才能理解”,《研究手冊》向讀者傳達(dá)的正是這樣一個基本理念?!堆芯渴謨浴分薪Y(jié)合中學(xué)生STEM項目實踐案例,告訴讀者對于數(shù)據(jù)做統(tǒng)計分析不是單純的數(shù)學(xué)計算,而是項目研究完整過程的重要環(huán)節(jié),這個環(huán)節(jié)運用到的很多技巧和細(xì)節(jié),都是在研究過程中摸索出來的,也只有通過親自實踐才能真正地掌握。相對于其他統(tǒng)計學(xué)教程,這本《研究手冊》的寫法更加通俗易懂,貼近STEM學(xué)生項目的研究實際需要,我推薦用作中學(xué)生了解統(tǒng)計學(xué)的入門材料。