樊德國
筆者先前對在校的1000多名高三學(xué)生進(jìn)行了調(diào)查,了解他們對統(tǒng)計(jì)知識(shí)的認(rèn)識(shí),結(jié)果令人吃驚,多數(shù)學(xué)生片面地認(rèn)為統(tǒng)計(jì)就是一個(gè)考點(diǎn),就是計(jì)算和讀圖.這一普遍現(xiàn)象表明,當(dāng)前高中統(tǒng)計(jì)教學(xué)的重點(diǎn)仍在數(shù)據(jù)的計(jì)算上,高考的“導(dǎo)向”作用使得統(tǒng)計(jì)教學(xué)也淪為了“考算術(shù)”,沒有達(dá)到課程預(yù)設(shè)的目標(biāo).
數(shù)字是統(tǒng)計(jì)的語言,數(shù)據(jù)是統(tǒng)計(jì)的原料.教育者應(yīng)該思考如何培養(yǎng)學(xué)生良好的統(tǒng)計(jì)意識(shí),這不僅是一種數(shù)的感覺,更是一種思維方式.換句話說是當(dāng)學(xué)生遇到實(shí)際問題時(shí),想到為什么需要去、怎樣去收集數(shù)據(jù).收集數(shù)據(jù)、整理數(shù)據(jù)和分析數(shù)據(jù),并結(jié)合實(shí)際作出推斷和決策.
1數(shù)據(jù)從何而來
收集數(shù)據(jù)是解決統(tǒng)計(jì)問題的第一個(gè)步驟.思考數(shù)據(jù)從何而來,認(rèn)識(shí)抽樣的必要性和有效性至關(guān)重要,它是培養(yǎng)學(xué)生良好統(tǒng)計(jì)意識(shí)的一大法寶.
1.1大、小樣本之爭
先談抽樣的必要性.對于收集數(shù)據(jù),很多學(xué)生都有疑問“為什么不看全部(總體)?”.為此,抽樣起始課有必要向?qū)W生介紹一下普查.普查是一種企圖把總體納入樣本的調(diào)查方式,它不進(jìn)行抽樣直接調(diào)查分析總體.經(jīng)典實(shí)例是“人口普查”,新中國先后進(jìn)行了六次全國人口普查,統(tǒng)計(jì)每個(gè)人的性別、年齡、學(xué)歷、體征等信息,并匯總整理分析,為我國今后制定人口政策提供了依據(jù).普查在現(xiàn)實(shí)生活中意義重大,尤其是調(diào)查研究容量較小的總體時(shí).
有的學(xué)生誤以為“普查總比抽查好”.都知道使用普查或較大容量的樣本(大樣本)隨機(jī)誤差是微不足道的.但對總體了解越仔細(xì)、越全面,所要付出的“成本”就越高,有時(shí)反而會(huì)“得不償失”.當(dāng)總體包含個(gè)體很多甚至無限,逐一調(diào)查是很難的,甚至是不可能的;還有一類,例如要了解燈泡的使用壽命、牛奶的質(zhì)量等,不能帶有破壞性地逐個(gè)檢驗(yàn).俗語“你不必吃完整頭牛,才知道肉是老的”,有些調(diào)查有必要甚至必須抽樣,并據(jù)此作為依據(jù)推測總體.
1.2好、壞樣本之辯
再談抽樣的有效性.“樣本能完全反映總體嗎?如何降低抽樣過程中帶來的誤差?”這是學(xué)生的另一大疑惑.比較經(jīng)典的反例是“1936年蘭登、羅斯??偨y(tǒng)之爭”,樣本選擇了蘭登,而選民心里卻想著羅斯福,產(chǎn)生巨大誤差的原因是通過電話調(diào)查的對象不能真正代表選民,它們在經(jīng)濟(jì)上富有,對共和黨候選人蘭登有較強(qiáng)的訴求,嚴(yán)重偏離了總體.只要抽樣,總體中的部分個(gè)體就會(huì)未納入調(diào)查,這時(shí)就容易出現(xiàn)樣本代表性偏差的問題.甚至,對于同一總體,不同的人用同樣的抽樣方法,組成的樣本也不盡相同(即使同一個(gè)人做兩次,結(jié)果也不會(huì)完全一樣),不同樣本得到的統(tǒng)計(jì)結(jié)果也會(huì)不相同.要讓學(xué)生明白抽樣具有隨機(jī)性,統(tǒng)計(jì)結(jié)果也具有隨機(jī)性.
估計(jì)總體必須使用有代表性的樣本.盡管抽樣帶來的偏差不可避免,學(xué)習(xí)不同的抽樣方法意在降低抽樣帶來的誤差,樣本的隨機(jī)性是滿足樣本有效性的根本保證.怎樣獲得一個(gè)好樣本呢?抽樣成功的檢驗(yàn)標(biāo)準(zhǔn)是:保證總體中的每個(gè)個(gè)體等可能(機(jī)會(huì)均等)入選樣本,使樣本成為隨機(jī)樣本.隨機(jī)并不是隨意,樣本要客觀地反映總體,事實(shí)上強(qiáng)調(diào)抽樣保證隨機(jī)性恰是保證抽樣有效性的前提.具體來說,在抽簽法中“攪拌均勻”以使每個(gè)個(gè)體入樣的機(jī)會(huì)相同,確保了抽樣的隨機(jī)性;在隨機(jī)數(shù)表法中要保證選取的第一個(gè)隨機(jī)數(shù)是隨機(jī)抽取的,取數(shù)方式也是隨機(jī)的;在系統(tǒng)抽樣中要保證第一個(gè)個(gè)體入選樣本的隨機(jī)性,分組要嚴(yán)格按照隨機(jī)方法進(jìn)行分組,可以認(rèn)定加上間隔后得到的這組樣本是隨機(jī)選取的;分層抽樣成比例縮小取樣空間,在相對容量小的每層中進(jìn)行簡單隨機(jī)抽樣或系統(tǒng)抽樣,保證了隨機(jī)性.
下面談一下抽樣方法的適用范圍.簡單隨機(jī)抽樣理論上能有足夠把握保證隨機(jī)性,但它同樣存在著缺陷,當(dāng)總體數(shù)量過大均勻攪拌難度很大,獲得這種樣本十分昂貴,以至于單純的經(jīng)濟(jì)考慮就會(huì)剔除這種方法.當(dāng)總體容量很大,個(gè)體差異不大的前提下,分組等間隔的系統(tǒng)抽樣可有效降低抽樣的難度.而對于個(gè)體差異較大的總體,為了確保準(zhǔn)確性有效性,最有效的辦法是準(zhǔn)備在每一層(性質(zhì)相同的個(gè)體整體)中,以隨機(jī)抽取的方式構(gòu)成樣本,即在各層內(nèi)部獲得層樣本形成總樣本.顯然分層抽樣是一個(gè)更經(jīng)濟(jì)的替代品,它在現(xiàn)實(shí)生活的市場研究和民意調(diào)查等領(lǐng)域中得到了廣泛的應(yīng)用.
抽樣的教育價(jià)值在于讓學(xué)生學(xué)會(huì)用手中少量數(shù)據(jù),對重大問題做出明智的決策.大、小樣本之爭告訴我們,要得到“手中少量的數(shù)據(jù)”,這就需要抽樣了,使用容量足夠小的樣本(小樣本)——甚至不需要多少成本,抽樣調(diào)查要比普查劃算.好、壞樣本之辯告訴我們統(tǒng)計(jì)結(jié)果具有“可錯(cuò)性”,不存在“最優(yōu)解”,根據(jù)不同客觀情景使用抽樣調(diào)查、選擇合適的抽樣方法相當(dāng)重要.建議教師在教學(xué)中幫助學(xué)生理解不同抽樣方法的適用范圍,揭示各操作步驟之間的聯(lián)系,在具體操作時(shí)不要漏掉某些關(guān)鍵步驟.如果不把這一點(diǎn)說清楚,只單純地介紹三種抽樣方法就講偏了.
2功能強(qiáng)大的“統(tǒng)計(jì)圖表”
抽到的原始數(shù)據(jù)一般是雜亂無章的,需要加以整理.整合數(shù)據(jù)是解決統(tǒng)計(jì)問題的第二個(gè)步驟,是統(tǒng)計(jì)的一個(gè)強(qiáng)有力的工具.整合數(shù)據(jù)的方式有兩種:一是圖、表;二是統(tǒng)計(jì)量.高中數(shù)學(xué)主要涉及三種統(tǒng)計(jì)圖:頻率分布直方圖、莖葉圖和散點(diǎn)圖,包括制作和理解兩個(gè)方面的要求.根據(jù)實(shí)際,用什么樣的圖表來展示數(shù)據(jù)? 在圖表中,數(shù)據(jù)表現(xiàn)出了怎樣的趨勢和性狀? 能從圖表中得到什么樣的結(jié)論?這是學(xué)生的疑惑.調(diào)查反映出學(xué)生容易混淆頻率分布直方圖、莖葉圖和散點(diǎn)圖的適用范圍,辨不清它們各自功能的異同;學(xué)生對統(tǒng)計(jì)圖的錯(cuò)誤觀念突出表現(xiàn)為兩點(diǎn):錯(cuò)誤的選用統(tǒng)計(jì)圖表;統(tǒng)計(jì)圖視覺上的誤解.
2.1頻率分布直方圖
當(dāng)收集到的數(shù)據(jù)容量偏大時(shí),逐個(gè)分析計(jì)算變得很困難,繪制頻率分布直方圖是個(gè)不錯(cuò)的選擇.繪制頻率分布直方圖需要一定的功底,一是要保證分組等寬度,組界明確,不出現(xiàn)遺漏數(shù)據(jù)和重復(fù)統(tǒng)計(jì)的情形;二是保證組距、組數(shù)合理,分組太少就像蓋摩天大樓,所有數(shù)據(jù)都落在少數(shù)組;分組太多,就像攤煎餅,大部分組中僅有一個(gè)幾個(gè)觀測值,甚至沒有觀測值;這兩種情形都不能有效描述數(shù)據(jù)的分布情況.事實(shí)上,作為高中生來講,這是易錯(cuò)點(diǎn)不是重點(diǎn),要幫助學(xué)生明確畫統(tǒng)計(jì)圖不是目的,畫統(tǒng)計(jì)圖的目的是幫助我們了解數(shù)據(jù)背后的信息.頻率分布直方圖功能強(qiáng)大,俗語“濃縮的是精品”,要確立畫完直方圖后的一句話“我看到了什么?”,首先看到的是小矩形間面積的差異,這正好對應(yīng)各組數(shù)據(jù)間頻數(shù)、頻率間的差異;其次要強(qiáng)調(diào)審圖的策略:注意力的重點(diǎn)是找中心、看散度(集中、分散的程度).找中心(直方圖中的眾數(shù)、中位數(shù)和平均數(shù)),其中眾數(shù)是分布中“尖峰”的中值,中位數(shù)是分布的中間點(diǎn),把觀測數(shù)據(jù)(面積)對半分;再說直方圖的散度,看圖像的起伏程度,它對應(yīng)于數(shù)據(jù)的方差.
事實(shí)上,繪制頻率分布直方圖是以丟失一部分信息為代價(jià)的,當(dāng)然數(shù)據(jù)容量大時(shí)丟失的數(shù)據(jù)可能對我們要處理的問題沒用,頻率分布直方圖無法恢復(fù)原來的數(shù)據(jù).當(dāng)樣本容量足夠大組數(shù)增多組距逐步減小,頻率分布直方圖就從折線圖演變?yōu)槔硐牖恼龖B(tài)分布.當(dāng)數(shù)據(jù)呈正態(tài)分布時(shí),平均數(shù)、中位數(shù)和眾數(shù)“三位一體”,取同一數(shù)值.
2.2莖葉圖
頻率分布直方圖并不是唯一選擇,莖葉圖的應(yīng)用也非常廣泛,如體育賽事等應(yīng)急情況.使用莖葉圖解決統(tǒng)計(jì)問題有兩個(gè)突出的優(yōu)點(diǎn):一是繪制圖形沒有損失信息,它保留了原始的觀測數(shù)據(jù);其二,莖葉圖可以隨測隨錄,可以表示兩個(gè)人以上的比賽結(jié)果,簡便易操作.繪制莖葉圖時(shí)區(qū)分莖、葉是為了方便登錄數(shù)據(jù),規(guī)定數(shù)據(jù)的頭一位或頭幾位為莖就等于自動(dòng)選擇了組距.有時(shí)莖葉圖也顯得力不從心,當(dāng)統(tǒng)計(jì)數(shù)據(jù)容量過大時(shí),每個(gè)莖都有很多葉(數(shù)據(jù)),繪制、讀取及解讀很困難;當(dāng)數(shù)據(jù)位數(shù)較多時(shí),莖葉圖只能表示“兩位”整數(shù),莖葉圖的組(莖)沒得選擇,表示的記錄就會(huì)不直觀不清晰.
同樣,和頻率分布直方圖一樣,解讀莖葉圖應(yīng)該要看圖形的整體形態(tài),說白了莖葉圖就像側(cè)躺的直方圖,莖葉圖是枝繁葉茂還是一枝獨(dú)秀,反映數(shù)據(jù)的散度截然不同.
2.3散點(diǎn)圖
為了清晰認(rèn)識(shí)散點(diǎn)圖,我們從散點(diǎn)圖與折線圖的區(qū)別談起.散點(diǎn)圖反映的是兩個(gè)關(guān)聯(lián)變量間的相關(guān)關(guān)系,而折線圖主要反映兩個(gè)變量間的變化趨勢.解讀散點(diǎn)圖的關(guān)鍵在于觀察樣本點(diǎn)形成圖象的整體形態(tài)、走向,進(jìn)而區(qū)分正負(fù)相關(guān),事實(shí)上,求解回歸方程,使用最小二乘法及計(jì)算相關(guān)系數(shù)都不是重點(diǎn),應(yīng)關(guān)注方程的意義和合理性.如在圓上隨機(jī)取一組點(diǎn),用這組點(diǎn)的坐標(biāo)套用公式仍可求得一個(gè)回歸直線方程,這樣的直線顯然是沒意義的,所以不關(guān)注圖形的計(jì)算是“不合理的”.
統(tǒng)計(jì)圖表的教學(xué)一定要注意的是“不要把統(tǒng)計(jì)圖表講成如何畫圖表、根據(jù)公式運(yùn)算”, 而應(yīng)側(cè)重于幫助學(xué)生挖掘不同統(tǒng)計(jì)圖表的功能及優(yōu)劣,并能根據(jù)不同情境選擇合適的圖表.上述三種圖表都可以“找出中心和看出散度”,這些都直觀地展現(xiàn)在眼前.統(tǒng)計(jì)圖表的教育價(jià)值在于思考圖表能告訴我們何種信息,以及體會(huì)用圖形形態(tài)呈現(xiàn)信息、輔助做出統(tǒng)計(jì)推斷進(jìn)行決策的過程.
3數(shù)“聚”力量
數(shù)據(jù)本身沒有價(jià)值,數(shù)據(jù)的價(jià)值在數(shù)據(jù)背后.收集數(shù)據(jù)、繪制圖表固然重要,但更重要的是解讀數(shù)據(jù),這剛好對應(yīng)統(tǒng)計(jì)問題的第三步統(tǒng)計(jì)推斷.統(tǒng)計(jì)推斷能力是學(xué)生使用很簡單的方法,也能很睿智地解讀數(shù)據(jù).從數(shù)據(jù)中提取信息,并利用這些信息說明問題,在這個(gè)過程中,形成對數(shù)據(jù)的意識(shí),養(yǎng)成會(huì)拿數(shù)據(jù)“說事”的習(xí)慣,這種能力已經(jīng)成為高中數(shù)學(xué)課程要培養(yǎng)學(xué)生形成的一個(gè)基本能力.
3.1驚喜從認(rèn)識(shí)“統(tǒng)計(jì)量”開始
每個(gè)統(tǒng)計(jì)量都有規(guī)則合法的計(jì)算方法,統(tǒng)計(jì)量不是單純的數(shù)字,它是有“內(nèi)容”的,每種數(shù)據(jù)都代表著不同的意義.盡管現(xiàn)實(shí)生活中使用的統(tǒng)計(jì)量很多,但應(yīng)用廣泛的僅是少數(shù),高中數(shù)學(xué)我們主要關(guān)心兩個(gè)指標(biāo),即集中趨勢和離散程度.描述集中趨勢的有平均數(shù)(期望、均值)、眾數(shù)、中位數(shù)等;描述離散程度的統(tǒng)計(jì)量有方差、極值等.
平均數(shù)是刻畫集中趨勢最普遍的代表數(shù),具有較大的可靠性,但它的缺點(diǎn)是易受極端數(shù)據(jù)的影響.中位數(shù)的優(yōu)點(diǎn)是不受極端數(shù)據(jù)的影響,即使兩端存在未知數(shù)據(jù)時(shí),中位數(shù)依然可以求得.眾數(shù)的出現(xiàn)只與數(shù)據(jù)出現(xiàn)的頻數(shù)有關(guān),也不受極端數(shù)據(jù)的影響.在這三個(gè)特征數(shù)中,最有價(jià)值、用得最多的無疑是平均數(shù).如平均速度、平均身高、平均工資、平均壽命、平均溫度、平均降雨量、平均能耗等,人們早已耳熟能詳.學(xué)校也經(jīng)常用班級的平均分來對各班成績進(jìn)行衡量.而用中位數(shù)或眾數(shù)來給各班的成績定優(yōu)劣、給各個(gè)教師的教學(xué)質(zhì)量定高低之舉,人們卻鮮有耳聞.這是為什么呢?首先,這是因?yàn)槠骄鶖?shù)具有另兩個(gè)特征數(shù)都不具備的獨(dú)特優(yōu)點(diǎn):它用到了組內(nèi)所有數(shù)據(jù)的信息.平均數(shù)既然是由全體數(shù)據(jù)“糅合”而成,那么用它來刻畫這組數(shù)據(jù)的集中程度和整體水平,當(dāng)然就最合理、最可靠、最令人信服.其次,平均數(shù)易受極端數(shù)據(jù)影響的缺點(diǎn)可以借助一些技術(shù)手段予以克服.例如,在比賽中,人們常常在計(jì)算平均數(shù)時(shí)不考慮極端數(shù)據(jù)的情況,賽手的成績就是通過從評分中去掉一到兩個(gè)最高分和最低分得出來的.
人們習(xí)慣用極差、方差(標(biāo)準(zhǔn)差)來描述一組數(shù)據(jù)的波動(dòng)程度(離散程度),它們越大,說明數(shù)據(jù)的波動(dòng)越大;反之,越小.在分析數(shù)據(jù)時(shí),當(dāng)平均水平一致時(shí),為了更好地根據(jù)統(tǒng)計(jì)結(jié)果作出合理的判斷和預(yù)測,往往會(huì)根據(jù)極差和方差來判斷數(shù)據(jù)的穩(wěn)定性,從而作出正確決策.
統(tǒng)計(jì)量的核心價(jià)值就是從量化的數(shù)據(jù)中找出信息,并得出結(jié)論,完成統(tǒng)計(jì)推斷.建議教師多采用案例教學(xué)的方法,一切從實(shí)際出發(fā)培養(yǎng)學(xué)生運(yùn)用多重?cái)?shù)據(jù)指標(biāo)(統(tǒng)計(jì)量),做出正確的推斷.
3.2理解數(shù)學(xué)期望,離不開“權(quán)重”
調(diào)查表明約1/3的學(xué)生表示對數(shù)學(xué)期望的認(rèn)識(shí)僅局限于計(jì)算,學(xué)生只知道用公式將隨機(jī)變量與概率值連接起來得到數(shù)學(xué)期望值,對其定義的理解表現(xiàn)為“沒有什么實(shí)際的意義”或“不可理解”.如:隨機(jī)拋擲一枚骰子,所得點(diǎn)數(shù)的期望Eξ=35,很多學(xué)生反映對這一結(jié)果難以理解.因?yàn)轺蛔拥狞c(diǎn)數(shù)只存在6個(gè)整數(shù),不可能出現(xiàn)35這樣一個(gè)帶有小數(shù)點(diǎn)的數(shù)字結(jié)果,那么35這一數(shù)值到底是什么含義?它與實(shí)際值之間有何種聯(lián)系呢?事實(shí)上,計(jì)算結(jié)果應(yīng)該是多次實(shí)驗(yàn)后出現(xiàn)的實(shí)際值的平均數(shù),剛好反映了數(shù)學(xué)期望值的確定性與實(shí)際值不確定性之間的聯(lián)系.這樣數(shù)學(xué)期望與平均數(shù)建立了聯(lián)系,它反映的是隨機(jī)變量取值的平均水平.
數(shù)學(xué)期望本質(zhì)是一種加權(quán)的平均,學(xué)生理解加權(quán)平均數(shù)中“權(quán)”的涵義也是比較困難的.事實(shí)上,數(shù)學(xué)期望概念中概率擔(dān)當(dāng)?shù)慕巧褪羌訖?quán)平均數(shù)中“權(quán)重”的角色.盡管數(shù)學(xué)期望和平均數(shù)及加權(quán)平均數(shù)都是一個(gè)具體的數(shù),它反映的是平均值.而數(shù)學(xué)期望表示的是一種“可能性”的大小,是對“未來”的預(yù)見.意思是說在若干次試驗(yàn)后,該數(shù)值(數(shù)學(xué)期望)或相近值出現(xiàn)的可能性最大,但并不能確切的說平均值是多少.
從算術(shù)平均數(shù)到加權(quán)平均數(shù),再到數(shù)學(xué)期望,其實(shí)是一個(gè)很大的跨越.從內(nèi)容上講,是一個(gè)逐步深入的螺旋上升的過程,從方法上講,是科學(xué)性不斷加強(qiáng)的過程.筆者建議教師在進(jìn)行數(shù)學(xué)期望(方差)的教學(xué)之前,要符合學(xué)生的認(rèn)知規(guī)律,先借助一些簡單的實(shí)際問題復(fù)習(xí)之前學(xué)過的加權(quán)平均數(shù)(如:混合糖果的單價(jià)問題等),復(fù)習(xí)“權(quán)重”在計(jì)算平均數(shù)中的作用,使之自然地過渡到對數(shù)學(xué)期望概念的教學(xué),幫助學(xué)生更好地理解數(shù)學(xué)期望和加權(quán)平均數(shù)之間的聯(lián)系,從而能較好地解決實(shí)際應(yīng)用問題,學(xué)會(huì)用數(shù)據(jù)回答我們面對的問題.