楊廣清 王小琪
數(shù)據(jù)是蘊(yùn)涵信息的,收集、整理、描述、分析數(shù)據(jù)有助于我們從數(shù)據(jù)中獲取信息。而生活中的數(shù)據(jù)是海量的,因此我們有必要從中選取具有代表性的信息,幫助我們做出正確的估計(jì)、推斷、決策,解決日常生活中的一些問題。
本章內(nèi)容共有6節(jié),前3節(jié)是統(tǒng)計(jì)部分的應(yīng)用,后3節(jié)是概率方面的應(yīng)用。我們之前已經(jīng)了解了統(tǒng)計(jì)和概率的相關(guān)知識,然后便可以運(yùn)用所學(xué)的知識來解決生活中的問題,從而更好地認(rèn)識世界。
統(tǒng)計(jì)調(diào)查是數(shù)據(jù)的采集過程,統(tǒng)計(jì)整理是對統(tǒng)計(jì)調(diào)查獲得的資料進(jìn)行加工整理、匯總列表,使之符合當(dāng)前統(tǒng)計(jì)研究目的的需要。這不僅僅是對統(tǒng)計(jì)數(shù)據(jù)進(jìn)行整理、描述、分析,還需要我們做一些簡單的估計(jì)推算工作。下面就按照每一節(jié)的內(nèi)容來說說“統(tǒng)計(jì)和概率的簡單應(yīng)用”那些事兒。
一、中學(xué)生的視力情況調(diào)查
這一節(jié)知識我們需要掌握兩項(xiàng)內(nèi)容:一是要知道普查的局限性和抽樣調(diào)查的必要性,抽樣調(diào)查的樣本要有代表性和普遍性;二是學(xué)會用抽樣調(diào)查的結(jié)果即樣本來估計(jì)總體的情況,正因?yàn)樾枰脴颖竟烙?jì)總體,進(jìn)而影響決策,因此要求抽樣調(diào)查的樣本具有代表性。
例1為確定本市七、八、九年級校服的尺寸,有關(guān)部門準(zhǔn)備對8000名初中男生的身高做調(diào)查,現(xiàn)有3種方案:
(1)測量體校中200名男子籃球、排球隊(duì)員的身高;
(2)查閱有關(guān)外地200名男生身高的統(tǒng)計(jì)資料;
(3)在市區(qū)和郊區(qū)各選4所初中,在這8所學(xué)校的所有年級(1)班中,用抽簽的辦法選出15名男生,然后測量他們的身高。
為了達(dá)到估計(jì)本市初中3個(gè)年級男生身高分布的目的,你認(rèn)為上述哪種調(diào)查方案合理。
【解析】本題中,方案(1)體校男子籃球、排球隊(duì)員身高往往高于一般學(xué)生,樣本選取比較特殊,不具有代表性;方案(2)外地學(xué)生的身高由于地域或生活條件的差異,也不能準(zhǔn)確反映本地學(xué)生的身高情況;方案(3)的抽樣方法符合隨機(jī)的原則,而且考慮到了年級、城郊的區(qū)別,樣本中個(gè)體的數(shù)目比較合適,樣本具有代表性。
【點(diǎn)評】要判斷一個(gè)樣本相對總體是否具有代表性,一看樣本調(diào)查范圍的大小,一般來說,范圍小不具有代表陛;二看樣本是否具有普遍性,是否能反映總體的一般情況;三看抽樣是不是隨機(jī)的。
二、貨比三家
這一節(jié)知識在生活中經(jīng)常用到。生活中我們會遇到很多數(shù)據(jù),從中能夠獲得許多有用的信息,但有些信息不一定全面、客觀,需要從不同的角度觀察、分析數(shù)據(jù),感受數(shù)據(jù)對于決策的重要性,進(jìn)而全面綜合考慮各個(gè)因素,“貨比三家”。
為了吸引零售超市到某個(gè)地方來營業(yè),如果這樣介紹:這個(gè)地方居民的平均收入非常高。看到這個(gè),就以為這個(gè)地方的大多數(shù)居民都屬于高收入階層,那就有可能是不正確的。如果有一個(gè)億萬富翁恰好住在該地方,其他人可能是一般收入人群,而該地區(qū)平均收入?yún)s仍然很高。
例2某公司銷售部有人員15人,銷售部為了制定某種商品的月銷售任務(wù),統(tǒng)計(jì)了這15人某月的銷售量如下表:
如果把平均月銷售額作為他們的銷售任務(wù),這樣的平均合理嗎?
【點(diǎn)評】“平均”這個(gè)詞往往是“算術(shù)平均值”的簡稱,這是一個(gè)很有用的統(tǒng)計(jì)學(xué)的度量指標(biāo)。平均數(shù)絕大部分時(shí)候能反映客觀情況,但容易受到極端值的影響,從而造成“平均數(shù)不平均”的現(xiàn)象。如工廠中有少數(shù)高薪者,“平均”工資就會給人錯(cuò)誤的印象。再如,某公司招聘員工,從15名應(yīng)聘者中取筆試成績前8名進(jìn)入下一輪,那如果要判斷是否進(jìn)入下一輪,應(yīng)聘者只需要用自己的成績與15個(gè)成績的中位數(shù)(第8名)對比即可。因此我們應(yīng)根據(jù)實(shí)際需要,選取合適的角度觀察分析數(shù)據(jù)。
三、統(tǒng)計(jì)分析幫你做預(yù)測
在這一節(jié),我們感受到用函數(shù)圖像可以大致判斷事物的發(fā)展趨勢,進(jìn)一步體會到統(tǒng)計(jì)與預(yù)測之間的關(guān)系。如在日常生活中,學(xué)生的身高和體重之間存在著某種關(guān)系,這樣的關(guān)系不一定完全貼合函數(shù)的圖像,可能是近似地體現(xiàn)變化趨勢,但是借助這樣的變化趨勢,我們同樣可以預(yù)測一些結(jié)果,更好地服務(wù)于生活。
例3小明隨機(jī)調(diào)查了某種樹的樹葉長(cm)與最寬處的寬度(cm),整理如下:
(1)以最寬處為橫坐標(biāo),樹葉長為縱坐標(biāo),在平面直角坐標(biāo)系中畫出對應(yīng)的點(diǎn),并選用適當(dāng)?shù)闹本€近似地表示它們之間的變化趨勢;
(2)求這種樹葉的樹葉長與最寬處之間關(guān)系的表達(dá)式,并估計(jì)當(dāng)最寬處是3cm的時(shí)候,樹葉長度是多少?
【解析】在平面直角坐標(biāo)系里畫出它們對應(yīng)的點(diǎn),發(fā)現(xiàn)圖像可以近似地看成一條直線。恰當(dāng)?shù)剡x取兩個(gè)點(diǎn)作一條直線,并盡量使其他的點(diǎn)在這條直線附近,從而求出函數(shù)表達(dá)式,進(jìn)而根據(jù)自變量的取值,得出對應(yīng)的函數(shù)值。
【點(diǎn)評】通過樣本對總體進(jìn)行估計(jì),在生活中還有很多類似的例子。我們常常用統(tǒng)計(jì)知識發(fā)現(xiàn)兩個(gè)量之間存在著一定的關(guān)系,從而進(jìn)行預(yù)測,幫助我們做出決策。
四、抽簽方法合理嗎
這一節(jié)主要講抽簽在生活中應(yīng)用的合理性。很多時(shí)候用抽簽的方法決定某件事情,比如用抽簽決定誰去參加比賽,那么先抽的人和后抽的人中簽的概率一樣嗎?概率論的興起,本來是由保險(xiǎn)事業(yè)的發(fā)展而產(chǎn)生起來的,但刺激數(shù)學(xué)家思考概率論問題的卻來自賭博者的請求?;莞沟摹墩撡€博中的計(jì)算》,是概率論最早的一部著作。華蘅芳與傅蘭雅合譯的《決疑數(shù)學(xué)》是最早介紹到我國的概率論著作。概率論現(xiàn)在已經(jīng)成了數(shù)學(xué)的一個(gè)重要分支,在科學(xué)技術(shù)的各個(gè)領(lǐng)域里都有著十分廣泛的應(yīng)用。
例4為決定誰獲得僅有的一張電影票,甲和乙設(shè)計(jì)了如下游戲:在三張完全相同的卡片上,分別寫上字母A、B、B,背面朝上,每次活動洗勻。
甲說:我隨機(jī)抽一張,抽到字母B,電影票歸我;
乙說:我隨機(jī)抽一張后放回,再隨機(jī)抽一張,若兩次抽到的字母相同,電影票歸我。
(1)求甲獲得電影票的概率;(2)求乙獲得電影票的概率;(3)這個(gè)游戲公平嗎?
【解析】(1)甲獲得電影票的概率是2/3;(2)利用樹狀圖或表格,容易得出共有9種可能的結(jié)果,它們的出現(xiàn)是等可能的,兩次抽到的字母相同的結(jié)果有5種,因而乙獲得電影票的概率是5/9;(3)甲、乙獲得電影票的概率不相等,這個(gè)游戲不公平。
【點(diǎn)評】游戲公不公平取決于這兩個(gè)事件發(fā)生的概率是否相等,而非等于1/2。乙獲得電影票這個(gè)事件是有放回的抽取,因而第二次抽取不受第一次影響,在畫樹狀圖或列表格時(shí),需要關(guān)注第一次抽的卡片,第二次仍可以被抽到。若出現(xiàn)“無放回”或“隨機(jī)抽取兩個(gè)”,這個(gè)事件就屬于無放回抽取,第一次抽到的卡片,第二次是抽不到的。
五、概率幫你做估計(jì)
這一節(jié)我們主要學(xué)習(xí)如何估計(jì)某個(gè)種群的數(shù)量,比如估計(jì)魚塘中魚的數(shù)量等。在進(jìn)行估計(jì)的時(shí)候常采用“捉放捉”的方法,即先捕捉魚若干條,做上記號,然后放歸,過段時(shí)間后,重新捕捉,通過計(jì)算捕捉的魚的數(shù)量及帶記號的數(shù)量,從而估計(jì)出魚塘中魚的條數(shù)。
例5在一個(gè)不透明的袋中裝有除顏色外其余均相同的n個(gè)小球,其中有5個(gè)黑球,從袋中隨機(jī)摸出一球,記下其顏色,這稱為一次摸球試驗(yàn).之后把它放回袋中,攪勻后,再繼續(xù)摸出一球。以下是利用計(jì)算機(jī)模擬的摸球試驗(yàn)次數(shù)與摸出黑球次數(shù)的列表:
根據(jù)列表,可以估計(jì)出n的值是____。
【解析】通過表格得出摸出黑球的概率隨著試驗(yàn)次數(shù)的增多,逐漸穩(wěn)定在某個(gè)值的附近。經(jīng)過大量的試驗(yàn)得到摸出黑球的頻率的估計(jì)值是1/2,我們就用這個(gè)頻率去估計(jì)概率,再由n個(gè)小球中有5個(gè)黑球,可估計(jì)得n的值是10。
【點(diǎn)評】每個(gè)對象出現(xiàn)的次數(shù)與總次數(shù)的比值稱為頻率,大量重復(fù)試驗(yàn)所得到的隨機(jī)事件發(fā)生的實(shí)際頻率接近于該事件發(fā)生的理論概率,我們常常用大量重復(fù)試驗(yàn)的頻率去估計(jì)理論概率。還有一些事件,從理論上看,比較難以得出概率,我們也可以用頻率來估計(jì)概率。
六、收取多少保險(xiǎn)費(fèi)才合理
這一節(jié)內(nèi)容主要是進(jìn)一步理解事件發(fā)生的頻率與概率之間的關(guān)系,會利用概率計(jì)算隨機(jī)事件發(fā)生的平均次數(shù),體會概率在生活中特別是保險(xiǎn)業(yè)中的應(yīng)用。
首先要理解事件發(fā)生的平均次數(shù),一般地,如果隨機(jī)事件A發(fā)生的概率是P(A),那么在相同的條件下重復(fù)n次試驗(yàn),事件4發(fā)生的次數(shù)的平均值m為nxP(A)。
例6人壽保險(xiǎn)公司的一張關(guān)于某地區(qū)的生命表的部分摘錄如下:
(1)某人今年50歲,他當(dāng)年去世的概率是多少(精確到0.001);
(2)如果有20000個(gè)50歲的人參加人壽保險(xiǎn),當(dāng)年死亡的人均賠償金為10萬元,預(yù)計(jì)保險(xiǎn)公司需賠償?shù)目傤~為多少?
【解析】50歲當(dāng)年去世的概率,用50歲去世的人數(shù)除以50歲的總?cè)藬?shù),得:=0.012;用這個(gè)概率估計(jì)20000個(gè)50歲的人去世的概率,估計(jì)出這20000個(gè)人里面當(dāng)年去世的人數(shù),從而求出賠償總額,20000x0.012x10=2400萬。
【點(diǎn)評】我們應(yīng)在保險(xiǎn)業(yè)的背景下理解平均次數(shù)、平均值的概念,比如某事件發(fā)生的概率為0.3,不是每10次必有3次發(fā)生,而是在大量重復(fù)試驗(yàn)下,平均每10次大約發(fā)生3次。
(作者單位:江蘇省儀征市教學(xué)研究室,江蘇省儀征市實(shí)驗(yàn)中學(xué)東區(qū)校)