李紅春++彭禮兵
函數(shù)關(guān)系是一種確定性關(guān)系,相關(guān)關(guān)系是一種非確定性關(guān)系. 回歸分析是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法. 下面對(duì)本節(jié)內(nèi)容的考點(diǎn)作一個(gè)總結(jié),希望對(duì)大家的學(xué)習(xí)有所幫助.
相關(guān)性的判斷
例1 對(duì)變量[x],[y]有觀測(cè)數(shù)據(jù)[(xi,yi)][(i=1,2,…,10)],得散點(diǎn)圖(1);對(duì)變量[u],[v]有觀測(cè)數(shù)據(jù)[(ui,vi)][(i=1,2,][…,10)],得散點(diǎn)圖(2). 由這兩個(gè)散點(diǎn)圖可以判斷( )
A. 變量[x]與[y]正相關(guān),[u]與[v]正相關(guān)
B. 變量[x]與[y]正相關(guān),[u]與[v]負(fù)相關(guān)
C. 變量[x]與[y]負(fù)相關(guān),[u]與[v]正相關(guān)
D. 變量[x]與[y]負(fù)相關(guān),[u]與[v]負(fù)相關(guān)
答案 C
點(diǎn)評(píng) 在散點(diǎn)圖中,點(diǎn)散布在從左下角到右上角的區(qū)域,則兩個(gè)變量為正相關(guān);點(diǎn)散布在從左上角到右下角的區(qū)域,則兩個(gè)變量為負(fù)相關(guān).
樣本中心點(diǎn)的性質(zhì)
例2 兩個(gè)相關(guān)變量滿足如下關(guān)系:
[[x] 2 3 4 5 6 [y] 25 ○ 50 56 64 ]
根據(jù)表格已得回歸方程:[y=9.4x+9.2],但表中有一數(shù)據(jù)模糊不清,請(qǐng)推算該數(shù)據(jù)是( )
A. 37 B. 38.5 C. 39 D. 40.5
解析 本題主要考查線性回歸直線的重要性質(zhì)——樣本點(diǎn)的中心在回歸直線上[x=2+3+4+5+65][=4], [y=9.4×4+9.2=46.8]. 設(shè)看不清的數(shù)據(jù)為[a],則[25+a+50+56+64=5y=234],解得,[a=39].
答案 C
點(diǎn)評(píng) 回歸直線方程一定過(guò)樣本中心點(diǎn)[(x,y)],這是解題的關(guān)鍵.
回歸直線方程的求法
例3 一組數(shù)據(jù)關(guān)系如下所示:
(1)畫出散點(diǎn)圖;
(2)求純利[y]與每天銷售件數(shù)[x]間的回歸直線方程;
(3)若該周內(nèi)某天銷售服裝20件,估計(jì)可獲純利多少元(保留到整數(shù)位). (回歸直線[y=a+bx]的斜率和截距的最小二乘估計(jì)分別為:[b=i=1nxiyi-nxyi=1nxi2-nx2] , [a=y-bx],[i=17xi2=280],[i=17yi2=45309],[i=17xiyi=3478].)
解析 (1)散點(diǎn)圖如圖所示.
(2)由散點(diǎn)圖知,[y]與[x]有線性相關(guān)關(guān)系.
∵[i=17xi2=280],[i=17yi2=45309],[i=17xiyi=3478],[x=6,][y=5597],
∴[a=5597-6×4.75=71914].
∴回歸直線方程為[y=4.75x+5597].
(3)當(dāng)[x=20]時(shí),[y=4.75×20+71914≈146].
因此,本周內(nèi)某天的銷售為20件時(shí),估計(jì)這天的純收入大約為146元.
點(diǎn)評(píng) 求回歸方程,關(guān)鍵在于求出系數(shù)[a],[b]. 由于計(jì)算量大,計(jì)算時(shí)應(yīng)謹(jǐn)慎仔細(xì),分層進(jìn)行,避免因計(jì)算而產(chǎn)生錯(cuò)誤.
非線性回歸方程向線性回歸方程轉(zhuǎn)化
例4 某公司為確定下一年度投入某種產(chǎn)品的宣傳費(fèi),需了解年宣傳費(fèi)[x](單位:千元)對(duì)年銷售量[y](單位:[t])和年利潤(rùn)[z](單位:千元)的影響,對(duì)近8年的宣傳費(fèi)[xi]和年銷售量[yi](i=1,2,3,…,8) 數(shù)據(jù)作了初步處理,得到下面的散點(diǎn)圖及一些統(tǒng)計(jì)量的值.
(1)根據(jù)散點(diǎn)圖判斷,[y=a+bx]與[y=c+dx],哪一個(gè)適宜作為年銷售量[y]關(guān)于年宣傳費(fèi)[x]的回歸方程類型(給出判斷即可,不必說(shuō)明理由).
(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立[y]關(guān)于[x]的回歸方程.
(3)已知這種產(chǎn)品的年利潤(rùn)[z]與[x],[y]的關(guān)系為[z=0.2y-x],根據(jù)(2)的結(jié)果回答下列問(wèn)題:
(i)當(dāng)年宣傳費(fèi)[x=49]時(shí),年銷售量及年利潤(rùn)的預(yù)報(bào)值時(shí)多少?
(ii)當(dāng)年宣傳費(fèi)[x]為何值時(shí),年利潤(rùn)的預(yù)報(bào)值最大?并求出最大值.
解析 (1)由散點(diǎn)圖可以判斷:[y=c+dx]適宜作為年銷售量[y]關(guān)于年宣傳費(fèi)[x]的回歸方程類型.
(2)令[w=x],建立[y]關(guān)于[w]的線性回歸方程.
由于[d=i=18wi-wyi-yi=18wi-w2=108.81.6=68],
[c=y-dw=563-68×6.8=100.6],
所以[y]關(guān)于[w]的線性回歸方程為[y=100.6+68w].
因此[y]關(guān)于[x]的回歸方程為[y=100.6+68x].
(3)(i)由(2)知,當(dāng)[x=49]時(shí),
年銷售量[y]的預(yù)報(bào)值[y=100.6+6849=576.6],
年利潤(rùn)[z]的預(yù)報(bào)值[z=576.6×0.2-49=66.32].
(ii)根據(jù)(2)的結(jié)果知,年利潤(rùn)[z]的預(yù)報(bào)值
[z=0.2×100.6+68x-x=-x+13.6x+20.12.]
故當(dāng)[x=13.62=6.8],即[x=46.24]時(shí),[z]取得最大值.
故年宣傳費(fèi)為46.24千元時(shí),年利潤(rùn)的預(yù)報(bào)值最大.
點(diǎn)評(píng) 回歸直線方程類型的選取往往要抓住圖形特點(diǎn),從函數(shù)的單調(diào)性、凸凹性加以分析. 本題的精妙之處在于通過(guò)換元將非線性關(guān)系[y=c+dx]轉(zhuǎn)化為線性關(guān)系[y=c+dw]后,再作統(tǒng)計(jì)分析.
相關(guān)系數(shù)的求法及應(yīng)用
例5 下圖是我國(guó)2008年至2014年生活垃圾無(wú)害化處理量(單位:億噸)的折線圖. 由折線圖看出,可用線性回歸模型擬合[y]與[t]的關(guān)系,請(qǐng)用相關(guān)系數(shù)加以說(shuō)明.
參考數(shù)據(jù):[i=17yi=9.32],[i=17tiyi=40.17],[i=17(yi-y)2]=0.55,[7≈2.646].
解析 由折線圖中的數(shù)據(jù)和附注中的數(shù)據(jù)得:
[t=4],[i=17(ti-t)2=28],[i=17(yi-y)2=0.55],[i=17(ti-t)(yi-y)][=i=17tiyi-ti=17yi=40.17-4×9.32=2.89],[r≈2.890.55×2×2.646≈0.99].
因?yàn)閇y]與[t]的相關(guān)系數(shù)為[0.99],說(shuō)明[y]與[t]的相關(guān)程度相當(dāng)高,從而可以用線性回歸模擬[y]與[t]的關(guān)系.
點(diǎn)評(píng) 用相關(guān)系數(shù)[r2]來(lái)刻畫變量間的相關(guān)程度,[r2]的值越小,說(shuō)明模型的相關(guān)程度越低.