徐銳
回歸方程是利用數(shù)理統(tǒng)計中的回歸分析,來確定兩種或兩種以上變數(shù)間相互依賴的定量關系的一種統(tǒng)計分析方法,運用十分廣泛. 近幾年高考所涉及的題目愈發(fā)凸顯出其應用性和問題設計的新穎、創(chuàng)造性,其時時刻刻在提醒我們“思路決定出路”. 同學們只有充分理解了回歸方程,冷靜分析問題的本質(zhì),才能以不變應萬變. 下面我們對高考中的不同題型進行分析和研究.
相關關系
例1 在一組樣本數(shù)據(jù)[(x1,y1),(x2,y2),]…,[(xn,yn)(n≥2),][(x1,x2,…,xn不全相等)]的散點圖中,若所有樣本點[(xi,yi)][(i=1,2,…,n)]都在直線[y=12x+1]上,則這組樣本數(shù)據(jù)的樣本相關系數(shù)為( )
A. -1 B. 0
C. [12] D. 1
解析 根據(jù)樣本相關系數(shù)的定義可知,當所有樣本點都在直線上時,相關系數(shù)為1.
所有樣本點[(xi,yi)(i=1,2,…,n)]都在直線[y=12x+1]上,故這組樣本數(shù)據(jù)完全正相關,故其相關系數(shù)為1.
答案 D
例2 下面的4個散點圖中,兩個變量具有相關關系的是( )
[④][③] [①] [②]
A. ①② B. ①③
C. ②④ D. ③④
解析 由圖可知:①是一次函數(shù)關系,不是相關關系;②中所有點在一條直線附近波動,是線性相關關系;③不具有相關關系;④在某曲線附近波動是非線性相關關系,所以兩個變量具有相關關系的是②④.
答案 C
點撥 相關關系與函數(shù)關系的區(qū)別:函數(shù)關系是一種確定性關系,體現(xiàn)的是因果關系;而相關關系是一種非確定性關系,體現(xiàn)的不一定是因果關系,可能是伴隨關系.
回歸方程的意義
例3 根據(jù)如下樣本數(shù)據(jù):
得到的回歸方程為[y=bx+a,]則( )
A. [a>0] ,[b<0]
B. [a>0] ,[b>0]
C. [a<0] ,[b<0]
D. [a<0] ,[b>0]
解析 根據(jù)已知樣本數(shù)判斷線性回歸方程中的[b]與[a]的符號. 依題意畫散點圖知,兩個變量負相關,所以[b<0,][a>0.]
答案 A
例4 設某大學的女生體重[y](單位:kg)與身高[x](單位:cm)具有線性相關關系,根據(jù)一組樣本數(shù)據(jù)[(xi,yi)][(i=1,2,…,n),]用最小二乘法建立的回歸方程為[y=0.85x-85.71,]則下列結論中不正確的是( )
A. [y]與[x]具有正的線性相關關系
B. 回歸直線過樣本點的中心[(x,y)]
C. 若該大學某女生身高增加1cm,則其體重約增加0.85kg
D. 若該大學某女生身高為170cm,則可斷定其體重必為58.79kg
解析 由回歸方程為[y=0.85x-85.71]知,[y]隨[x]的增大而增大,所以[y]與[x]具有正的線性相關關系. 由最小二乘法建立的回歸方程的過程知,[y=bx+a=bx+][y-bx(a=y-bx),]所以回歸直線過樣本點的中心[(x,y),]利用回歸方程可以預測估計總體,所以D項不正確.
答案 D
點撥 本題型考查兩個變量間的相關性、最小二乘法及正相關、負相關的概念.
線形回歸方程
(1)請畫出上表數(shù)據(jù)的散點圖;
(2)請根據(jù)上表提供的數(shù)據(jù),求出[y]關于[x]的線性回歸方程[y=bx+a];
(3)已知該廠技術改造前[100]噸甲產(chǎn)品能耗為[90]噸標準煤;試根據(jù)(2)求出的線性回歸方程,預測生產(chǎn)[100]噸甲產(chǎn)品的生產(chǎn)能耗比技術改造前降低多少噸標準煤?
解析 (1)散點圖如下:
(2)由系數(shù)公式可知,
(3)當[x=100]時,[y=0.7x+0.35=70.35],所以預測生產(chǎn)[100]噸甲產(chǎn)品的生產(chǎn)能耗比技術改造前降低[19.65]噸標準煤.
點撥 考查散點圖與回歸方程以及運算能力,屬于常規(guī)題.
例6 某數(shù)學老師身高176cm,他爺爺、父親和兒子的身高分別是173cm、170cm和182cm. 因兒子的身高與父親的身高有關,該老師用線性回歸分析的方法預測他孫子的身高為 cm.
分析 本題主要考查線性回歸分析的知識,考查運用線性回歸方程解決實際問題的能力.
錯解 第一組數(shù)據(jù)為1,2,3,4,第二組數(shù)據(jù)為173,170,176,182.
這樣擬合求出的回歸方程為[y=x+3,]當這個數(shù)學老師兒子的身高[x=182]cm時,他孫子的身高[y=185]cm.
點撥 此題錯誤率較高,大家對線性回歸方程的概念理解不夠透徹,主要是不確定哪兩個變量具有相關關系. 以前學習時對回歸直線方程只要求會運用公式進行具體計算[a,b,]求出回歸直線方程即可,不要求掌握回歸直線方程的推導過程. 所做的題大都已經(jīng)告訴同學們題中具有相關關系的兩個變量,只需依葫蘆畫瓢地按公式去算線性回歸方程和相關問題. 因此,同學們要認真審題,理解本質(zhì).
非線性回歸方程
例7 某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費[x](單位:千元)對年銷售量[y](單位:t)和年利潤[z](單位:千元)的影響,對近8年的年宣傳費[xi]和年銷售量[yi(i=1,2,…,8)]數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值.
(1)根據(jù)散點圖判斷,[y=a+bx]與[y=c+dx]哪一個適宜作為年銷售量[y]關于年宣傳費[x]的回歸方程類型?(給出判斷即可,不必說明理由)
(2)根據(jù)(1)的判斷結果及表中數(shù)據(jù),建立[y]關于[x]的回歸方程;
(3)已知這種產(chǎn)品的年利率[z]與[x,y]的關系為[z=0.2y-x.]根據(jù)(2)的結果回答下列問題:
①年宣傳費[x=49]時,年銷售量及年利潤的預報值是多少?
②年宣傳費[x]為何值時,年利率的預報值最大?
附:對于一組數(shù)據(jù)[(u1,v1),(u2,v2),…,(un,vn),]其回歸線[v=α+βu]的斜率和截距的最小二乘估計分別為:
[β=i=1n(ui-u)(vi-v)i=1n(ui-u)2,α=v-βu.]
解析 (1)由散點圖可以判斷,[y=c+dx]適合作為年銷售[y]關于年宣傳費用[x]的回歸方程類型.
(2)令[w=x,]先建立[y]關于[w]的線性回歸方程,
由于[d=i=18(wi-w)(yi-y)i=18(wi-w)2=108.816=68,]
[∴c=y-dw=563-68×6.8=100.6.]
[∴y]關于[w]的線性回歸方程為[y=100.6+68w,]
[∴y]關于[x]的回歸方程為[y=100.6+68x.]
(3)①由(2)知,當[x=49]時,年銷售量[y]的預報值:
[y=100.6+6849=576.6,]
[z=576.6×0.2-49=66.32.]
②根據(jù)(2)的結果知,年利潤[z]的預報值:
[z=0.2(100.6+68x)-x=-x+13.6x+20.12,]
∴當[x=13.62=6.8,]即[x=46.24]時,[z]取得最大值.
故宣傳費用為46.24千元時,年利潤的預報值最大.
點撥 本題考查了非線性擬合及非線性回歸方程的求解與應用,是源于課本的試題類型. 解答非線性擬合問題,先作出散點圖,再根據(jù)散點圖選擇合適的函數(shù)類型,設出回歸方程,利用換元法將非線性回歸方程化為線性回歸方程,求出樣本數(shù)據(jù)換元后的值,然后根據(jù)線性回歸方程的計算方法計算變換后的線性回歸方程系數(shù),即可求出非線性回歸方程,再利用回歸方程進行預報預測.
回歸分析的一般步驟:(1)確定研究對象,明確哪個變量是解釋變量,哪個變量是預報變量;(2)畫散點圖,觀察它們之間的關系(如是否存在線性關系等);(3)由經(jīng)驗確定回歸方程的類型(如觀察到的數(shù)據(jù)呈線性關系,再選用線性回歸方程);(4)按一定規(guī)則估計回歸方程中的參數(shù)(如最小二乘法);(5)得出結果后分析殘差圖是否有異常(個別數(shù)據(jù)對應殘差過大,或殘差呈現(xiàn)不隨機的規(guī)律性等等).