鄧 力
現(xiàn)如今,統(tǒng)計(jì)學(xué)基礎(chǔ)教程幾乎都搭上了Excel的便車,至于用這款便車運(yùn)載論文課題等研究成果的,更是多得數(shù)不過(guò)來(lái)。Excel在作數(shù)據(jù)分析時(shí)很靈便,但美中不足的是含有小小沙粒。這沙粒如果不撥弄出來(lái),也會(huì)搞得人很不爽,以下是其中三顆。
■ 第一顆沙粒
從回歸分析中挑出來(lái)的
在眾多模型中,回歸模型以其赫赫老牌和經(jīng)世濟(jì)用而威風(fēng)不倒。自從有了電腦,回歸預(yù)測(cè)中那些個(gè)線性模型,尤其是非線性模型,也由讓人望而生畏而變得可親可近了。
話說(shuō)預(yù)測(cè)模型(yc)的構(gòu)建,是靠因變量(y)和自變量(x)的實(shí)際資料來(lái)支撐的。這y和yc不是一碼事,y表示因變量的實(shí)際值,yc表示因變量的預(yù)測(cè)值。但在輸出結(jié)果中,卻將y和yc弄混了,把原本為yc=a+bx的,誤寫成了y=a+bx。而要將誤寫的y改為yc,方法很簡(jiǎn)單,只要拖黑選定并右單擊y,選擇“數(shù)據(jù)標(biāo)志格式”,在彈出的對(duì)話框里,勾選下標(biāo),再選擇“確定”按鈕就可以了。
■ 第二顆沙粒
從統(tǒng)計(jì)圖中撥弄出來(lái)的
在什么山頭唱什么歌,柱形圖適合離散變量的資料,直方圖適合連續(xù)變量的資料。在圖表向?qū)Ю镱^的圖表類型中,柱形圖排名第一,而直方圖卻被“省略”掉了。沒有辦法的辦法是,根據(jù)所需急要,只好將柱形圖演變成直方圖了。
圖1是一個(gè)柱形圖,圖2是一個(gè)直方圖,圖2是在圖1的基礎(chǔ)上打造出來(lái)的。為什么要來(lái)這么一番改造,原因很簡(jiǎn)單。直觀來(lái)看,圖1顯示的是運(yùn)動(dòng)員身高的人數(shù)分布,身高是連續(xù)型變量,用柱形圖來(lái)表示,顯然不合適;由于連續(xù)變量的相鄰組限是重疊的,所以,各柱子之間應(yīng)該是零距離。
將柱形圖(圖1)改造成直方圖(圖2)的做法是:第1步,將各柱形之間的間隔調(diào)整為連續(xù)的,即右單擊柱形圖中的任意一個(gè)柱子,選擇“數(shù)據(jù)系列格式”,在彈出的對(duì)話框中,選擇“選項(xiàng)”選項(xiàng)卡,將“分類間距”調(diào)整為0,再選擇“確定”按鈕;第2步,將橫軸標(biāo)注的刻度改為連續(xù)的區(qū)間,即雙擊橫軸,將字體顏色改為白色,將字體背景顏色改為透明,這樣就將橫軸上原有的數(shù)值隱藏起來(lái)了,接著,在文檔中鍵入數(shù)值“1.801.902.002.102.202.30”,再將這些數(shù)值“復(fù)制——選擇性粘貼——確定”到電子表格的相應(yīng)位置,右單擊文本框并選擇“設(shè)置對(duì)象格式”,在“顏色與線條”選項(xiàng)卡中選擇線條顏色為白色,然后選擇“確定”按鈕;第3步,將直方圖和文本框進(jìn)行組合。好,如此這般,一個(gè)活脫脫的直方圖就出現(xiàn)了。
■ 第三顆沙粒
從回歸輸出中挑撥來(lái)的
有人打趣說(shuō),用電腦進(jìn)行回歸分析還真不錯(cuò),點(diǎn)擊之間,輸出一大片,寫個(gè)文章什么的,這結(jié)果占的空間大,給的信息多,一眼瞧上去還挺學(xué)術(shù),說(shuō)不準(zhǔn)還能唬人呵呵。是啊,簡(jiǎn)單實(shí)用,還能促成論文字?jǐn)?shù)的達(dá)標(biāo),順帶還可以唬一唬人,可不咋地,美呀!大家追捧回歸分析,熱情有增無(wú)減,從教材到雜志,從理論到實(shí)踐,由來(lái)已久?;貧w分析很風(fēng)光,這里不想繼續(xù)美言,而是想說(shuō)一說(shuō)其他,叨咕一下洋貨Excel的不是。
用這款軟件進(jìn)行回歸分析,操作步驟如下:“工具”→“數(shù)據(jù)分析”→“回歸”→“確定”,然后在回歸的對(duì)話框里,填上相關(guān)的信息,選擇“確定”按鈕。為了突出此行的目的──找沙粒,表中只列出了輸出結(jié)果的框架,而省去了用實(shí)例所輸出的數(shù)字。
表1就是回歸輸出的結(jié)果,表2是在表1基礎(chǔ)上修改的結(jié)果。
在表1中,隨手?jǐn)n來(lái)幾顆小沙粒,排列擺弄如下:
一是中英文夾雜。也知道這款軟件是飄洋過(guò)海來(lái)的,但大伙兒使用的是翻譯過(guò)來(lái)的中文版。顯然,這英譯漢還不到位,好些洋文還在其間拋頭露面,比如,SUMMARY OUTPUT、Multiple R、R Square、Adjusted R Square、Coefficients、Intercept等;好些英文縮略語(yǔ)也在其間探頭探腦,比如,df、SS、MS等。
二是門類沒列全。這是從輸出結(jié)果的結(jié)構(gòu)來(lái)看的。輸出的結(jié)果由三部分組成,也就是三張表格,即回歸統(tǒng)計(jì)、方差分析和參數(shù)估計(jì)。但參數(shù)估計(jì)這張表并沒有列明標(biāo)題,沒頭沒腦的,讓人一見就愣神兒。
三是表格不規(guī)范。既然輸出的結(jié)果是以表格的形式呈現(xiàn)的,自然就得遵守制表的規(guī)矩,要注意上基線、下基線和細(xì)線的位置,注意交叉線條的有序出沒等。當(dāng)然,使用者各取所需,有擷取其中一二的,有略作調(diào)整后全盤照搬的,但不管怎樣,輸出結(jié)果要一步到位。
四是缺省了負(fù)號(hào)。輸出結(jié)果中,相關(guān)系數(shù)一律為正,這顯然脫離了實(shí)際。相關(guān)系數(shù)有正有負(fù),正如世間有男有女一樣,缺一不可。相關(guān)系數(shù)的符號(hào),指明了相關(guān)變量的方向。兩變量的關(guān)系,如果是同升或同降的,就為正相關(guān),符號(hào)為正;如果是一升一降或一降一升的就為負(fù)相關(guān),符號(hào)為負(fù)。如果說(shuō)把負(fù)相關(guān)的結(jié)果顯示為正相關(guān)的,那么怎么也說(shuō)不過(guò)去。
同時(shí),表述也有不準(zhǔn),比如,在方差分析列表中,回歸分析應(yīng)為回歸離差。另外,還存在重復(fù)多余的問(wèn)題,比如,在參數(shù)估計(jì)列表中,既有Lower95%和Upper95%,又有下限95.0%和上限95.0%,顯然,其中一組,多此一舉。
其實(shí),回歸輸出結(jié)果的列表中,如果還增加兩張表,可能會(huì)更受歡迎。這兩張表,一張是三項(xiàng)檢驗(yàn)表,即列出相關(guān)系數(shù)、回歸系數(shù)、回歸方程的檢驗(yàn)結(jié)果與文字說(shuō)明;一張是預(yù)測(cè)結(jié)果表,即直接列出預(yù)測(cè)模型、個(gè)別值的區(qū)間預(yù)測(cè)值、平均值的區(qū)間預(yù)測(cè)值。要知道,回歸輸出雖好,但個(gè)別值和平均值的區(qū)間預(yù)測(cè)等,還要靠純手工操作,這實(shí)在是太累人。
總之,回歸輸出的結(jié)果還可以并且也應(yīng)當(dāng)輸出更養(yǎng)眼的結(jié)果。
(作者單位:湖南長(zhǎng)沙大學(xué))