□劉博洋(南開中學(xué)天津300100)
NBA球員排名系統(tǒng)的分析與評(píng)價(jià)
□劉博洋(南開中學(xué)天津300100)
為了評(píng)價(jià)NBA球員的表現(xiàn),ESPN(英文:Entertainment and Sports Programming Network,即娛樂與體育節(jié)目電視網(wǎng),一般簡(jiǎn)稱ESPN)在每年NBA休賽季組織專家對(duì)球員進(jìn)行排名,并提出了一套成體系的排名系統(tǒng),為NBA官方所采用。然而,很多球迷認(rèn)為該系統(tǒng)對(duì)進(jìn)攻型球員有一定的偏袒性。本文從統(tǒng)計(jì)分析的角度出發(fā),以2013年ESPN排名前50的球員得分為樣本,計(jì)算進(jìn)攻型球員和防守型球員得分的平均值,并進(jìn)一步分析兩種球員得分平均值是否有顯著性差異。統(tǒng)計(jì)軟件計(jì)算的結(jié)果未通過t檢驗(yàn),說明球員得分有顯著的不同,即該系統(tǒng)確實(shí)有一定的偏袒性。
NBA排名假設(shè)檢驗(yàn)顯著性分析
為了評(píng)估NBA球員在球場(chǎng)上的單場(chǎng)平均效率,NBA官方采用了ESPN專家約翰?霍林格提出的球員價(jià)值評(píng)估數(shù)據(jù)體系。利用PER值,可以將球員所有表現(xiàn)記錄下來,然后加權(quán)集成,綜合而成,便可以對(duì)不同位置、不同年代的球員進(jìn)行評(píng)估和比較。其計(jì)算公式為:[ (得分?jǐn)?shù)+助攻數(shù)+總籃板數(shù)+搶斷數(shù)+蓋帽數(shù))-(投籃出手?jǐn)?shù)-投籃命中數(shù))-(罰球出手?jǐn)?shù)-罰球命中數(shù))-失誤數(shù)]/球員的比賽場(chǎng)次,這個(gè)依據(jù)的得出,可以綜合判斷球員良性表現(xiàn),并且參照球員的球場(chǎng)不良表現(xiàn),接著根據(jù)球員出場(chǎng)的次數(shù)來得出單場(chǎng)平均的效率表現(xiàn),加以排名。然而,卻有一些專家對(duì)此頗有微詞,認(rèn)為這個(gè)排名體系對(duì)進(jìn)攻型球員有所偏袒。因此,本文以2013年EPSN排名中前五十的球員為樣本,分析該排名中進(jìn)攻型球員與防守型球員的得分是否有統(tǒng)計(jì)學(xué)意義上的顯著性區(qū)別。若區(qū)別顯著,則認(rèn)為該排名系統(tǒng)有所偏袒;若區(qū)別不顯著,則認(rèn)為該排名系統(tǒng)對(duì)于進(jìn)攻型與防守型的球員的評(píng)價(jià)是公平的。
2.1、模型假設(shè)與符號(hào)
2.2、兩樣本的差異顯著性檢驗(yàn)
假設(shè)檢驗(yàn),即對(duì)所估計(jì)的總體提出相應(yīng)的假設(shè),通過實(shí)驗(yàn)或調(diào)查得到的樣本數(shù)據(jù),用統(tǒng)計(jì)方法對(duì)樣本數(shù)據(jù)進(jìn)行分析,依據(jù)樣本提供的有限信息,來檢驗(yàn)假設(shè)是否成立,推斷總體情況的一種統(tǒng)計(jì)學(xué)方法。在假設(shè)檢驗(yàn)中,我們常把一個(gè)要檢驗(yàn)的假設(shè)記做,稱為原假設(shè)或零假設(shè),而把與之對(duì)立的假設(shè)稱為,稱為備擇假設(shè)。假設(shè)檢驗(yàn)有可能犯兩類錯(cuò)誤,在原假設(shè)為真時(shí)決定放棄原假設(shè),稱為第一類錯(cuò)誤,也稱“棄真”錯(cuò)誤,這類錯(cuò)誤出現(xiàn)的概率記為;在原假設(shè)為假時(shí)決定接受原假設(shè),稱為第二類錯(cuò)誤,也稱“存?zhèn)巍卞e(cuò)誤,這類錯(cuò)誤出現(xiàn)的概率,記為。如果我們控制第一類錯(cuò)誤出現(xiàn)的概率小于一定的閾值,如0.01、0.05,則這樣的假設(shè)檢驗(yàn)也稱顯著性檢驗(yàn),稱為顯著性水平。在本文中,我們使用兩個(gè)獨(dú)立樣本的t檢驗(yàn),即根據(jù)樣本數(shù)據(jù)對(duì)兩個(gè)樣本來自的兩獨(dú)立總體的均值是否有顯著差異進(jìn)行推斷。
2.3、t檢驗(yàn)的前提條件
(1)兩樣本相互獨(dú)立;
(2)樣本來自的兩個(gè)總體服從正態(tài)分布。
2.4、檢驗(yàn)步驟
(1)考慮兩個(gè)正態(tài)總體,其均值分別為和;
(2)寫出原假設(shè)和備擇假設(shè):
(3)選取一定的顯著性水平;
(4)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,由于此時(shí)兩總體方差未知且不等,構(gòu)造t統(tǒng)計(jì)量如下:
在H0下,
其中
(5)用統(tǒng)計(jì)軟件計(jì)算出t值及其對(duì)應(yīng)的P值;
(6)做出推斷:
①若P值顯著性水平,則拒絕原假設(shè),即認(rèn)為兩總體均值有顯著性差異;
②若P值顯著性水平,則接受原假設(shè),即認(rèn)為兩總體均值沒有顯著性差異。
(1)我們選取2013年排名前50的球員作為樣本,樣本量相對(duì)比較大,因此我們可以近似認(rèn)為樣本是服從正態(tài)分布的;可將球員分為兩部分,一部分屬于進(jìn)攻型球員,如,中鋒,前鋒,另一部分屬于防守型球員,如后衛(wèi),根據(jù)實(shí)際情況可知,兩種球員來自相互獨(dú)立的兩個(gè)總體,所以,可以使用t檢驗(yàn)。
(2)作出原假設(shè)和備擇假設(shè):
(3)代入實(shí)際數(shù)據(jù)。
根據(jù)2014年EPSN排名前50的球員的得分,經(jīng)過簡(jiǎn)單的數(shù)據(jù)處理可知:進(jìn)攻型球員的平均得分=20.62,防守型球員的平均得分=20.18,進(jìn)攻型球員得分的方差=11.89,防守型球員得分的方差=10.43,進(jìn)攻型球員的樣本量=32,防守型球員的樣本量=18。經(jīng)過統(tǒng)計(jì)軟件計(jì)算,可以得到與之對(duì)應(yīng)的P值=0.65472。
(4)得出結(jié)論。
一般情況下,我們經(jīng)常采取0.01、0.05、0.1這三個(gè)值作為顯著性水平,在這三個(gè)顯著性水平下,P值均大于這個(gè)臨界值,所以拒絕原假設(shè),即認(rèn)為進(jìn)攻型球員與防守型球員得分有顯著性的差異。這也說明該系統(tǒng)確實(shí)具有一定的偏袒性。
該模型從生活實(shí)際入手,從實(shí)際中發(fā)現(xiàn)問題,并用科學(xué)的統(tǒng)計(jì)分析的方法分析和解決問題,對(duì)日常生活中的問題給出了科學(xué)的解釋。然而,該模型也有一定的不足之處,首先,該模型僅選取了2013年中一部分球員的得分進(jìn)行分析,相對(duì)于NBA這項(xiàng)宏大的賽事多年積累的賽事經(jīng)驗(yàn),數(shù)據(jù)量偏??;其次,該模型的抽樣有一定的偏差,選取了排名前五十的球員作為樣本,這部分球員已經(jīng)是整體上表現(xiàn)相對(duì)較好的球員,不能全面的代表NBA所有球員,若有條件,可以進(jìn)一步考慮使用分層抽樣的方法獲取數(shù)據(jù);最后,該模型使用EXCEL中的統(tǒng)計(jì)函數(shù)做數(shù)據(jù)分析,分析的結(jié)果可能稍有誤差,考慮到兩樣本均值十分接近,應(yīng)努力消除該誤差的影響,采用R,SPSS等多種統(tǒng)計(jì)分析軟件進(jìn)行相互驗(yàn)證,以確保結(jié)論的科學(xué)準(zhǔn)確性。
附表:2013-2014 NBA常規(guī)賽技術(shù)統(tǒng)計(jì)排行——得分榜
[1]2013年ESPN球員排名.美國(guó)有線電視聯(lián)播網(wǎng).
[2]何丹等.基于因子分析的NBA現(xiàn)役球員綜合能力評(píng)價(jià)[J].漢口學(xué)院學(xué)報(bào),2013.
G811
A
1006-8902-(2016)-11-SY