• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于多角度線性回歸分析的第32屆奧運會前十名國家成績預測

      2018-10-20 16:27李貴熙綦文彬侯宗潤
      數(shù)碼設(shè)計 2018年6期
      關(guān)鍵詞:東道主獎牌榜線性

      李貴熙 綦文彬 侯宗潤

      摘要:本文主要探討了奧運會獎牌榜的預測問題,主要通過建立線性回歸(一元及多元)模型、使用SPSS和Excel等軟件對歷屆奧運會獎牌榜進行多角度分析并得到最優(yōu)預測模型。在模型一的建立中,本文使用時間序列法進行預測、建立回歸模型。由于模型一中對于某些國家獎牌榜預測與實際出入較大,在模型二的建立中,本文綜合考慮了GDP,人口數(shù)量,東道主效應(yīng)等因素建立多元回歸模型。綜合模型一與模型二的求解結(jié)果,得到2020年東京奧運會獎牌榜前十名及其金牌數(shù)與獎牌數(shù)。

      關(guān)鍵詞線性回歸;時間序列法;奧運會獎牌預測;誤差分析;數(shù)學建模

      中圖分類號:O213文獻標識碼:A文章編號:1672-9129(2018)06-0256-05

      Performance Forecast of the Top 10 Countries of the 32nd Olympic Games Based on Multi-Angle Linear Regression Analysis

      LI Guixi*, QI Wenbin, HOU Zongrun

      (Qingdao Second Middle School, Shandong Province, Qingdao 266000, China)

      Abstract:this paper mainly discusses the forecasting problem of Olympic medals list, mainly through the establishment of linear regression(one dollar and multiple elements) model, the use of SPSS and Excel and other software to carry out multi-angle analysis of successive Olympic medals list and get the best prediction model. In the establishment of model one, this paper uses time series method to predict and establish regression model. Due to the large difference between the forecast and the actual number of medals in some countries in model 1, in the establishment of model 2, this paper comprehensively considers the factors such as GDP, population, and host effect to establish a multiple regression model. The results of the comprehensive model 1 and model 2 solutions obtained the top ten medals in the 2020 Tokyo Olympic Games and the number of gold medals and medals.

      Keywords:Linear regression; Time series method; Olympic medal forecast; Error analysis; Mathematical modeling

      引用:李貴熙, 綦文彬, 侯宗潤. 基于多角度線性回歸分析的第32屆奧運會前十名國家成績預測[J]. 數(shù)碼設(shè)計, 2018, 7(6): 256-260.

      CiteLI Guixi, QI Wenbin, HOU Zongrun. Performance Forecast of the Top 10 Countries of the 32nd Olympic Games Based on Multi-Angle Linear Regression AnalysisJ]. Peak Data Science, 2018, 7(6): 256-260.

      1? 引言

      1.1? 現(xiàn)有研究成果

      對于奧運會獎牌預測問題,現(xiàn)在已有如下研究成果:吳殿廷、吳穎[1]使用GM(1,1)模型,預測北京奧運會中、美兩國可能會獲得的金牌數(shù)。Bernard與Busse[2]利用柯布--道格拉斯生產(chǎn)函數(shù)對獎牌數(shù)分布進行研究。 Condon[3]等人建立人工神經(jīng)網(wǎng)絡(luò)模型,預測世界各國在奧運會比賽的成績積分。

      1.2? 論文內(nèi)容、數(shù)據(jù)介紹及架構(gòu)

      本文根據(jù)以往各國獎牌榜排名情況,綜合考慮GDP,人口數(shù)量,東道主效應(yīng)等各種能夠影響所獲獎牌數(shù)的因素,建立模型,對2020年東京奧運會獎牌榜前十名國家及其獎牌數(shù)與金牌數(shù)進行預測,并得到較為成功的結(jié)果,對接下來的奧運會訓練具有指導意義(見5.2)。

      接下來,本文將會介紹模型假設(shè)及變量,文章第二部分將使用時間序列法進行一元線性回歸模型(模型一)的建立與求解并分析問題與解決方案,第三部分將進行多元線性回歸模型(模型二)的建立與求解并分析問題與解決方案,第四部分將對可能影響奧運會金牌數(shù)及獎牌數(shù)預測的因素舉例做出定性(定量內(nèi)容見4.6)討論,第五部分將給出各模型及最終預測的結(jié)果,第六部分列舉本文所用參考文獻。

      1.3? 模型假設(shè)

      a.假設(shè)所有GDP與人口數(shù)據(jù)準確。

      b.假設(shè)奧運會當年沒有國際爭端問題。

      c.假設(shè)各國GDP與人口與時間呈線性關(guān)系。

      d.假設(shè)不考慮奧運會場地,地理位置,氣候等因素的差別。

      e.假設(shè)每個國家獲得獎牌數(shù)與往屆奧運會獲得的獎牌數(shù)有關(guān)。

      f.假設(shè)奧運會各項比賽規(guī)則、設(shè)置不變。

      1.4? 變量及單位

      下表1是本文用到的變量符號及其含義和單位。其余不在本表中列出的變量及單位會在公式后加以說明。

      2? 模型一的建立與求解

      2.1? 模型一的建立

      關(guān)于縱向?qū)Ρ葕W運會歷史成績推測與第32屆奧運會的影響,本文建立模型一加以說明。模型一通過時間序列法,采用一元線性回歸模型,得到奧運會金牌數(shù)獎牌數(shù)與屆數(shù)的關(guān)系,并通過與后文模型二的對比討論出兩者的優(yōu)勢與不足并進行互補從而得到精確的結(jié)果[4]

      時間序列法是一種利用按時間排列的數(shù)據(jù)預測未來可能結(jié)果的方法,在實際應(yīng)用中范圍較廣[5]。本文模型一中獎牌數(shù)、金牌數(shù)與奧運會屆數(shù)的一元線性回歸模型公式如下:

      y=α01t+β????????????????????? (1)

      其中α1為變量系數(shù),β為常量,α0為隨機參數(shù)。

      下面本文將使用式(1)所用模型進行求解。

      2.2? 模型一的求解(以韓國為例)

      以韓國為例代入一元線性回歸模型一中[6]。下表2為韓國第14屆至第31屆奧運會歷史成績表[7]

      本文利用excel軟件進行模型一的建模。下圖1為韓國第14屆至第31屆奧運會金牌數(shù)及獎牌數(shù)擬合曲線圖[8]

      備注:圖中x為奧運會屆數(shù)(t),R2為決定系數(shù),其他見圖例

      綜上所述,韓國金牌數(shù)擬合公式如下:

      ygold=0.8506t-13.832?????????????????? (2)

      韓國獎牌數(shù)擬合公式如下:

      ymedal=2.0609t-30.643????????????????? (3)

      圖1中顯示(2)(3)式擬合程度R相對較高(85.97%和87.00%,對應(yīng)R2為0.7391和0.757),該模型通過R檢驗。代入t=32,可得模型一預測下的韓國第32屆奧運會金牌數(shù)及獎牌數(shù)(13枚,35枚)。

      本文接下來用同樣方法對其他國家進行一元線性擬合,其中部分方程在經(jīng)過噪聲點處理后擬合程度仍低于50%,其方程仍然列出,但在最后的預測中不會使用經(jīng)過這些方程計算的結(jié)果。詳細方程如下表3、表4所示:

      2.3? 模型一的缺點及可能的改進方案

      2.3.1? 模型一的缺陷

      模型一為一元線性回歸模型,變量過少,導致擬合的函數(shù)無法滿足所需要的結(jié)果。其次,在擬合過程中對于獎牌數(shù)起伏較大的國家有較大的誤差,噪聲點明顯。

      2.3.2? 模型一可能存在的改進方案

      本文考慮,針對誤差較大的問題,可以通過增加變量來解決或者采用局部加權(quán)線性回歸的方式解決;針對噪聲點問題,可以通過去掉不穩(wěn)定數(shù)據(jù)后對剩余穩(wěn)定數(shù)據(jù)進行分析的結(jié)果,或者去掉一個最大值和一個最小值后進行計算的方式來解決該問題[9]。

      綜合各國奧運會歷史成績,本文根據(jù)模型一得出結(jié)論:歷屆奧運會成績與第32屆奧運會預測成績之間存在一定關(guān)系(見表4)。

      3? 模型二的建立與求解

      3.1? 模型二的準備工作

      一元線性回歸模型(模型一)有很多缺陷與不足,而增加變量是減小誤差,使數(shù)據(jù)更加精確的有效辦法之一。本文將國家綜合實力拆分多個因素(見3.1.1),建立模型二加以討論。下面文章將建立并求解基于多元線性回歸模型進行分析的模型二,同時討論模型二存在的問題及可能的改進方案。

      3.1.1? 選用變量

      本模型綜合考慮國家綜合實力和東道主效應(yīng)對奧運會獎牌數(shù)和金牌數(shù)預測的影響,選用國家GDP、人口、東道主等變量進行建模。

      3.1.2? 數(shù)據(jù)標準化

      數(shù)據(jù)標準化是一種使原始數(shù)據(jù)轉(zhuǎn)換為無量綱化指標測評值的一種常用方法。因為各國家GDP數(shù)值折合當年的美元價格進行計算,所以使用的GDP數(shù)據(jù)[10]存在量綱不同的情況。本文主要采用min-max標準化(無量綱化),即將原數(shù)據(jù)映射到[0,1]內(nèi),再統(tǒng)一量綱為2016年(第31屆奧運會)美元GDP。其公式如下:

      (24)

      其中X'為標準化之后的數(shù)據(jù)(單位億美元),X為原數(shù)據(jù)(單位為本國貨幣),X2016為第31屆奧運會(2016年)當年該國GDP數(shù)據(jù)(單位為本國貨幣)。

      3.2? 模型二的建立與求解

      3.2.1? 模型二的建立(以匈牙利為例)

      模型二采用多元線性回歸方法進行建模,其公式如下:

      y=α01t+α2GDP+α3POP+α4Hold+β????? ???(25)

      該公式中y為金(獎)牌數(shù),α1、α2、α3、α4均為變量系數(shù),β為常數(shù),α0為隨機參數(shù)。

      下面本文以匈牙利為例建立并求解模型。下表5為匈牙利25屆奧運會之后的GDP數(shù)據(jù)、人口數(shù)量[11]、金牌數(shù)、獎牌數(shù)與東道主變量的統(tǒng)計表:

      本文接下來利用SPSS軟件,對匈牙利GDP、POP、東道主與金牌數(shù)、獎牌數(shù)的關(guān)系進行分析。詳細結(jié)果見下表6、7。

      以上表6、表7所體現(xiàn)的線性方程均通過了T測驗(94.7%和89.9%)和顯著性測驗(0.021和0.050),證明可以用作模型的解。

      綜上所述,我們得到了以下兩個關(guān)于匈牙利金牌數(shù)和獎牌數(shù)的多元線性回歸方程:

      ygold=-11.508t-0.003GDP-0.132POP+1669.576???????? (26)

      ymedal=-22.995t-0.004GDP-0.242POP+3114.645??????? (27)

      而在實際計算中,本文將GDP、POP增長速度進行線性回歸分析,得到了2020年匈牙利可能的GDP和人口數(shù)量(1321.65億美元,9753.3454萬人)。將以上數(shù)據(jù)帶入回歸方程(26)(27)中,可以得到2020年匈牙利金牌數(shù)和獎牌數(shù)的預測值(10金牌,13獎牌)。

      3.2.2? 模型二的求解

      其他國家的模型建立方程基本與匈牙利類似。經(jīng)檢驗,其他10個國家(詳見1.3)建立的多元線性回歸模型中有大部分成立。不成立(未通過測驗)的模型依舊在下表8、表9中列出,但是這些模型計算出來的結(jié)果不會參與最終預測(詳見5.1表11、表12中黑色數(shù)據(jù)部分)。下表8、表9為其他十國金牌數(shù)、獎牌數(shù)線性回歸分析表。

      備注:本表中除德國、匈牙利、俄羅斯等國家GDP、POP、Hold變量因東歐劇變而從第26屆奧運會(匈牙利為第25屆奧運會)開始采納分析,日本GDP、POP、Hold變量因東道主分析需要而從第18屆奧運會開始采納分析,中國GDP、POP、Hold變量因中國從第22屆奧運會開始參加而從第22屆奧運會開始采納分析以外,其余各國GDP、POP、Hold變量均從第20屆奧運會開始采納分析。下表同此規(guī)則。

      根據(jù)上表8、表9得到的模型二所預測出的結(jié)果見表12(見5.1)。

      合并GDP、POP、東道主效應(yīng)等多項因素的影響,本文根據(jù)模型二得出結(jié)論:國家綜合實力影響國家奧運會的成績,國家實力與該國奧運會成績基本呈現(xiàn)正相關(guān)(見表8、9)。

      3.3? 模型二的缺陷及其可能改進方案

      3.3.1? 模型二的缺陷

      模型二作為一個多元線性回歸模型,其問題集中體現(xiàn)在所建立模型擬合程度較低、容易忽略潛在的交互式或非線性關(guān)系、存在多重共線性問題等。

      3.3.2? 模型二可能存在的改進方案

      鑒于3.3.1提出模型二中可能存在的缺陷,本文考慮以下改進方案:忽略噪聲點、忽略異常因素(如政治、國際背景等原因)、考慮其他模型(如主成分回歸、偏最小二乘回歸[12])并進行分析等。

      4? 對于影響各國在奧運會獲得金牌數(shù)和獎牌數(shù)的其他因素的分析

      基于之前的討論,本文得出結(jié)論,國家GDP總量、人口總量、東道主效應(yīng)對國家獲得的獎牌數(shù)和金牌數(shù)有一定的影響。除此之外,本文經(jīng)討論后得出會對金牌數(shù)和獎牌數(shù)產(chǎn)生一定影響的因素有以下幾項:

      4.1? 國家發(fā)展性

      一個統(tǒng)一而強大的國家,更容易在奧運會上會取得優(yōu)異成績。以中國為例,1972年前,中國發(fā)展緩慢,國家實力弱,無法參加奧運會,沒有獎牌,但是隨著1972年以后中國政策不斷轉(zhuǎn)變,發(fā)展性不斷增強,近幾屆奧運會來中國已躋身世界前三,2008年北京奧運會更是在獎牌數(shù)上超越美國??梢姡瑖业木C合實力和發(fā)展性是影響其奧運會獲獎的因素之一(圖2)[13]。

      4.2? 運動員的身體以及心理素質(zhì)

      在奧運會賽場上,選手在身體和心理上的差異會對其發(fā)揮產(chǎn)生巨大的影響。如中國運動員劉翔,前后兩次奧運會因身體原因而當場棄權(quán)。再如,為中國隊摘得首金的女射擊運動員杜麗,首場比賽失利,她經(jīng)過場下心理調(diào)節(jié)后,在接下來比賽過程中發(fā)揮出應(yīng)有水平,最后摘得金牌。

      4.3? 國家對于體育的支持力度

      國家在體育方面的投入和它在奧運會上的成績呈正相關(guān)。對比中美,中國沒有在金牌數(shù)上超過美國的原因與中國在體育方面的投入不如美國有很大關(guān)系[14]。

      4.4? 舉辦城市的地理環(huán)境

      參加奧運會的選手來自五湖四海,各個地區(qū)的地理環(huán)境有所不同,因此選手們對舉辦城市的環(huán)境的適應(yīng)也會有所差異,從而影響選手在比賽中的發(fā)揮,因而會影響到國家在奧運會上的成績[15]。

      4.5? 國家人民對某項運動的熱愛(普及)程度

      某國家對于某項運動的普及會讓更多的人積極參與到該運動之中,有利于該項運動獲得更大發(fā)展?jié)摿Γ欣谑乖撨\動在奧運會上取得優(yōu)異成績;優(yōu)異成績又會提高該國人民對于這項運動的熱情與期望,繼而拉動整個國家對此運動的投入增加。二者良性循環(huán),互相作用,總體有利于國家成績的提高。

      4.6? 國家青少年人口比重

      4.6.1? 建立模型進行分析

      針對本因素,本文將進行定量分析。分析第30屆奧運會運動員年齡分布與所獲得獎牌數(shù)的關(guān)系,得到如下表10,參加第30屆奧運會田徑項目的運動員年齡與獲得獎牌數(shù)關(guān)系表[16]。

      4.6.2? 對該模型的求解

      本文通過SPSS軟件對表10數(shù)據(jù)進行非線性回歸分析,發(fā)現(xiàn)二次模型對于以上數(shù)據(jù)較為適合(圖3、圖4).

      其中男、女性年齡與獎牌數(shù)的二次關(guān)系擬合程度均可到達較高水平(0.97和0.921).本文得出結(jié)論,運動員的年齡與其實力的發(fā)揮呈二次函數(shù)關(guān)系。其表達式如下式(48)所示。

      ymedal∝age2?????????????????????????????????? (48)

      本文列出由SPSS軟件擬合的二次方程如下,僅供參考:

      (49)

      (50)

      4.6.3 ?結(jié)論

      可以看出,年齡相對較小的運動員往往蘊含著更多的可能性和更大的潛力。因此國家青少年占總?cè)丝诒戎厥窃搰〉贸煽兊闹匾蛩刂?。以美國為?sup>[17],美國對青少年體育的投入非常多,這也是中國在獎牌數(shù)稍遜于美國的原因之一。

      5? 第三十二屆東京奧運會前十名國家金牌及獎牌數(shù)目預測及其意義

      5.1? 結(jié)果預測

      綜合模型一和模型二以及第四部分的討論,列出下表11(左)、表12(右)為模型一、模型二所預測的下一屆奧運會獎牌數(shù)及金牌數(shù)前十一名國家。

      5.2? 意義分析

      通過上文的預測可以得出結(jié)論,影響國家在奧運會中的獲獎情況的因素有很多,對這些因素的分析有利于運動員有針對性的訓練和教練的針對性指導,為中國在奧運會上摘金奪銀、再創(chuàng)體育佳績提供參考。

      參考文獻:

      [1]????? 吳殿廷 ,吳穎. 2008 北京奧運會中國金牌趕超美國的可能性 ——基于東道主效應(yīng)的分析和預測[J].統(tǒng)計研究 ,2008 ,25 (3):60-64.

      [2]????? Bernard Andrew B , Meghan R Busse.Who Wins the Olympic Games: Economic Resources and Medals Totals [S]. Yale School of Organization and Management, mimeo, working paper ,2000:9-242.

      [3]????? CONDON E M , GOLDEN B L , WASIL E A. Predicting the success of nations at the Summer Olympics using neural networks[J ]. Computer Operations Res 1999 ,26 :1243-1265.

      [4]????? 張玉華,黃河科技學院,河北師范大學學報2013年3月第41卷第2期,基于線性回歸動態(tài)模型的中國第31屆奧運會獎牌數(shù)預測

      [5]????? N.T.Thomopoulos著,劉涌康等譯:《實用預測方法》,上??萍嘉墨I出版社,上海,1980

      [6]????? 中國礦業(yè)大學,里約奧運會獎牌榜預測,3-6,http://wenku.baidu.com/link? url=JXipeWt2B6hU-BOHpLqQetLYyHrLJDTgYd3dh0Ol5mB8toDvkluTMzoEEDTBhbAdBKsiLa_xPanYbN6jQ-ojLkj0i0PB43C5DYE57M7hanZ1yKdXG4XQzgfEtXU67eWX

      [7]????? 奧委會官網(wǎng),http://www.olympics.com/

      [8]????? 郭志軍,遼寧對外經(jīng)貿(mào)學員信息技術(shù)系,《寧波職業(yè)技術(shù)學院學報》2009年05期,TP391.13,應(yīng)用Excel對一元線性回歸模型的分析, http://www. cnki.com.cn/Article/CJFDTotal-NZYX200905018.htm

      [9]????? 陳國林,機器學習-回歸模型-欠擬合和過擬合,http://blog.csdn.net/ chenguolinblog/article/details/52404765

      [10]??? “汪方操123456”,數(shù)據(jù)標準化、歸一化處理,http://wenku.baidu.com/ link?url=tZ1IuMZWIqzTiGfHHd96exqA6WmWkls9glh10kzW6nYTYKmS8seq4kPnDFl-Krm78awcy76TVF6qIHQJpI-WvzYaFg6T3jYhLM4940EvbDK

      [11]??? 世界銀行,http://data.worldbank.org.cn/

      [12]??? 謝小韋、印凡成,河海大學,解決多元線性回歸中多重共線性問題的方法分析

      [13]??? 騰訊科技,高盛奧林匹克經(jīng)濟學:用經(jīng)濟模型預測奧運獎牌,http://tech. qq.com/a/20120715/000016.htm

      [14]??? 張亞威,中美體育經(jīng)濟發(fā)展比較研究,《智富時代》,?2015(3X)

      [15]??? 聶建軍,淺談地理環(huán)境對體育的影響,江西省豐城市拖船中學

      [16]??? 席繁宏,張健,張建華,王琳,田汜明,《西北民族大學學報(自然科學版)》,?2016,?36(1):60-66,第30屆倫敦奧運會田徑項目運動員年齡結(jié)構(gòu)與特征分析

      [17]??? 門麗,HUI M. clark,吳加利,美國青少年體育發(fā)展現(xiàn)狀給我國學校體育帶來的啟示,《沈陽體育學院學報》,?2006,?25(3):41-42

      猜你喜歡
      東道主獎牌榜線性
      88
      第45屆世界技能大賽中國代表團獎牌榜
      關(guān)于非齊次線性微分方程的一個證明
      何故要稱“東道主”
      非齊次線性微分方程的常數(shù)變易法
      線性耳飾
      探究向量的線性、坐標運算
      宝丰县| 当雄县| 大庆市| 棋牌| 玛曲县| 基隆市| 兖州市| 舟山市| 资阳市| 东丰县| 靖西县| 舞阳县| 和顺县| 那坡县| 临湘市| 忻州市| 中方县| 宿松县| 镇原县| 岚皋县| 班戈县| 商城县| 绥芬河市| 礼泉县| 巴南区| 龙泉市| 仁化县| 垣曲县| 拜泉县| 西乌珠穆沁旗| 宣威市| 浑源县| 建阳市| 横峰县| 应城市| 金平| 大田县| 曲阜市| 禹城市| 广南县| 哈巴河县|