劉 晨
(安徽建筑大學(xué) 公共管理學(xué)院,安徽 合肥 230601)
高校學(xué)生體質(zhì)狀況直接影響人才的培養(yǎng),對(duì)國(guó)家未來的發(fā)展也有重要影響。借助決策樹算法來管理大學(xué)生體能測(cè)試數(shù)據(jù),能夠深度分析不同體測(cè)項(xiàng)目中大學(xué)生體質(zhì)健康檢測(cè)成績(jī),能夠更好地指導(dǎo)大學(xué)生體能測(cè)試訓(xùn)練。構(gòu)建大學(xué)生體能測(cè)試數(shù)據(jù)管理系統(tǒng),結(jié)合計(jì)算機(jī)信息化管理和優(yōu)化分類算法,進(jìn)行大學(xué)生體能測(cè)試數(shù)據(jù)分類管理和信息融合存儲(chǔ),優(yōu)化大學(xué)生體能測(cè)試數(shù)據(jù)管理,對(duì)提高大學(xué)生體能測(cè)試數(shù)據(jù)管理能力方面具有重要意義[1],相關(guān)的大學(xué)生體能測(cè)試數(shù)據(jù)管理系統(tǒng)設(shè)計(jì)研究受到人們的極大關(guān)注。
大學(xué)生體能測(cè)試數(shù)據(jù)管理系統(tǒng)是建立在對(duì)體測(cè)數(shù)據(jù)的優(yōu)化調(diào)度和信息融合的基礎(chǔ)上,建立大學(xué)生體能測(cè)試數(shù)據(jù)結(jié)構(gòu),通過分類算法和決策樹尋優(yōu)算法,進(jìn)行大學(xué)生體能測(cè)試數(shù)據(jù)管理[2,3]。目前已有相關(guān)領(lǐng)域?qū)W者對(duì)大學(xué)生體能測(cè)試數(shù)據(jù)管理系統(tǒng)進(jìn)行了設(shè)計(jì),(曲泉穎等,2019)提出了基于模糊信息融合的大學(xué)生體能測(cè)試數(shù)據(jù)管理方法,結(jié)合特征提取和信息融合,進(jìn)行大學(xué)生體能測(cè)試數(shù)據(jù)管理[4]。(于光華,2018)提出基于關(guān)聯(lián)特征分析的大學(xué)生體能測(cè)試數(shù)據(jù)管理模型,結(jié)合關(guān)聯(lián)特征檢測(cè)和相關(guān)特征提取,進(jìn)行大學(xué)生體能測(cè)試數(shù)據(jù)管理和數(shù)據(jù)庫(kù)設(shè)計(jì)[5]。
本文為提高大學(xué)生體能測(cè)試數(shù)據(jù)管理能力,提出基于ID3決策樹算法的大學(xué)生體能測(cè)試數(shù)據(jù)管理方法。構(gòu)建大學(xué)生體能測(cè)試數(shù)據(jù)挖掘及特征提取模型,在ID3決策樹設(shè)計(jì)大學(xué)生體能測(cè)試數(shù)據(jù)的分支體系,進(jìn)行學(xué)生體能測(cè)試數(shù)據(jù)管理水平評(píng)價(jià)的熵權(quán)指標(biāo)參數(shù)分析,結(jié)合軟件交叉編譯設(shè)計(jì),完成大學(xué)生體能測(cè)試數(shù)據(jù)管理系統(tǒng)的設(shè)計(jì),并通過仿真測(cè)試分析,驗(yàn)證了本文方法在提高大學(xué)生體能測(cè)試數(shù)據(jù)管理水平方面的優(yōu)越性能。
1.大學(xué)生體能測(cè)試數(shù)據(jù)挖掘
為了實(shí)現(xiàn)大學(xué)生體能測(cè)試數(shù)據(jù)管理,基于大學(xué)體育部主管課程老師所管理的大學(xué)生體測(cè)成績(jī),構(gòu)建大學(xué)生體能測(cè)試數(shù)據(jù)挖掘及特征提取模型,保證數(shù)據(jù)資料的精確性。采用決策樹尋優(yōu)方法進(jìn)行大學(xué)生體能測(cè)試數(shù)據(jù)的特征分類檢測(cè)[6,7],決策樹技術(shù)需通過離散化模式來處理最終體測(cè)數(shù)據(jù)。
設(shè)計(jì)大學(xué)生體能測(cè)試數(shù)據(jù)的分布維數(shù)為N×m維,得到大學(xué)生體能測(cè)試數(shù)據(jù)的量化評(píng)價(jià)空間分布矩陣X:
(1)
考慮到大學(xué)生體能測(cè)試數(shù)據(jù)的分布關(guān)聯(lián)系數(shù)J(m),J(N),通過對(duì)第i個(gè)節(jié)點(diǎn)存儲(chǔ)的大學(xué)生體能測(cè)試數(shù)據(jù)進(jìn)行加權(quán)融合,得到學(xué)生體能測(cè)試數(shù)據(jù)管理水平評(píng)價(jià)的模糊度參數(shù):
δxi+1=J(m),J(N)δxi
(2)
式中,δ表示模糊特征向量,獲取大學(xué)生體能測(cè)試數(shù)據(jù)的存儲(chǔ)空間,對(duì)存儲(chǔ)空間進(jìn)行優(yōu)化調(diào)度,實(shí)現(xiàn)學(xué)生體能測(cè)試數(shù)據(jù)管理的水平量化跟蹤[8],得到大學(xué)生體能測(cè)試數(shù)據(jù)的標(biāo)準(zhǔn)量化參數(shù),用xi∈X,i∈1,2,…,N表示,求得大學(xué)生體能測(cè)試數(shù)據(jù)量化參數(shù)的關(guān)聯(lián)系數(shù)表示為:
(3)
2.大學(xué)生體能測(cè)試數(shù)據(jù)信息融合
利用訓(xùn)練集建立大學(xué)生體能測(cè)試數(shù)據(jù)管理決策樹模型[9],根據(jù)數(shù)據(jù)特征構(gòu)建大學(xué)生體能測(cè)試數(shù)據(jù)的相似度分布集為:
(4)
在ID3決策樹模型下對(duì)大學(xué)生體能測(cè)試數(shù)據(jù)的屬性分類,提取大學(xué)生體能測(cè)試數(shù)據(jù)的粗糙集和相似度特征量,對(duì)于大學(xué)生體能測(cè)試數(shù)據(jù)管理水平評(píng)價(jià)集[10],通過標(biāo)準(zhǔn)化調(diào)度進(jìn)行數(shù)據(jù)的分類決策,采用零階補(bǔ)償和信息融合方法,通過互信息相關(guān)算法進(jìn)行大學(xué)生體能測(cè)試數(shù)據(jù)管理和資源優(yōu)化調(diào)度[11]。建立大學(xué)生體能測(cè)試數(shù)據(jù)的決策指標(biāo)函數(shù)為:
(5)
其中,p(xi,j)表示相似度,根據(jù)學(xué)生體能測(cè)試數(shù)據(jù)特征分析,進(jìn)行量化分解,通過標(biāo)準(zhǔn)的參考矩陣分解,得到大學(xué)生體能測(cè)試數(shù)據(jù)量化特征分解值為:
(6)
其中,大學(xué)生體能測(cè)試數(shù)據(jù)分布的嵌入維為m,時(shí)延參數(shù)為τ。通過子空間聚類和信息融合,提取大學(xué)生體能測(cè)試數(shù)據(jù)的關(guān)聯(lián)特征解,通過模糊度測(cè)試,進(jìn)行大學(xué)生體能測(cè)試數(shù)據(jù)的優(yōu)化挖掘和分類管理[12]。
3.大學(xué)生體能測(cè)試數(shù)據(jù)管理優(yōu)化
決策樹算法作為一種分類器,能夠針對(duì)無規(guī)則和無序的樣本進(jìn)行類別標(biāo)號(hào),并可以對(duì)決策樹分類規(guī)則進(jìn)行倒推。借助決策樹技術(shù)開展成績(jī)數(shù)據(jù)研究活動(dòng),能夠更加直觀化、全面化呈現(xiàn)數(shù)據(jù)研究結(jié)果。在ID3決策樹算法下,小型決策樹相對(duì)于大決策樹的分類性能更優(yōu),通過ID3決策樹算法來對(duì)大學(xué)生體能測(cè)試數(shù)據(jù)管理優(yōu)化,能夠顯著改善數(shù)據(jù)管理效率。
(1)ID3決策樹算法
在ID3決策樹中設(shè)計(jì)大學(xué)生體能測(cè)試數(shù)據(jù)的分支體系,進(jìn)行大學(xué)生體能測(cè)試數(shù)據(jù)管理水平評(píng)價(jià)的熵權(quán)指標(biāo)參數(shù)分析,決策樹模型如圖1所示。
圖1 大學(xué)生體能測(cè)試數(shù)據(jù)管理的ID3決策樹模型
在圖1所示的大學(xué)生體能測(cè)試數(shù)據(jù)管理的ID3決策樹模型中,通過綜合決策和特征判決,得到判決式為:
(7)
上述公式中,fx(xi,j),fθ(xi,j),gx(xi,j)和gθ(xi,j)分別表示大學(xué)生體能測(cè)試數(shù)據(jù)管理水平評(píng)價(jià)的相似度系數(shù),基于ID3決策樹進(jìn)行數(shù)據(jù)分類尋優(yōu),得到ID3決策樹的關(guān)聯(lián)函數(shù)C(τ)定義為:
(8)
上式表示t和t+τ時(shí)刻大學(xué)生體能測(cè)試數(shù)據(jù)量化管理的模糊度系數(shù),根據(jù)標(biāo)準(zhǔn)量化分布式融合,進(jìn)行ID3決策樹尋優(yōu)控制,得到大學(xué)生體能測(cè)試數(shù)據(jù)管理的三階量化參數(shù):
(9)
(10)
根據(jù)大學(xué)生體能測(cè)試數(shù)據(jù)的ID3決策樹融合結(jié)果,進(jìn)行主特征建模,建立底層數(shù)據(jù)庫(kù)進(jìn)行信息融合和決策判斷。構(gòu)建大學(xué)生體能測(cè)試數(shù)據(jù)管理的ID3決策樹模型,能夠更好的迎合高校管理工作需求,大大提高對(duì)大學(xué)生體測(cè)數(shù)據(jù)的管理效率。
(2)數(shù)據(jù)分類提取及優(yōu)化存儲(chǔ)
基于上述構(gòu)建的大學(xué)生體能測(cè)試數(shù)據(jù)管理的ID3決策樹模型,開展數(shù)據(jù)分類提取、數(shù)據(jù)優(yōu)化存儲(chǔ)等相關(guān)操作。依托決策樹模型進(jìn)行大學(xué)生體能測(cè)試數(shù)據(jù)管理水平評(píng)價(jià)的熵權(quán)指標(biāo)參數(shù)分析,提取學(xué)生體能測(cè)試數(shù)據(jù)管理的熵權(quán)特征量,具體表示如下:
(11)
通過對(duì)大學(xué)生體能測(cè)試數(shù)據(jù)的熵特征進(jìn)行決策樹分叉加權(quán)管理,得到大學(xué)生體能測(cè)試數(shù)據(jù)存儲(chǔ)的空間分布函數(shù),表示為:
(12)
在tn+1時(shí)刻和tn時(shí)刻分別對(duì)大學(xué)生體能測(cè)試數(shù)據(jù)進(jìn)行信息融合,能夠得到大學(xué)生體能測(cè)試數(shù)據(jù)管理系統(tǒng)存儲(chǔ)節(jié)點(diǎn)k及候選節(jié)點(diǎn)j的差異性,通過條件概率分析,可以得知學(xué)生體能測(cè)試數(shù)據(jù)的條件概率密度特征,如下述公式所示:
(13)
(14)
(15)
通過上式實(shí)現(xiàn)對(duì)大學(xué)生體能測(cè)試數(shù)據(jù)的分類管理,顯著改善了數(shù)據(jù)管理效率。
為驗(yàn)證基于ID3決策樹算法的大學(xué)生體能測(cè)試數(shù)據(jù)管理系統(tǒng)的有效性,設(shè)計(jì)仿真對(duì)比實(shí)驗(yàn)。以文獻(xiàn)[4]方法、文獻(xiàn)[5]方法作為實(shí)驗(yàn)對(duì)比方法,在Matlab Simulink 軟件下,進(jìn)行大學(xué)生體能測(cè)試數(shù)據(jù)管理系統(tǒng)的仿真實(shí)驗(yàn),驗(yàn)證本研究中ID3決策樹算法及兩個(gè)文獻(xiàn)算法的分類準(zhǔn)確性。本研究采集2000名大學(xué)生的體能測(cè)試數(shù)據(jù)作為研究對(duì)象,數(shù)據(jù)總量共為500MB,采集時(shí)間為2020年第一季度,體能項(xiàng)目主要有大學(xué)生短跑、長(zhǎng)跑、立定跳遠(yuǎn)以及球類等相關(guān)運(yùn)動(dòng)數(shù)據(jù),大學(xué)生體能測(cè)試數(shù)據(jù)詳細(xì)分布見表1。
表1 大學(xué)生體能測(cè)試數(shù)據(jù)分布
結(jié)合上述數(shù)據(jù)研究樣本,開展大學(xué)生體能測(cè)試數(shù)據(jù)管理工作,能夠得到所有數(shù)據(jù)的測(cè)試集分布,如圖2所示。
圖2 大學(xué)生體能數(shù)據(jù)測(cè)試集
對(duì)上述大學(xué)生體能測(cè)試數(shù)據(jù)進(jìn)行進(jìn)一步的優(yōu)化管理和自適應(yīng)調(diào)度,可以得到大學(xué)生體能測(cè)試數(shù)據(jù)管理優(yōu)化輸出結(jié)果,如圖3所示。
圖3 大學(xué)生體能測(cè)試數(shù)據(jù)管理優(yōu)化輸出
分析圖3得知,基于文獻(xiàn)[4]和[5]中的對(duì)比方法進(jìn)行大學(xué)生體能測(cè)試數(shù)據(jù)管理的輸出波動(dòng)較大,而本研究所提出的ID3決策樹算法,在進(jìn)行大學(xué)生體能測(cè)試數(shù)據(jù)管理的輸出穩(wěn)定性較好,且尋優(yōu)能力也較強(qiáng),顯著提高了大學(xué)生體能測(cè)試數(shù)據(jù)的分類管理和信息融合水平。上述實(shí)驗(yàn)結(jié)果表明ID3決策樹算法對(duì)的大學(xué)生體能測(cè)試數(shù)據(jù)的管理能力優(yōu)于文獻(xiàn)[4]和[5]的算法,具有較高的實(shí)用價(jià)值。
在此基礎(chǔ)上,可以借助ID3決策樹算法的大學(xué)生體能測(cè)試數(shù)據(jù)管理系統(tǒng),測(cè)試不同方法對(duì)大學(xué)生體能測(cè)試數(shù)據(jù)分類管理的準(zhǔn)確性,得到實(shí)驗(yàn)對(duì)比結(jié)果如圖4所示。
分析圖4可知,采用文獻(xiàn)[4]方法得到的大學(xué)生體能測(cè)試數(shù)據(jù)分類準(zhǔn)確性為74.5%,采用文獻(xiàn)[5]方法得到的大學(xué)生體能測(cè)試數(shù)據(jù)分類準(zhǔn)確性為70.5%,而采用本文ID3決策樹算法得到的大學(xué)生體能測(cè)試數(shù)據(jù)分類準(zhǔn)確性為95.5%。由此可見,本文所設(shè)計(jì)系統(tǒng)能夠?qū)崿F(xiàn)對(duì)大學(xué)生體能測(cè)試數(shù)據(jù)的準(zhǔn)確分類。
圖4 大學(xué)生體能測(cè)試數(shù)據(jù)管理優(yōu)化輸出
分別設(shè)置系統(tǒng)迭代次數(shù)為100、200、300、400,測(cè)試不同迭代次數(shù)下,測(cè)試ID3決策樹算法下大學(xué)生體能測(cè)試數(shù)據(jù)管理系統(tǒng)在管理500MB大學(xué)生體能測(cè)試數(shù)據(jù)過程中的時(shí)間開銷,得到對(duì)比結(jié)果見表2。
表2 時(shí)間開銷測(cè)試(單位:ms)
分析表2得知,采用文獻(xiàn)[4]方法得到的時(shí)間開銷平均值為84ms,采用[5]方法得到的時(shí)間開銷平均值為69.75ms,采用本文方法得到的時(shí)間開銷平均值為3.25ms,由此可見,本文方法進(jìn)行大學(xué)生體能測(cè)試數(shù)據(jù)管理的時(shí)間開銷較短。本文系統(tǒng)對(duì)大學(xué)生體能測(cè)試數(shù)據(jù)管理的輸出穩(wěn)定性較好,數(shù)據(jù)分類準(zhǔn)確性較好,且管理耗時(shí)較短,證明了所設(shè)計(jì)系統(tǒng)的可靠性。
本文提出基于ID3決策樹算法的大學(xué)生體能測(cè)試數(shù)據(jù)管理系統(tǒng),采用決策樹尋優(yōu)方法進(jìn)行大學(xué)生體能測(cè)試數(shù)據(jù)的特征分類檢測(cè),提取大學(xué)生體能測(cè)試數(shù)據(jù)的粗糙集和相似度特征量,通過標(biāo)準(zhǔn)的參考矩陣分解進(jìn)行數(shù)據(jù)特征分解。根據(jù)大學(xué)生體能測(cè)試數(shù)據(jù)的ID3決策樹融合結(jié)果,進(jìn)行主特征建模,建立底層數(shù)據(jù)庫(kù)進(jìn)行信息融合和數(shù)據(jù)優(yōu)化管理。通過實(shí)驗(yàn)分析能夠得出結(jié)論如下:
(1)本文所設(shè)計(jì)的基于ID3決策樹算法的大學(xué)生體能測(cè)試數(shù)據(jù)管理系統(tǒng)對(duì)大學(xué)生體能測(cè)試數(shù)據(jù)管理的輸出穩(wěn)定性較好,尋優(yōu)能力較強(qiáng),能夠有效提升體測(cè)數(shù)據(jù)的分類管理及信息融合水平。
(2)所設(shè)計(jì)系統(tǒng)能夠?qū)崿F(xiàn)對(duì)大學(xué)生體能測(cè)試數(shù)據(jù)的準(zhǔn)確分類,提升了系統(tǒng)管理性能。
(3)所設(shè)計(jì)系統(tǒng)在進(jìn)行大學(xué)生體能測(cè)試數(shù)據(jù)管理時(shí)的耗時(shí)較短,管理效率也較好。