劉紀(jì)敏,謝創(chuàng)森,文龍日,趙慧奇,王心剛,賈全秋,宋明浩
(1.山東科技大學(xué)智能裝備學(xué)院;2.泰山科技學(xué)院 大數(shù)據(jù)學(xué)院,山東泰安 271000;3.吉林省延邊第一中學(xué),吉林 延吉 133000)
根據(jù)教育部發(fā)布的2019 年全國(guó)教育事業(yè)發(fā)展統(tǒng)計(jì)公報(bào),2019 年全國(guó)共有各級(jí)各類學(xué)校53.01 萬(wàn)所,比上年增加1.13 萬(wàn)所,增長(zhǎng)2.17%;各級(jí)各類學(xué)歷教育在校生2.82 億人,比上年增加660.62 萬(wàn)人,增長(zhǎng)2.40%[1]。中國(guó)高校畢業(yè)生數(shù)量快速增長(zhǎng),不僅將影響人力資源供需結(jié)構(gòu),而且因其對(duì)高校教學(xué)輔助資源的需求迅速增加,為高校帶來(lái)了沉重壓力。近年來(lái),大部分高校畢業(yè)生選擇通過(guò)研究生考試獲得更多深造機(jī)會(huì),而選擇深造和選擇就業(yè)的畢業(yè)生對(duì)教學(xué)輔助資源的需求是截然不同的。從高校的角度來(lái)看,有必要正確理解在校生需求,并有效應(yīng)對(duì)畢業(yè)生就業(yè)趨向的變化。根據(jù)畢業(yè)生就業(yè)趨向分析結(jié)果,合理分配現(xiàn)有教學(xué)輔助資源以滿足在校生需求對(duì)高校的長(zhǎng)遠(yuǎn)發(fā)展具有重要意義[2]。
在教學(xué)輔助資源分配相關(guān)研究中,Ho 等[3]提出利用綜合多準(zhǔn)則決策分配資源以提高高???jī)效的方案,馬瑞華[4]提出地方綜合性大學(xué)分配學(xué)術(shù)資源的最佳策略,Zhang[5]提出利用誤差反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)(Arti?ficial Neural Networks,ANN)模型解決高校思想政治教育資源的配置問(wèn)題,還有一些專家利用數(shù)理統(tǒng)計(jì)和問(wèn)卷調(diào)查方法分析畢業(yè)生就業(yè)趨勢(shì)和高校教學(xué)輔助資源的合理分配問(wèn)題[6-7]。雖然很多專家一直利用不同分析方法研究有效的教學(xué)輔助資源分配方案,但其所利用的分析方法工作量大,且敏感性與準(zhǔn)確性不佳。
自1939 年Forst[8]提出從年齡、時(shí)期和隊(duì)列3 個(gè)維度研究結(jié)核病數(shù)據(jù)分析方法后,人群隊(duì)列(Age Period Cohort,APC)分析模型已廣泛應(yīng)用于各領(lǐng)域的數(shù)據(jù)分析。如Pes等[9]利用人群隊(duì)列模型分析社會(huì)經(jīng)濟(jì)轉(zhuǎn)型后人群患癌癥年齡段的變化趨勢(shì);Stanesby 等[10]利用人群隊(duì)列模型調(diào)查分析1950-1980 年澳大利亞婦女的飲酒趨勢(shì);石超等[11]利用分層人群隊(duì)列隨機(jī)效應(yīng)模型(Hierarchical APC-Cross Clas?sified Random Effects Model,HAPC-CCREM)分析中國(guó)人對(duì)生活的滿意度;Wong 等[12]利用人群隊(duì)列模型分析香港年青一代對(duì)政府政策的滿意度。研究結(jié)果表明,人群隊(duì)列模型非常適合基于大數(shù)據(jù)的預(yù)測(cè)分析。將人群隊(duì)列模型應(yīng)用于人群大數(shù)據(jù)分析有很多優(yōu)點(diǎn),但是年齡、時(shí)期和隊(duì)列三要素存在完全線性關(guān)系,即時(shí)期等于年齡與隊(duì)列的和,因此模型矩陣是非滿秩奇異矩陣,而且是不可逆矩陣,所以存在不可識(shí)別的問(wèn)題。針對(duì)該問(wèn)題,不少專家提出改進(jìn)的人群隊(duì)列模型[13-14]。
本文收集了山東科技大學(xué)近10 年的畢業(yè)生信息,并利用人群隊(duì)列模型進(jìn)行畢業(yè)趨向大數(shù)據(jù)分析。在研究初期,通過(guò)數(shù)據(jù)分析人群隊(duì)列模型中的三大要素,即年齡、時(shí)期和隊(duì)列,在時(shí)間跨度不大的前提下,實(shí)驗(yàn)結(jié)果并不理想。為提高實(shí)驗(yàn)結(jié)果的準(zhǔn)確性,本文不僅對(duì)收集到的畢業(yè)生數(shù)據(jù)進(jìn)行特征分析,而且同時(shí)進(jìn)行了畢業(yè)去向相關(guān)問(wèn)題的線上問(wèn)卷調(diào)查。通過(guò)調(diào)研與分析發(fā)現(xiàn),即使時(shí)間跨度不大的因子也會(huì)對(duì)結(jié)果造成較大影響。例如,年齡比畢業(yè)生平均年齡大的學(xué)生更傾向于選擇就業(yè),還有國(guó)家政策的改變與性別對(duì)實(shí)驗(yàn)結(jié)果也有一定影響。綜合這些影響因素和研究目的,最后提出改進(jìn)的人群隊(duì)列模型和人群隊(duì)列大數(shù)據(jù)分析模型。最終實(shí)驗(yàn)結(jié)果表明,本文提出的模型適用于高校畢業(yè)生畢業(yè)趨向分析,可為合理分配教學(xué)輔助資源提供參考依據(jù)。
人群隊(duì)列模型是人群隊(duì)列調(diào)查的基本模型,包括年齡、時(shí)期和隊(duì)列3 個(gè)因素。由于這3 個(gè)因素之間存在完全線性關(guān)系,所以利用傳統(tǒng)回歸方法無(wú)法獲得唯一的估計(jì)值。為解決該問(wèn)題,需要改進(jìn)人群隊(duì)列模型特征參數(shù)選取方法以及使用內(nèi)在估計(jì)方法計(jì)算參數(shù),并使用元數(shù)據(jù)映射方法導(dǎo)入變換的數(shù)據(jù)。以下首先提出傳統(tǒng)人群隊(duì)列模型存在的問(wèn)題,然后定義畢業(yè)趨向影響因素,最后定義分析模型影響因素。
在泊松回歸(Poisson Regression,PR)模型基礎(chǔ)上,人群隊(duì)列模型如今已廣泛應(yīng)用于數(shù)據(jù)調(diào)查領(lǐng)域[15-16]。通過(guò)前期研究發(fā)現(xiàn),傳統(tǒng)人群隊(duì)列模型非常適用于高校畢業(yè)生就業(yè)趨向大數(shù)據(jù)分析。
傳統(tǒng)人群隊(duì)列模型基本公式如下:
式中,E(rijk)是基于年齡(i)、時(shí)期(j)和隊(duì)列(k)的疾病發(fā)病可能性期望值,θijk是第j個(gè)時(shí)期觀察到的第i個(gè)年齡組疾病發(fā)病可能性期望值,Nijk是對(duì)應(yīng)年齡、時(shí)期和隊(duì)列的人數(shù),μ是年齡、時(shí)期、隊(duì)列作用的趨勢(shì)參照值,αi是第i個(gè)年齡組群的影響(i=1,2,3,…,i),βj是第j個(gè)時(shí)期組群的影響(j=1,2,3,…,j),γk是與第i個(gè)年齡組和第j個(gè)時(shí)期組參數(shù)相關(guān)第k個(gè)隊(duì)列組的影響,εijk是隨機(jī)誤差。
在人群隊(duì)列模型中,傳統(tǒng)最小二乘估計(jì)方法b=(XT X)-1XTY存在一個(gè)“無(wú)法估計(jì)”的問(wèn)題。由于年齡、時(shí)間和隊(duì)列之間存在完全線性關(guān)系,即時(shí)間值等于年齡加上隊(duì)列,該矩陣是一個(gè)非滿秩奇異矩陣且是不可逆的,因此b沒(méi)有唯一的結(jié)果。此外,傳統(tǒng)人群隊(duì)列模型以5 年為間隔對(duì)樣本數(shù)據(jù)進(jìn)行測(cè)試,雖然實(shí)驗(yàn)結(jié)果可反映大概的畢業(yè)趨勢(shì),但不能代表5 年時(shí)間間隔之間的變化,因而缺乏對(duì)測(cè)試的敏感性。在傳統(tǒng)的人群隊(duì)列模型中,只分析年齡、時(shí)期和隊(duì)列因素的影響,如果影響因素更多,將降低實(shí)驗(yàn)結(jié)果的準(zhǔn)確性。因此,本文提出改進(jìn)的人群隊(duì)列模型以解決這些問(wèn)題。
本文利用從山東科技大學(xué)就業(yè)指導(dǎo)中心收集到的2011-2018 年畢業(yè)生畢業(yè)趨向信息建立樣本數(shù)據(jù)模型,并定義了高校畢業(yè)生畢業(yè)趨向影響因素,如表1 所示。
Table 1 Definition of influencing factors of graduation trend表1 畢業(yè)趨向影響因素定義
在影響因素中,“深造”表示申報(bào)研究生考試或留學(xué)讀研的畢業(yè)生,“就業(yè)”表示參加工作或參加公務(wù)員考試的畢業(yè)生,“其它”表示參軍或待業(yè)的畢業(yè)生。另外也考慮了可能影響實(shí)驗(yàn)結(jié)果的因素,如性別、國(guó)家政策等。
雖然研究中采用的樣本數(shù)據(jù)可滿足Li 等[17]提出的人群隊(duì)列模型對(duì)樣本數(shù)據(jù)的要求,但是年齡較大的高校畢業(yè)生更傾向于選擇就業(yè)的趨勢(shì)等影響實(shí)驗(yàn)結(jié)果的情況也不能忽略。為更明確地對(duì)畢業(yè)趨向進(jìn)行可視化展示,將樣本數(shù)據(jù)中的年齡替換成以5 年為間隔的年齡段,通過(guò)對(duì)年齡的擴(kuò)展以便于開展畢業(yè)趨向分析實(shí)驗(yàn),同時(shí)可避免出現(xiàn)實(shí)驗(yàn)結(jié)果不明確的情況。
畢業(yè)生畢業(yè)趨向分析結(jié)果表明,年齡對(duì)畢業(yè)趨向的變化影響最大,其原因可能是不同年齡在生理上的需求以及對(duì)社會(huì)地位的重視程度不同;時(shí)期通常反映在縱向分析中,并且影響所有年齡段;隊(duì)列表示相同事件。
(1)年齡因素。從樣本原始數(shù)據(jù)分析中發(fā)現(xiàn),畢業(yè)生選擇工作而不是接受進(jìn)一步的教育(p<0.01),并且這種狀況影響了畢業(yè)生深造趨勢(shì)。
在過(guò)去的調(diào)查中,通常將年齡以5 年為間隔劃分成一個(gè)隊(duì)列組,用來(lái)分析年齡對(duì)畢業(yè)趨向的影響[18]。通過(guò)實(shí)驗(yàn),以5 年為基礎(chǔ)的年齡劃分弱化了年齡差距對(duì)結(jié)果的影響,例如同一年畢業(yè)生在年齡相差為兩歲的情況下往往有著截然不同的選擇,如某年實(shí)施的某種政策極大地增加了研究生數(shù)量等,從而大大降低了結(jié)果的準(zhǔn)確性。為了合理使用樣本數(shù)據(jù),將年齡映射到5 年的范圍空間中,并將屬性劃分為以下人群隊(duì)列,如表2 所示。
Table 2 The range of actual age in the experiment表2 實(shí)際年齡在實(shí)驗(yàn)中的對(duì)應(yīng)年齡段
同時(shí),還需要更改相應(yīng)出生隊(duì)列,以保持年齡、時(shí)期和出生隊(duì)列3 個(gè)因素之間原本的線性關(guān)系。確定年齡因子的值,并與表達(dá)式中的原始數(shù)據(jù)加以區(qū)別。
(2)時(shí)期因素。在提出的人群隊(duì)列模型中,周期因子的效果尤為明顯。每一年政策和改革等不穩(wěn)定因素都會(huì)對(duì)結(jié)果產(chǎn)生較大影響。例如,某政策在某年的實(shí)施極大地增加了研究生數(shù)量,因此以5 年為基礎(chǔ)的時(shí)期隊(duì)列劃分方式會(huì)嚴(yán)重影響結(jié)果的準(zhǔn)確度和靈敏度。以5 年為間隔進(jìn)行時(shí)期劃分,如表3 所示,但這5 年間隔僅用于實(shí)驗(yàn)與結(jié)果分析,對(duì)結(jié)果沒(méi)有影響。
Table 3 The corresponding period of actual period in the experiment表3 實(shí)際時(shí)期在實(shí)驗(yàn)中的對(duì)應(yīng)時(shí)期
(3)隊(duì)列因素。為了提高結(jié)果的準(zhǔn)確度,將年齡和時(shí)期因素分別映射到5 年間隔中。由于同類群組值的線性關(guān)系等于周期減去年齡,因此同類群組值已更改。在先前的數(shù)據(jù)映射之后,每個(gè)更改的隊(duì)列對(duì)應(yīng)于表4 中給出的一年的原始數(shù)據(jù)。
Table 4 The corresponding cohort of actual cohort in the experiment表4 實(shí)際隊(duì)列在實(shí)驗(yàn)中的對(duì)應(yīng)隊(duì)列
在前瞻性隊(duì)列分析中,將映射到5 年區(qū)間內(nèi)的對(duì)應(yīng)關(guān)系繼續(xù)應(yīng)用于新模型中,以避免因數(shù)據(jù)不統(tǒng)一導(dǎo)致的意外錯(cuò)誤。
為解決傳統(tǒng)人群隊(duì)列模型“無(wú)法識(shí)別”的問(wèn)題,采用內(nèi)源估計(jì)法(Intrinsic Estimator,IE)對(duì)參數(shù)進(jìn)行估計(jì)。IE 方法是基于Fu[19]的估計(jì)函數(shù)方法提出的,Yang 等[20]將IE 方法與傳統(tǒng)的廣義線性方法進(jìn)行比較,發(fā)現(xiàn)其輸出結(jié)果相似。IE 方法具有無(wú)需假定先驗(yàn)信息的優(yōu)點(diǎn),但由于其參數(shù)存在難以解釋的問(wèn)題,因此尚未得到廣泛應(yīng)用。
為解決傳統(tǒng)人群隊(duì)列模型“低靈敏度”的問(wèn)題,研究者們又提出一種數(shù)據(jù)映射方法,將原來(lái)的1 年數(shù)據(jù)擴(kuò)展為5年數(shù)據(jù),從而確保輸入數(shù)據(jù)的正確性,并分析隨機(jī)年份中可能發(fā)生的情況(可保證數(shù)據(jù)符合模型標(biāo)準(zhǔn),并分析任意一年可能發(fā)生的變化)。人群隊(duì)列大數(shù)據(jù)分析模型利用Stata15 和Python 進(jìn)行實(shí)驗(yàn),并根據(jù)實(shí)驗(yàn)結(jié)果提出畢業(yè)趨向分析方法和教學(xué)輔助資源分配方案。
基于人群隊(duì)列大數(shù)據(jù)分析模型的不同年齡畢業(yè)生畢業(yè)趨向分析結(jié)果如圖1 所示。
Fig.1 Analysis results of graduation trend of graduates of different ages圖1 不同年齡畢業(yè)生畢業(yè)趨向分析結(jié)果
在分析結(jié)果中,各年齡階段畢業(yè)生選擇“其它”(在表1中變量值定義為0)選項(xiàng)的變化不大且占比較低,選擇“深造”(在表1 中變量值定義為1)選項(xiàng)的大多是年齡較小的畢業(yè)生,且畢業(yè)生樣本數(shù)量不同會(huì)影響畢業(yè)趨向分析結(jié)果,選擇“就業(yè)”(在表1 中變量值定義為2)選項(xiàng)的大多是年齡較大的畢業(yè)生。
基于人群隊(duì)列大數(shù)據(jù)分析模型的畢業(yè)生深造趨勢(shì)分析結(jié)果如圖2 所示。
Fig.2 Analysis results of graduates'further study trend圖2 畢業(yè)生深造趨勢(shì)分析結(jié)果
在就業(yè)藍(lán)皮書中提到,深造已成為本科畢業(yè)生的熱門選擇之一。深造分為全日制和非全日制,自2017 年起,政府部門表示兩種學(xué)歷在中國(guó)具有相同的法律地位。因此,從2017 年開始,越來(lái)越多高校畢業(yè)生選擇深造。但由于競(jìng)爭(zhēng)比以前更激烈,2018 年選擇深造的人數(shù)又呈下降趨勢(shì)。
基于人群隊(duì)列大數(shù)據(jù)分析模型的畢業(yè)生就業(yè)趨勢(shì)分析結(jié)果如圖3 所示。
Fig.3 Analysis results of graduates'employment trend圖3 畢業(yè)生就業(yè)趨勢(shì)分析結(jié)果
2017 年考研政策的修改導(dǎo)致一部分畢業(yè)生改變了原有想法而選擇繼續(xù)深造,因此2017 年選擇就業(yè)的畢業(yè)生數(shù)量呈明顯下降趨勢(shì),但隨著競(jìng)爭(zhēng)的加劇,2018 年就業(yè)人數(shù)有所回升,但占比仍低于往年。
基于人群隊(duì)列大數(shù)據(jù)分析模型的不同性別畢業(yè)生畢業(yè)趨向分析結(jié)果如圖4 所示。
Fig.4 Analysis results of graduation trend of graduates of different genders圖4 不同性別畢業(yè)生畢業(yè)趨向分析結(jié)果
分析結(jié)果顯示,女生相比男生更趨向于深造,但大多數(shù)畢業(yè)生仍然選擇了就業(yè)。
使用IE 參數(shù)估計(jì)方法可得到影響因子隊(duì)列,但不能將政策的影響與具體時(shí)期分離開。為定義政策因素對(duì)結(jié)果的獨(dú)立影響,基于式(1)提出政策因素計(jì)算方法,如式(2)所示。
首先輸入不同時(shí)期的樣本數(shù)據(jù),然后根據(jù)人群隊(duì)列模型計(jì)算3 年的平均值,最后從偏差結(jié)果中得出政策因素的值。為了表示數(shù)據(jù)映射,將式(1)修改為式(3)。使用變量A、B、C 分別代表年齡、時(shí)期、隊(duì)列實(shí)際值與映射值之間的對(duì)應(yīng)關(guān)系。
為進(jìn)行前瞻性的隊(duì)列分析,將每一年的政策因素和性別因素加入式(3)中,提出最終模型,如式(4)所示。
基于改進(jìn)人群隊(duì)列模型的畢業(yè)趨向分析實(shí)驗(yàn)結(jié)果如表5 所示。
Table 5 Results of graduation trend analysis based on improved cohort model表5 基于改進(jìn)人群隊(duì)列模型的畢業(yè)趨向分析結(jié)果
注:*** p <0.000 1,** p <0.001,* p <0.05;(OIM)Std.Err:Coef 系數(shù)方差平方根,Coef 的計(jì)算基于最大似然估計(jì)中的觀測(cè)信息矩陣
從分析結(jié)果可以看出,年齡因素對(duì)結(jié)果會(huì)產(chǎn)生不同影響。同時(shí),即使是較小的年齡差也會(huì)對(duì)結(jié)果產(chǎn)生較大影響。正向的Coef 表示畢業(yè)生們更傾向于選擇“就業(yè)”和“其它”,負(fù)向的Coef 表示畢業(yè)生們更傾向于選擇“深造”。
從整體上看,隨著年齡的增加,Coef 值呈上升趨勢(shì),意味著年齡大的畢業(yè)生更傾向于選擇“就業(yè)”或“其它”而不是繼續(xù)深造,但在Age_30 中發(fā)生了較大變化,主要因?yàn)樵谥袊?guó)極少有年齡為25 歲及以上的畢業(yè)生,樣本數(shù)量的缺少導(dǎo)致了結(jié)果的偏差。
從Period_2050 所對(duì)應(yīng)的Coef 中可以發(fā)現(xiàn),Coef 的變化相對(duì)較為隨機(jī)且難以預(yù)測(cè),表明包括政策因素在內(nèi)的眾多因素都會(huì)對(duì)Coef 系數(shù)產(chǎn)生影響。因此,在前瞻性隊(duì)列分析中,將政策因素從時(shí)期隊(duì)列因素中分離出來(lái)會(huì)極大地提高預(yù)測(cè)的準(zhǔn)確性,但其它影響因素還需要繼續(xù)調(diào)查。
從出生隊(duì)列的Coef 變化來(lái)看,數(shù)據(jù)結(jié)果呈現(xiàn)先增加、后減少的趨勢(shì),其清晰反映了近幾年中國(guó)畢業(yè)生選擇趨勢(shì)的變化,而Birth_1990 出現(xiàn)了與規(guī)律相悖的變化,也是由于樣本數(shù)量不足,導(dǎo)致結(jié)果出現(xiàn)了偏差。
但本文提出的模型中將結(jié)局變量定義如下:“深造”為0,“就業(yè)”為1,“其它”為2。所以在相同情況下,結(jié)果可能會(huì)產(chǎn)生較大偏差。
在改進(jìn)的人群隊(duì)列模型實(shí)驗(yàn)中,年齡對(duì)實(shí)驗(yàn)結(jié)果的影響如圖5 所示。由圖可見,隨著年齡的增長(zhǎng),Coe(f系數(shù))整體呈上升趨勢(shì),但在25 歲后逐步降低,表示畢業(yè)生隨著年齡的增長(zhǎng)更傾向于就業(yè)而不是深造,而25 歲所呈現(xiàn)的下降趨勢(shì)是受到樣本數(shù)量限制而導(dǎo)致的結(jié)果偏差。
Fig.5 Effect of age on the experimental results圖5 年齡對(duì)實(shí)驗(yàn)結(jié)果的影響
在改進(jìn)的人群隊(duì)列模型實(shí)驗(yàn)中,時(shí)期對(duì)實(shí)驗(yàn)結(jié)果的影響如圖6 所示。時(shí)期隊(duì)列因素主要受重大事件或政策的影響,此外也與該年的教學(xué)氛圍及學(xué)生質(zhì)量有關(guān)。2017 年,由于國(guó)家有關(guān)研究生入學(xué)考試政策的出臺(tái),大量畢業(yè)生選擇繼續(xù)深造。但隨著競(jìng)爭(zhēng)的愈加激烈,導(dǎo)致學(xué)生對(duì)深造的熱情下降,因此2018 年選擇深造的人數(shù)又呈下降趨勢(shì)。
Fig.6 Effect of the period on experimental results圖6 時(shí)期對(duì)實(shí)驗(yàn)結(jié)果的影響
在改進(jìn)的人群隊(duì)列模型實(shí)驗(yàn)中,出生隊(duì)列對(duì)實(shí)驗(yàn)結(jié)果的影響如圖7 所示。出生隊(duì)列代表一個(gè)經(jīng)歷了相同社會(huì)變化的群體,可反映出年齡與時(shí)間對(duì)結(jié)果造成的綜合影響。由于樣本數(shù)據(jù)中的雙極數(shù)據(jù)(例如1986 和1997 出生隊(duì)列)較少,因此結(jié)果可能存在偏差,但整體呈下降趨勢(shì),表示越來(lái)越多畢業(yè)生選擇繼續(xù)深造,中國(guó)的教育水平正在發(fā)生變化。
Fig.7 Effect of birth cohort on experimental results圖7 出生隊(duì)列對(duì)實(shí)驗(yàn)結(jié)果的影響
畢業(yè)趨向可利用年齡、時(shí)期、隊(duì)列進(jìn)行分析。根據(jù)基于人群隊(duì)列模型的前瞻性畢業(yè)趨向大數(shù)據(jù)分析實(shí)驗(yàn)結(jié)果,不僅可更加合理地制定教學(xué)輔助資源分配方案,而且可根據(jù)畢業(yè)趨向提前為在校生分配不同的教學(xué)輔助資源。例如,當(dāng)“深造”呈上升趨勢(shì)時(shí),可合理分配考研科目相關(guān)的教學(xué)輔助資源;當(dāng)“就業(yè)”呈上升趨勢(shì)時(shí),應(yīng)增設(shè)相關(guān)培訓(xùn)機(jī)構(gòu)或開設(shè)更多實(shí)踐類課程;對(duì)于選擇“其它”的畢業(yè)生,可聯(lián)系相關(guān)部門進(jìn)行針對(duì)性的教育培訓(xùn)。人群隊(duì)列模型可幫助高校更加精準(zhǔn)地預(yù)測(cè)在校生畢業(yè)趨向,從而提前合理調(diào)配教學(xué)輔助資源。
Ho 等[3]使用層次分析法(Analytic Hierarchy Process,AHP)確定擬議項(xiàng)目相對(duì)于大學(xué)目標(biāo)的優(yōu)先級(jí)或相對(duì)重要性,并使用目標(biāo)計(jì)劃(Goal Programming,GP)模型選擇最佳項(xiàng)目集。馬瑞華等[4]采用文獻(xiàn)法、調(diào)查法和案例分析法相結(jié)合的理論與研究方法,提出一種用于教學(xué)輔助資源分配的新方法。在提出的人群隊(duì)列模型中,通過(guò)將數(shù)據(jù)映射到人群隊(duì)列模型的5 年區(qū)間中,以提高影響因子對(duì)結(jié)果的敏感性。因?yàn)槟P歪槍?duì)的是學(xué)生群體,所以通過(guò)畢業(yè)趨向大數(shù)據(jù)分析可對(duì)教學(xué)輔助資源進(jìn)行合理分配,以避免資源浪費(fèi)。
本文提出的人群隊(duì)列模型與GP 模型以及MA(馬瑞華)模型的性能比較結(jié)果如表6 所示。
Table 6 Performance comparison of graduation trend analysis models表6 畢業(yè)趨勢(shì)分析模型性能比較
分析結(jié)果顯示,本文提出的人群隊(duì)列模型相比其它模型,在預(yù)測(cè)難度、測(cè)試時(shí)間及系統(tǒng)可移植性等方面具有明顯改進(jìn)。
隨著高校畢業(yè)生數(shù)量的迅速增加,傳統(tǒng)教學(xué)輔助資源已無(wú)法滿足在校生需求。為解決該問(wèn)題,本文對(duì)教學(xué)輔助資源分配相關(guān)方法和模型進(jìn)行了調(diào)查,并提出畢業(yè)生畢業(yè)趨勢(shì)分析方法及改進(jìn)的人群隊(duì)列模型。為提高實(shí)驗(yàn)結(jié)果的準(zhǔn)確性和預(yù)測(cè)結(jié)果的適應(yīng)性,將更多影響因素加入到改進(jìn)的人群隊(duì)列模型中。結(jié)果顯示,本文提出的改進(jìn)的人群隊(duì)列模型不僅可清晰地顯示畢業(yè)趨向,而且可幫助高校更合理地制訂教學(xué)輔助資源分配策略。隨著研究的進(jìn)一步深入,未來(lái)將定義更多影響因素,以期獲得更好的預(yù)測(cè)結(jié)果。