趙 楠,聶子一,焦夢青,賈子純
(1.河北地質(zhì)大學(xué)研究生學(xué)院,河北石家莊 050031;2.河北地質(zhì)大學(xué)信息工程學(xué)院,河北石家莊 050031;3.河北地質(zhì)大學(xué)水資源與環(huán)境學(xué)院,河北石家莊 050031)
促進(jìn)高校畢業(yè)生就業(yè),特別是按照高層次人才培養(yǎng)的研究生就業(yè),是實(shí)施“科技興國、人才強(qiáng)國”戰(zhàn)略的重要舉措,也是全面建成小康社會的重要推力[1],當(dāng)前促進(jìn)高校畢業(yè)生的政策導(dǎo)向也十分鮮明[2].近年來,我國研究生招生人數(shù)在陸續(xù)增加,研究生及其家長對就業(yè)的關(guān)注點(diǎn)逐漸從“能否就業(yè)”轉(zhuǎn)向“就業(yè)質(zhì)量”,就業(yè)質(zhì)量評價受到國家體制、經(jīng)濟(jì)發(fā)展水平、高校層次差異及個體能力等因素的影響,不同高校因其辦學(xué)特色、學(xué)科布局及人才培養(yǎng)方案不同,就業(yè)質(zhì)量評價體系也有所差異[3].一些高水平的綜合類大學(xué)如中國人民大學(xué)、南開大學(xué)、西南大學(xué)等已逐步探索建立了本校的就業(yè)質(zhì)量評價指標(biāo)體系[4].一些具有一流學(xué)科的財經(jīng)類、醫(yī)藥類、農(nóng)林類高校也針對本校的就業(yè)質(zhì)量評價制定了特色化的指標(biāo)體系.
在就業(yè)質(zhì)量評價體系指標(biāo)研究方面,使用頻度較高的指標(biāo)為就業(yè)率、畢業(yè)生就業(yè)滿意度、用人單位滿意度、工作穩(wěn)定性和社會認(rèn)可度五項(xiàng)[5].張文锍[6]分別從大學(xué)生個體、學(xué)校、用人單位、家庭和社會五個維度構(gòu)建指標(biāo)體系,采取主客觀相結(jié)合、定性定量相互補(bǔ)充、以及宏觀微觀相互交叉的方法評價就業(yè)質(zhì)量.呂欽[7]在對國內(nèi)外就業(yè)質(zhì)量評價指標(biāo)充分調(diào)研的基礎(chǔ)上,將評價指標(biāo)概括為五大類:薪酬?duì)顩r、客觀工作條件、工作與生活的平衡、工作滿意度和發(fā)展情況.
在就業(yè)質(zhì)量評價模型研究方面,張淼[8]以陜西省高校畢業(yè)生作為研究樣本,制定了穩(wěn)定與公平、安全與健康、報酬與提升3個一級指標(biāo),9個二級指標(biāo)以及13個三級指標(biāo),通過結(jié)合層次分析法、實(shí)證調(diào)研法、專家打分法3種基本方法,確定了三級指標(biāo)的不同權(quán)重,以及加權(quán)求和的計(jì)算公式.劉永平[9]、齊鵬等[10]、尹曉菲等[11]、劉敏等[12]在充分進(jìn)行文獻(xiàn)調(diào)研的基礎(chǔ)上,基于滿意度的視角下,構(gòu)建涵蓋工作單位滿意度、就業(yè)指導(dǎo)滿意度、個人滿意度的就業(yè)評價指標(biāo)體系,并采用模糊數(shù)學(xué)理論方法確定每個指標(biāo)的模糊綜合評價值.童娟[13]把畢業(yè)生就業(yè)質(zhì)量劃分為優(yōu)、良、一般、差4個等級,建立神經(jīng)網(wǎng)絡(luò)模型,通過對就業(yè)數(shù)據(jù)的訓(xùn)練學(xué)習(xí)獲得指標(biāo)權(quán)重,避免人為規(guī)定權(quán)重的主觀性.
智能預(yù)測就業(yè)質(zhì)量模型屬于非線性的評價技術(shù),其預(yù)測結(jié)果明顯優(yōu)于層次分析法、模糊數(shù)學(xué)理論等傳統(tǒng)方法.但是單一的智能算法在迭代尋求最優(yōu)解時會有一個明顯的問題,即傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)算法應(yīng)用于就業(yè)質(zhì)量評價易陷入局部最優(yōu)、泛化能力不足.為解決這一問題,本文提出基于粒子群改進(jìn)神經(jīng)網(wǎng)絡(luò)的混合算法評價研究生就業(yè)質(zhì)量,以期改善當(dāng)前模型不足,提高評價精度,獲得更可靠的評價效果.
對于研究生就業(yè)質(zhì)量評價,存在大量不同指標(biāo)的評價模型,也不可能將全部指標(biāo)均納入研究生就業(yè)質(zhì)量評價體系.本文建立的研究生就業(yè)質(zhì)量評價體系考慮以下特點(diǎn):(1)針對性更強(qiáng),研究生具有高層次人才的特性,篩選的評價指標(biāo)更能突出研究生的特性,減少對于本科生、研究生均適用的普適標(biāo)準(zhǔn);(2)主客觀相結(jié)合,既反映就業(yè)者的主觀感受,同時兼顧工作單位的客觀滿意度;(3)可操作性強(qiáng),評價指標(biāo)體系具有實(shí)用和可推廣的特點(diǎn).構(gòu)建的研究生就業(yè)質(zhì)量評價體系如表1所示.
表1 研究生就業(yè)質(zhì)量評價指標(biāo)體系
BP神經(jīng)網(wǎng)絡(luò)是一種前饋神經(jīng)網(wǎng)絡(luò),即它的傳播方向是從后向前反向傳播,它通常具有三層拓?fù)浣Y(jié)構(gòu),即輸入層、隱含層和輸出層,如圖1所示.BP神經(jīng)網(wǎng)絡(luò)通過不斷更新傳播過程中的權(quán)值和閾值來逐步完善網(wǎng)絡(luò),最終達(dá)到實(shí)際輸出值和期望輸出值誤差均方差最小的目的.
圖1 BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
設(shè)第m個研究生就業(yè)質(zhì)量評價樣本的期望輸出結(jié)果為Em,BP神經(jīng)網(wǎng)絡(luò)的實(shí)際輸出結(jié)果記為Om,那么訓(xùn)練樣本的結(jié)果應(yīng)輸出誤差計(jì)算公式為:
式中n為訓(xùn)練樣本數(shù).
隱含層與輸出層間的權(quán)重為Wxy、輸入層與隱含層間的權(quán)重為Wyz,其中,y代表隱含層節(jié)點(diǎn)、x為輸出層節(jié)點(diǎn)、z為輸入層節(jié)點(diǎn),權(quán)值的更新方式如下:
式中η為學(xué)習(xí)速度,E為真實(shí)值與預(yù)測值的誤差.
BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程實(shí)際就是權(quán)值和閾值更新的過程,傳統(tǒng)更新規(guī)則為梯度下降法,權(quán)重的初始值主要依據(jù)個人經(jīng)驗(yàn)所得.權(quán)重初值的選取直接影響B(tài)P神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)性能,進(jìn)而影響模型的評價效果.因此,本文采用粒子群算法對神經(jīng)網(wǎng)絡(luò)的權(quán)重賦初始值.
粒子群算法用一種粒子來代表鳥群中的鳥,這種粒子是無質(zhì)量的,僅具有兩個屬性:速度和位置.各粒子在空間中單獨(dú)搜尋最優(yōu)解,將其記為當(dāng)前個體極值pbest,并將個體極值與整個粒子群的其他粒子共享,找到最佳的個體極值作為整個粒子群的當(dāng)前全局最優(yōu)解gbest.在每一次迭代中,粒子通過跟蹤這兩個極值更新自己的速度和位置,即:
式中:i表示粒子的數(shù)目,νi表示粒子的速度,rand()是介于(0,1)之間的隨機(jī)數(shù),xi是粒子當(dāng)前的位置,c1、c2是學(xué)習(xí)因子,ω為權(quán)值系數(shù).
傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)算法容易陷入局部最優(yōu)問題的原因是在更新過程中單純利用誤差反向傳播調(diào)整權(quán)值和閾值.通過粒子群算法可拓展搜索權(quán)值、閾值的范圍和深度,優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,實(shí)現(xiàn)全局最優(yōu).具體實(shí)施步驟如下:
(1)根據(jù)表1的評價指標(biāo)內(nèi)容,采集歷史數(shù)據(jù),組成研究生就業(yè)質(zhì)量評價樣本集合;
(2)歸一化處理的樣本數(shù)據(jù)作為BP神經(jīng)網(wǎng)絡(luò)的輸入向量,研究生就業(yè)質(zhì)量評分值作為輸出向量,確定算法的拓?fù)浣Y(jié)構(gòu);
(3)設(shè)置種群規(guī)模,初始化種群位置和速度,并將研究生就業(yè)質(zhì)量評價誤差作為適應(yīng)度函數(shù)值;
(4)計(jì)算粒子適應(yīng)度函數(shù),更新個體最優(yōu)位置pbest和群體最優(yōu)位置gbest;
(5)根據(jù)式(4)調(diào)整粒子速度和位置;
(6)產(chǎn)生(0,1)范圍隨機(jī)數(shù),如果小于變異系數(shù),則隨機(jī)初始化種群,否則,獲得最優(yōu)Wxy和Wyz的初始值;
(7)根據(jù)最優(yōu)的Wxy和Wyz初始值,進(jìn)行研究生就業(yè)質(zhì)量評價神經(jīng)網(wǎng)絡(luò)訓(xùn)練,并采用測試集對訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行仿真測試.
通過粒子群改進(jìn)BP神經(jīng)網(wǎng)絡(luò)模型的研究生就業(yè)質(zhì)量評價流程如圖2所示.
圖2 粒子群改進(jìn)BP神經(jīng)網(wǎng)絡(luò)算法流程
為了測試粒子群改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的研究生就業(yè)質(zhì)量評價效果,采用Python 3.8作為開發(fā)工具編程實(shí)現(xiàn)研究生就業(yè)質(zhì)量評價程序.研究生就業(yè)質(zhì)量評價結(jié)果采用百分制進(jìn)行描述,共收集2500條研究生就業(yè)質(zhì)量評價數(shù)據(jù).使用留出法將樣本數(shù)據(jù)隨機(jī)分為訓(xùn)練集(2000條)和測試集(500條),統(tǒng)計(jì)研究生就業(yè)質(zhì)量評價精度.
為顯示出優(yōu)化后的算法的優(yōu)勢,將單一算法與粒子群優(yōu)化后的算法進(jìn)行對照.為了分析的準(zhǔn)確性,本文從3個角度,即平均絕對誤差(AAD)、平均絕對百分誤差(RAAD)、均方根誤差(RMSE),對仿真效果進(jìn)行對比,預(yù)測結(jié)果如圖3所示.
圖3 預(yù)測結(jié)果對比
其中N表示測試樣本數(shù)量.
從圖3可以看出,無論是AAD、RAAD還是RMSE,粒子群改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)顯示出的優(yōu)勢十分顯著,改進(jìn)后的算法預(yù)測誤差均低于傳統(tǒng)算法的預(yù)測誤差.
為了改善研究生就業(yè)質(zhì)量評價效果,本文引入了基于大數(shù)據(jù)挖掘技術(shù)的研究生就業(yè)質(zhì)量評價模型,采用粒子群算法和BP神經(jīng)網(wǎng)絡(luò)建模對研究生就業(yè)質(zhì)量進(jìn)行評價.仿真結(jié)果表明,智能混合算法優(yōu)化了BP神經(jīng)網(wǎng)絡(luò)權(quán)重、閾值的初始值,避免了傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)算法陷入局部最優(yōu)的情況,且精度更高,預(yù)測值更接近真實(shí)值,評價結(jié)果更可靠,為研究生就業(yè)質(zhì)量評價提供了一種更好的方法.