摘 ?要:根據大學生就業(yè)的歷史數據創(chuàng)建就業(yè)模型并預測未來的就業(yè)變化及趨勢,可以為學校管理者和人才培養(yǎng)方案制定者提供有價值的信息和參考依據。本文結合學者們針對高校畢業(yè)生就業(yè)預測的研究成果和研究脈絡,從就業(yè)預測數據源、就業(yè)預測算法、就業(yè)預測要素及就業(yè)預測結論四個方面詳細介紹相關研究成果及代表文獻,為研究人員提供參考和借鑒。
關鍵詞:高等學校;就業(yè)預測;算法分析
中圖分類號:TP311.13 ? ? ?文獻標識碼:A 文章編號:2096-4706(2019)12-0086-03
Abstract:Based on the historical data of college studentsemployment,establishing employment model and predicting employment changes and trends in future,which can provide valuable information and reference for school administrators and personnel training program makers. Based on the research results and research veins of the employment prediction of college graduates,this paper makes an analysis from four aspects:the data source of employment prediction,the employment prediction algorithm,the elements of employment prediction and the conclusion of employment prediction,and introduces detailed the relevant research results and representative literatures,so as to provide reference for researchers.
Keywords:institutions of higher learning;employment prediction;algorithms analysis
0 ?引 ?言
高校畢業(yè)生的就業(yè)情況及相關數據在一定的程度上反映出高校的人才培養(yǎng)方案對接行業(yè)需求的吻合度、高校畢業(yè)生的工作能力滿足企業(yè)發(fā)展的需要以及高校在服務地方經濟發(fā)展與社會貢獻方面的能力。為了較好地服務地方經濟發(fā)展,提升高校的社會貢獻度,依據區(qū)域經濟特色、行業(yè)需求和企業(yè)需要,適時制定和修訂專業(yè)人才培養(yǎng)方案,打造與培育技術能力強、職業(yè)素養(yǎng)高的高校畢業(yè)生是高校的辦學使命。因此,有必要根據歷年的就業(yè)數據創(chuàng)建就業(yè)模型來預測未來的就業(yè)變化和就業(yè)趨勢,為高校管理者制定行業(yè)需要、企業(yè)滿意、社會反饋良好的專業(yè)人才培養(yǎng)方案提供有價值的信息和參考。
為此,本文根據學者們針對高校畢業(yè)生就業(yè)預測的研究成果和研究脈絡,對相關文獻進行整理和分析,分別從就業(yè)預測數據源、就業(yè)預測算法、就業(yè)預測要素及就業(yè)預測結論四個方面進行,并詳細介紹了四個方面的相關研究成果。
1 ?高校畢業(yè)生就業(yè)預測數據源分析
文獻[1]以廣西教育學院2012屆畢業(yè)生就業(yè)分析樣本數據集為研究樣本,并將研究樣本分為“畢業(yè)生就業(yè)方向為教師的樣本數據集”“畢業(yè)生就業(yè)方向為企業(yè)單位的樣本數據集”“畢業(yè)生就業(yè)方向為事業(yè)/機關單位的樣本數據集”進行了就業(yè)預測分析。
文獻[2]研究的數據源為南京工程高等職業(yè)學校的就業(yè)管理系統(tǒng),數據跨度為2010至2012年,以4500名畢業(yè)生相關數據為研究樣本,并將這將這些研究樣本分為“學生基本信息數據”“學生成績信息數據”“學生就業(yè)情況”等樣本數據集。
文獻[3]以福建省2006年至2011年招生計劃數與畢業(yè)生人數為研究樣本,依據學生就業(yè)單位的類型(國企、外企和私企),抽取相同數量的就業(yè)數據作為樣本進行分析。
文獻[4]從150所大學中選擇100個大學生就業(yè)數據作為研究樣本。
文獻[5]采集了昆山市的兩個鄉(xiāng)鎮(zhèn)中的100家企業(yè)提供的2006年至2009年的44條數據作為研究數據。
文獻[6]從本校畢業(yè)生中抽取歷年畢業(yè)生在校的一些信息作為研究樣本,每條研究樣本包括性別、英語水平、政治面貌、綜合測評成績、擔任過學生干部、是否為“三好學生”、參與社會實踐、就業(yè)的期望值、獲得學位、畢業(yè)論文成績、就業(yè)作為等項目。
文獻[7]研究對象為某高校近三年的畢業(yè)生就業(yè)信息。
文獻[8]以近三年的信息類專業(yè)畢業(yè)學生的就業(yè)數據為研究樣本,創(chuàng)建了就業(yè)薪酬的預測模型。
……
從以上研究數據源來看,研究者使用的數據來源不同,范圍上存在一定的差異,時間跨度也不盡相同,但數據上有一個共同的特點:研究的數據樣本范圍較窄,樣本數量有限,這易造成研究結果的片面性。
2 ?高校畢業(yè)生就業(yè)預測算法分析
因為研究數據樣本不同,高校畢業(yè)生就業(yè)預測算法的選擇也各不相同。
文獻[1]分析了畢業(yè)生就業(yè)數據中的關聯規(guī)則,根據數據抽樣組建了“畢業(yè)就業(yè)信息數據倉庫”。又因畢業(yè)生的就業(yè)信息較多、數據復雜,且有不確定性的特點,選用了基于劃分的Apriori優(yōu)化算法來預測畢業(yè)生的就業(yè)狀況。采用Apriori算法思想尋找每個數據劃分因素的頻繁項集,計算這些項集的支持度,挖掘出各項因素與就業(yè)方向之間的關聯規(guī)則,并指出“專業(yè)成績、英語等級、社會實踐”在畢業(yè)生就業(yè)方向上影響較大。
文獻[2]選用C4.5算法創(chuàng)建高職院校畢業(yè)決策樹數據模型,重點關注研究樣本數據的6個重要屬性:基礎課程成績、專業(yè)課成績、英語成績、是否擔當學生干部、入學成績和期望就業(yè)單位屬性(事業(yè)單位、國有企業(yè)和私營企業(yè)),然后選取決策屬性,構造決策樹,創(chuàng)建提取規(guī)則,得出專業(yè)課成績仍然是影響學生就業(yè)的最主要的因素,而入學成績與預測就業(yè)基本無關。
文獻[3]選用最鄰近(KNN)分類算法,從畢業(yè)生數據中提取特征數據,如:專業(yè)課成績、是否擔任班干部、英語水平、計算機水平、企業(yè)實習經歷、實踐課程成績和獲獎情況等,接著對這些數據進行數值化處理,將其轉化為特征向量,通過KNN算法計算樣本數據與所有樣本之間的距離,進而預測出學生的就業(yè)方向。
文獻[4]對收集的大學生就業(yè)數據進行歸一化處理,考慮灰色模型和神經網絡各自的特點,提出利用灰色模型和神經網絡的組合方法對就業(yè)樣本數據進行處理,并從不同角度根據大學生就業(yè)數據創(chuàng)建預測模型,從而在灰色模型和神經網絡組合的情況下獲得可靠的預測結果。
文獻[6]采用聚類分析技術中基于模型的統(tǒng)計方法,使用COBWEB這種簡單的增量概念聚類算法,使用分類效用CU來指導分類樹的構建。將數據的10個屬性值(性別、政治面貌、是否擔任學生干部、是否是“三好學生”、英語水平、平均綜合成績、畢業(yè)論文成績、社會實踐、對就業(yè)的期望和是否取得學位)進行量化,建立數據庫和分類樹,從而建立模型進行評估和驗證,得出英語水平高的畢業(yè)生就業(yè)能力強、就業(yè)率高。
文獻[7]也利用C4.5算法進行就業(yè)信息的數據挖掘,通過決策樹創(chuàng)建數據提取,進而創(chuàng)建畢業(yè)生的就業(yè)預測規(guī)則和模型。計算數據中的屬性值(性別、綜合成績、計算機等級、外語水平、學生身份和城鄉(xiāng)情況)之間的信息增益和信息增益比,組建17條分類規(guī)則。以267份樣本數據作為測試樣本對預測模型進行有效性驗證,得出該預測模型預測的正確率大于81%,再次有效地證明了決策樹模型在畢業(yè)生就業(yè)預測方面具有較高的可靠度與準確度。
文獻[8]以影響畢業(yè)生就業(yè)的18個可觀測量作為影響大學生就業(yè)薪酬高低的因子,建立基于因子分析法的畢業(yè)生模型,創(chuàng)建樣本特征向量,利用自然鄰居分類對畢業(yè)生薪酬期望等級進行預測,并用十折交叉驗證的方法證明了該預測的精度和準確率,為大學畢業(yè)生建立合理的就業(yè)預期和就業(yè)薪酬計劃具有一定的指導意義。
文獻[9]通過分析勞動力就業(yè)市場的現狀,以某生產公司的28個就業(yè)樣本數據,采用BP神經網絡創(chuàng)建就業(yè)預測模型。通過仿真實驗得出,基于BP神經網絡的就業(yè)預測模型能較為準確地預測各企業(yè)對短期用工的需求量,并建議企業(yè)可以根據訂單的數量來確定招聘員工的數量。
文獻[10]基于數據挖掘和機器學習中的分類算法,將決策樹ID3算法運用到高職生就業(yè)的預測分析中,對數據集的特征屬性值(考生類別、入學總分、考生地域、應往屆一、年齡、性別、綜合成績、單位地址、專業(yè)相關度)進行量化處理,對學生是否能順利畢業(yè)進行預測。實驗證明,基于ID3算法生成的高職院校學生就業(yè)預測模型的預測準確度較高。
文獻[5]基于AR模型對昆山區(qū)域的某企業(yè)公司的就業(yè)進行了預測和分析,文獻[11]提出運用Kmeans聚類算法和CBR案例推理方法對高校學生就業(yè)趨向進行預測。
3 ?高校畢業(yè)生就業(yè)預測要素分析
在對高校畢業(yè)生就業(yè)進行預測的過程中,學者們以畢業(yè)生的相關屬性為切入點,如性別、政治面貌、學生干部、獲獎情況、外語水平(沒有明確外語水平的考級情況)、專業(yè)成績、綜合表現成績、參與社會實踐、畢業(yè)論文(設計)、計算機水平(未明確計算機考證情況)、是否取得學位、對薪酬的期望、城鄉(xiāng)情況(考生地域)、年齡、入學成績、應往屆生、單位地址等。這些屬性中,使用頻率較高的有性別、專業(yè)成績、英語水平、計算機水平和薪酬期望等,使用較少的屬性有入學成績、應往屆、城鄉(xiāng)情況、單位地址等。
在上述列舉的畢業(yè)生的相關屬性中,性別、外語水平、參與社會實踐和專業(yè)成績對畢業(yè)生就業(yè)的影響較大,這些屬性成為就業(yè)預測的關鍵要素。針對高職院校畢業(yè)生就業(yè)預測來說,專業(yè)成績、參與社會實踐、計算機水平這些屬性對就業(yè)預測的準確度有較大的影響,或者可以說專業(yè)成績好的、參與過社會實踐的,以及掌握計算機操作技能的學生就業(yè)能力強、就業(yè)率高。針對本科院校畢業(yè)生就業(yè)預測來說,外語水平高的學生容易就業(yè)。就業(yè)預測過程中,性別、城鄉(xiāng)情況、入學成績、應往屆生等屬性對就業(yè)預測的影響較小。
4 ?結 ?論
通過對上述的研究結論進行分析,在一定程度上可以得知,大學生在學校所掌握的專業(yè)技能、外語水平與計算機水平直接影響其就業(yè)情況,高校在制定人才培養(yǎng)方案和培育高素質學生的同時,要因勢利導,加強學生專業(yè)學習方面的培養(yǎng)和提高學生在社會實踐活動方面的參與度,做好、做實學生實習、實訓環(huán)節(jié),在課程設置方面既要考慮學生的專業(yè)課程的學習,也要把計算機操作技能、外語技能融入課程體系中,注重專業(yè)知識的理論學習,強化操作技能的訓練,與考證結合起來。高校畢業(yè)生就業(yè)預測為大學生指引了學習的方向,也讓大學生在個人就業(yè)方向上有了更加明確的目標。
參考文獻:
[1] 覃永貞,顧平.Apriori算法在高校畢業(yè)生就業(yè)預測中的應用分析 [J].輕工科技,2014,30(7):93-94+97.
[2] 王賽男.C4.5分類算法在高職就業(yè)預測中的應用 [J].現代計算機(專業(yè)版),2014(23):21-25.
[3] 吳靜.KNN算法在就業(yè)預測模型中的應用 [J].莆田學院學報,2013,20(2):60-63.
[4] 李想.大學生就業(yè)的建模與預測研究 [J].現代電子技術,2017,40(21):109-111+116.
[5] 王靈均.基于AR模型的昆山就業(yè)預測及分析 [J].科學大眾(科學教育),2009(10):126-127.
[6] 楊霞玲,聶永紅.聚類分析在畢業(yè)生就業(yè)預測中的應用 [J].廣西工學院學報,2005(4):82-84+91.
[7] 蔡麗艷,馬弘偉.數據挖掘技術在高校就業(yè)預測分析中的應用 [J].微計算機信息,2012,28(8):101-103.
[8] 朱慶生,高璇.應用自然鄰居分類算法的大學生就業(yè)預測模型 [J].計算機系統(tǒng)應用,2017,26(8):190-194.
[9] 吳振磊,劉孝趙.一種基于BP神經網絡的就業(yè)分析預測模型 [J].輕工科技,2016,32(9):70-71+104.
[10] 孫曉璇,楊家娥,李雅峰.基于決策樹ID3算法的高職生就業(yè)預測分析 [J].電腦編程技巧與維護,2015(2):15-16+35.
[11] 廖珣.基于Kmeans和CBR方法的高校就業(yè)預測模型應用研究 [J].人力資源管理,2010(3):79-80.
作者簡介:陳君濤(1981-),男,漢族,湖北天門人,副教授,碩士,研究方向:計算機應用、職業(yè)教育。