易倩文
◆摘? 要:為了能夠深入的挖掘和剖析影響當前高校大學生畢業(yè)求職就業(yè)的關鍵影響因素,找到當前大學生就業(yè)選擇因素之間的相互作用原因,筆者對重慶工程學院2021屆畢業(yè)生進行了關于“后疫情期間就業(yè)情況調研”的問卷調查,然后以數(shù)據(jù)挖掘分類技術為支撐設計出C4.5算法對各種影響重慶工程學院畢業(yè)生就業(yè)選擇的因素針對性的進行分析,以此來得出影響應屆畢業(yè)生就業(yè)選擇的決策模型,根據(jù)這一算法模型,幫助以后的大學生更好的在大學期間完善自己的專業(yè)技能,強化自己的綜合能力,提高自己的社會競爭力,為以后走出校園,在求職就業(yè)上有更多的選擇,提高應屆畢業(yè)生的就業(yè)率。而這一算法模型的運用對于高校在后疫情時期面對嚴峻的就業(yè)形勢以及社會經(jīng)濟發(fā)展趨勢下,能夠起到有效的就業(yè)指導效果,通過算法模型能夠最大程度的幫助高校了解就業(yè)形式,實現(xiàn)在就業(yè)指數(shù)上的多項比較,以此來針對性的改進教學計劃,刺激高校畢業(yè)生就業(yè)率的不斷提高。
◆關鍵詞:決策樹;大學生就業(yè)指導;重慶工程學院
運用決策樹來保證在后疫情時期高校大學生的就業(yè)率能夠有效提高,其本身是基于決策樹分類法能夠深度的挖掘高校畢業(yè)生的相關就業(yè)數(shù)據(jù),借助數(shù)據(jù)分析去找到畢業(yè)生潛在的就業(yè)規(guī)律,以此來得出影響高校畢業(yè)生就業(yè)率的關鍵因素,從而幫助高校更好的對應屆畢業(yè)生進行就業(yè)上的分類指導、精準服務,這樣不僅有助于提高高校在就業(yè)指導工作上的效率,還能夠幫助高校打出知名度,提升教育信譽度。在這個后疫情時期,能夠降低疫情對于高校畢業(yè)生就業(yè)的影響,能夠提高畢業(yè)生的就業(yè)率以及就業(yè)質量。
1決策樹分類法所運用到的C4.5算法
C4.5算法其實是對ID3算法的一種優(yōu)化,它是以數(shù)據(jù)增益率為標準來選擇決策樹的節(jié)點屬性的一種算法,其本身默認選擇的是當前分支節(jié)點下數(shù)據(jù)增益率最高屬性作為當下的節(jié)點測試屬性,因此C4.5算法本身能夠極大的減少對于樣本分類所需要的數(shù)據(jù)量,同時也能夠保證數(shù)據(jù)本身的最小隨機性或者說“不純性”。因此C4.5算法能夠降低調研難度,測試數(shù)目可以達到最小化,因此基于C4.5算法可以設計出最簡單的一棵決策樹。
2數(shù)據(jù)挖掘對象以及決策樹分析目標
本文是將重慶工程學院2021屆畢業(yè)生作為數(shù)據(jù)挖掘的對象,以他們作為研究對象,通過對他們的就業(yè)意向進行調查,獲取到他們的專業(yè)成績、英語水平、計算機技能以及就業(yè)選擇等多項相關個人能力因素,并且通過調查報告去確定他們期望的上班時間、薪資范圍、福利待遇以及期望得到的就業(yè)指導內容等多個影響個人就業(yè)選擇的因素,以此來幫助重慶工程學院獲得相關的畢業(yè)生就業(yè)數(shù)據(jù),通過決策樹分類法幫助重慶工程學院學生工作委員會以及就業(yè)指導中心掌握相關的就業(yè)指導課程改進以及課程安排,為就業(yè)指導教學的開展提供了數(shù)據(jù)理論的支撐。
3數(shù)據(jù)采集
要想借助C4.5算法來進行數(shù)據(jù)的深入挖掘,首先需要確定的是具體可查的研究對象,需要對可能影響高校畢業(yè)生就業(yè)選擇的諸多因素進行系統(tǒng)的準確的數(shù)據(jù)收集,可以說整個數(shù)據(jù)收集的準確度在一定程度上決定著整個C4.5算法對于結果分析上的準確性,而越是準確的結果分析也才越是具有參考的價值。
基于這一點,我們對于重慶工程學院2021屆的畢業(yè)生都進行了就業(yè)意向調查統(tǒng)計,我們首先從學院中的學生學籍管理系統(tǒng)中獲取了2021屆畢業(yè)生的學生基本信息,包括他們的院系、專業(yè)、班級、姓名、學號、性別、籍貫、政治面貌以及身份證號等。其次我們還從學校的“成績查詢服務網(wǎng)站”中獲取到了2021屆畢業(yè)生的學習成績,包括各科成績、專業(yè)績點、學分等。然后從這些數(shù)據(jù)中心抽取相應的部分畢業(yè)生信息作為這次研究分析的對象,一次來保證數(shù)據(jù)信息本身的準確性以及隨機性。
4構造決策樹
在后疫情時期,影響學生進行就業(yè)選擇的因素更多,而疫情對于學生就業(yè)選擇的影響也是當前高校在進行就業(yè)指導過程中不可忽視的一點。而因為我們選的研究對象是重慶工程學院2021屆的所有畢業(yè)生,因此所涉及到的信息數(shù)量是十分巨大的,而任務采集也足足花費了將近一年的時間,采集任務重,耗時長,所涉及到的數(shù)據(jù)信息如果想要完全處理,難度極大,因此我們?yōu)榱吮WC數(shù)據(jù)本身的有效性,需要對數(shù)據(jù)進行預處理,通過數(shù)據(jù)集成以及屬性歸納的方式對數(shù)據(jù)進行預處理。同時通過運用C4.5算法獲得的決策樹,往往也是十分龐大復雜的,要想凸顯主要的影響因素,提高整個決策樹的實用性,我們需要去除掉決策樹中對于實際就業(yè)情況影響不大的因素,對決策樹進行必要的修剪,這就需要使用到悲觀后剪枝法。
通過對重慶工程學院2021屆畢業(yè)生進行信息數(shù)據(jù)的調查以及分析我們發(fā)現(xiàn),所有學生對于自己畢業(yè)之后的第一份工作都是十分重視的,但是在針對就業(yè)單位的選擇上考慮的點卻有很大的區(qū)別,在薪資方面,40%以上的畢業(yè)生希望在月薪5000元以上,可見現(xiàn)在年輕人對于薪資待遇還是十分重視的。其次就是45%的畢業(yè)生都不太關注專業(yè)是否對口的問題,只看中行業(yè)未來的發(fā)展?jié)摿σ约白约何磥淼陌l(fā)展機會。當然對于就業(yè)單位所能夠提供的福利待遇則是很多畢業(yè)生都關注的問題,95%的畢業(yè)生都有強烈的五險一金意識,其次對于周末雙休、帶薪休假、進修培訓以及包吃住等也都十分重視。而更多的畢業(yè)生是希望能夠通過第一份工作獲得寶貴的經(jīng)驗以及清晰的職業(yè)規(guī)劃的。這些調查對于重慶工程學院構建出清晰的畢業(yè)生決策樹是有很大的幫助的,對于該校以后進行就業(yè)指導也有很大的幫助。
5疫情影響下決策樹在畢業(yè)生就業(yè)指導的應用
在構造決策樹之后,就需要依據(jù)決策樹所提供的數(shù)據(jù)信息從決策樹的根結點到葉結點進行分類規(guī)則的歸納生成。而基于后疫情時期的高校畢業(yè)生就業(yè)選擇所涉及到的相關研究文獻比較缺乏,因此需要在不斷的自我總結和深度研究的過程中去探索關于疫情對于高校畢業(yè)生就業(yè)選擇影響的因素,同時搭建針對新冠疫情影響的決策樹理論框架,以及相對應的數(shù)據(jù)調查方法,從而嘗試性的探究決策樹在后疫情時期對于大學生就業(yè)指導工作的應用研究。
參考文獻
[1]楊斷利,張銳,王文顯.基于模糊決策樹的高校就業(yè)數(shù)據(jù)挖掘研究[J].河北農業(yè)大學學報,2012,35(2):111-114.
[2]麥曉冬,賈萍,翁建榮,等.基于多尺度粗糙集模型的決策樹在高校就業(yè)數(shù)據(jù)分析中的應用[J].華南師范大學學報(自然科學版),201,46(4):31-36.
[3]李冬梅,路春艷,張雅惠:決策樹分類方法在大學生就業(yè)指導中的應用[J].統(tǒng)計與咨詢,2017(06):29-32.