常賽
關鍵詞:決策樹;招生宣傳;宣傳策略;個性化
1 引言
2014年9月國務院印發(fā)了《國務院關于深化考試招生制度改革的實施意見》,是進一步深化改革,促進教育公平,提高人才選拔水平的重要舉措。該意見提出要形成分類考試、綜合評價、多元錄取的考試招生模式,健全促進公平、科學選才、監(jiān)督有力的體制機制[1]。如何能夠保證公平公正地錄取到更多高素質(zhì)人才,一直是各高校招生部門的工作重點,而招生宣傳則是其中的核心環(huán)節(jié)。我國高校招生擴招從1999年開始,錄取率首次突破50%,隨后高考報名人數(shù)呈逐年攀升的趨勢,2008年達1050萬,但從2009年開始有所下降,2018年下降至975萬人,相較2008年減少了75萬人。由此引發(fā)了激烈的生源競爭,即使近兩年高考報名人數(shù)呈現(xiàn)回暖趨勢,2021年達1078萬人,也沒有緩解各高校間愈演愈烈的生源競爭熱度。高校想方設法通過各種途徑擴大招生宣傳范圍及力度,雖然相對粗放型的擴張模式在短期內(nèi)有所收效,但耗費大量人力和物力,不利于高校招生宣傳的長期可持續(xù)性發(fā)展[2]。
現(xiàn)階段高校招生宣傳工作主要存在時間局限性、地域局限性和信息投放盲目性的問題。
(1) 時間局限性。一方面在招生宣傳集中填報志愿的較短時間段內(nèi),各高校信息以爆炸式的方式呈現(xiàn),考生很難短時間接納如此龐大的信息并有效分析,容易造成信息丟失,降低招生宣傳的有效性[3]。另一方面在平時的宣傳中,由于高中生學業(yè)壓力大,高考前時間極為緊張,宣傳時效覆蓋面有限,很難有效發(fā)揮平時招生宣傳的應有作用。
(2) 地域局限性。研究表明,招生宣傳中的招生宣講會及進校園宣傳的效果最好,此模式下考生可以和心儀的高校進行面對面詳細咨詢,高校也可定點定向針對匹配學生進行宣傳。但此類方式受地域限制明顯,特別是在目前全球新冠疫情的情況下,高校能參與的招生宣講會及進中學校園活動受到限制,容易造成宣傳密度不均,影響招生宣傳的公平性[4]。
(3) 信息投放盲目性。為減少時間和地域局限性影響,高校愈發(fā)側(cè)重新媒體宣傳模式[5]。但目前新媒體信息投放呈現(xiàn)撒網(wǎng)式特點,有一定的盲目性,無法根據(jù)地域、中學、學生等情況精準化個性化投放。雖然新媒體方式如QQ、微信等方式可實現(xiàn)咨詢互動,一定程度上解決學生個性化咨詢問題,但受工作人員數(shù)量和工作時間影響,咨詢并非能得到及時回復,且效率不高,用戶體驗受到影響。
為解決上述問題,本文構(gòu)建基于決策樹的高校招生宣傳模型,在此模型中根據(jù)決策樹的分類策略進行招生宣傳布局,解決信息盲目投放問題,提高投放效率,有針對性地進行宣傳,加強招生宣傳精準度及公平性。
2 決策樹
決策樹算法是一種經(jīng)典的數(shù)據(jù)挖掘方法,生成的模型呈樹形結(jié)構(gòu),常用于處理分類和回歸問題。算法流程示意圖如圖1所示。
ID3和C4.5是決策樹算法中的兩個較為經(jīng)典的算法。ID3(Iterative Dichotomiser3) 算法是20 世紀80年代由J.R.Quinlan 提出的,核心思想是以信息增益作為分裂屬性選取的依據(jù),選擇具有最高信息增益的屬性作為節(jié)點N的分裂屬性。式1為D中元組分類所需信息熵。式2為以屬性A劃分D中元組所需的信息熵。
信息增益為原來的信息需求(式1) 與新需求(式2) 之間的差,如式3所示。
ID3算法具有較快的分類速度和測試速度。但該算法在設計之初未考慮如何處理連續(xù)屬性、屬性缺失以及噪聲等問題。1993年J.R.Quinlan針對ID3算法的不足設計了C4.5算法,引入信息增益率的概念,如式4所示。C4.5算法克服了ID3算法無法處理屬性缺失和連續(xù)屬性的問題,并且引入了優(yōu)化決策樹的剪枝方法,使算法更高效,適用性更強。
剪枝的基本策略有“預剪枝”和“后剪枝”兩種策略?!邦A剪枝”策略是在分類進行之前進行評估,如果泛化能力不到預期則不進行劃分,該節(jié)點記作葉子節(jié)點?!昂蠹糁Α辈呗允窃跊Q策樹完成后,自低向上進行評估,將不滿足泛化預期的節(jié)點刪除子樹后轉(zhuǎn)換成葉子節(jié)點[6-7]。
C4.5算法的優(yōu)點是產(chǎn)生的規(guī)則易于理解且準確率較高,因此本文選擇C4.5作為決策樹生成算法。
3 招生宣傳模型
新時代信息化高度發(fā)達,高校在招生過程中積累了大量的數(shù)據(jù),通過分析發(fā)現(xiàn)在招生宣傳過程中無論是學生對高校專業(yè)的了解程度還是學生對宣傳手段的認可程度,都存在一定規(guī)律性,從規(guī)律中能發(fā)現(xiàn)招生宣傳過程中存在的不足[8]?;跊Q策樹的高校招生宣傳模式分為五個步驟。①劃分區(qū)域目標:根據(jù)不同省份區(qū)域的專業(yè)計劃投放目標劃分基礎區(qū)域范圍;②采集數(shù)據(jù):主要包括各區(qū)域的學生入學前的咨詢數(shù)據(jù)及新生調(diào)查問卷數(shù)據(jù);③數(shù)據(jù)預處理:對采集的信息進行清洗整理、去除雜質(zhì);④建立決策樹,為下一步的具體宣傳決策提供決策機制基礎;⑤生成宣傳決策:為不同區(qū)域或不同類型的對象生成個性化招生宣傳策略?;跊Q策樹的招生宣傳模型層次結(jié)構(gòu)如圖2所示。該模型分為三層:數(shù)據(jù)層、處理層和應用層。
數(shù)據(jù)層主要涉及招生數(shù)據(jù)、宣傳數(shù)據(jù)的采集工作。數(shù)據(jù)來源分為兩個模塊,第一是調(diào)查問卷數(shù)據(jù)模塊,數(shù)據(jù)來源主要是新生入學調(diào)查問卷內(nèi)容;第二是互聯(lián)網(wǎng)數(shù)據(jù)模塊,主要包括:學生入學前各類咨詢數(shù)據(jù)。數(shù)據(jù)層技術(shù)主要包含離線采集、實時采集、互聯(lián)網(wǎng)爬蟲解析等。利用上述技術(shù)采集各類相關數(shù)據(jù),以供處理層分析。
處理層主要實現(xiàn)數(shù)據(jù)處理。先對數(shù)據(jù)進行預處理,去除雜質(zhì),生成決策樹,為應用層決策提供支撐依據(jù)。
應用層根據(jù)應用需求,為不同地區(qū)、不同層次、不同中學的學生生成個性化招生策略,并通過線上線下招生宣傳平臺,實現(xiàn)高效、精準、個性化宣傳。
4 決策樹模型
本文對S大學2021年的6232份新生調(diào)查問卷數(shù)據(jù)級及各類咨詢數(shù)據(jù)進行統(tǒng)計分析,根據(jù)屬性歸類劃分將數(shù)據(jù)整理成數(shù)據(jù)集樣本D,如表1所示。屬性集合A={了解途徑、填報志愿決定者、家庭所在地},類別集合宣傳效果L={強、弱}。其中類別中的強弱標準依據(jù)調(diào)查問卷中學生通過招生信息對高校了解程度來進行劃分,超過50%為強,低于50%為弱。決策分類屬性中“了解途徑”的信息增益率最高,被選為根節(jié)點分類屬性,以此類推,逐漸生成決策樹,如圖2所示。
5 基于決策樹招生宣傳策略的優(yōu)點
基于決策樹的高校招生宣傳相較于傳統(tǒng)招生宣傳策略更具多元化、個性化及精準化特征。高??梢远嘟嵌?、全方位地利用不同階段的學生數(shù)據(jù)進行分析預測,對學生的報考咨詢數(shù)據(jù)、入學及培養(yǎng)數(shù)據(jù)進行分析,掌握內(nèi)在規(guī)律,制定精準化招生策略,改變目前廣撒網(wǎng)式、盲目性的宣傳問題,節(jié)約招生宣傳成本、提高招生宣傳效率。
5.1 多元化宣傳方式
通過數(shù)據(jù)分析可知,新時代大學生對于填報志愿更具有獨立性和自主性,家長、親友、老師對學生本身志愿填報意愿的權(quán)威性影響越來越不明顯。這與新媒體時代信息的高效傳播存在密切關系,學生能夠通過各種渠道獲取到各類招生信息,追求各種渠道的“安利”。這對高校的宣傳工作提出了更高要求,需要與時俱進地采用新時代年輕人喜聞樂見的方式宣傳學校相關內(nèi)容,制定適應新時代青年的宣傳材料,使學生能夠自我決定,并在觀念上認同報考高校。
5.2 個性化信息推送
在招生宣傳過程中有三個重要的組成部分即宣傳主體、宣傳客體及宣傳本體。首先,宣傳主體為高校實施招生宣傳的組織和隊伍;其次,宣傳客體為招生宣傳面向的對象,主要包括學生、家長、中學;最后,宣傳本體為招生宣傳的信息和內(nèi)容,包括宣傳材料、宣傳視頻、宣傳政策等。傳統(tǒng)招生宣傳中宣傳主體起主導作用,宣傳客體僅處于被動接收的狀態(tài)。宣傳本體的組織完全取決于宣傳主體的宣傳意愿。但基于決策樹的招生宣傳模型中,宣傳本體的設置一方面需要依賴于宣傳主體的宣傳意愿,另一方面更需要根據(jù)宣傳過程中主客體產(chǎn)生的數(shù)據(jù)進行挖掘分析,制作精準化的招生宣傳本體。在宣傳主客體相互作用下,產(chǎn)生的宣傳本體才能夠更加精準化及高效性。
5.3 精準化信息投放
通過新生調(diào)查問卷數(shù)據(jù)構(gòu)建的決策樹顯示,對于S大學而言,家庭所在地為地級市的新生對于S大學的基本了解程度較高,接下來依次是省會城市直轄市、縣城鄉(xiāng)鎮(zhèn),來自農(nóng)村地區(qū)的新生對學校的基本了解程度較其他地區(qū)的新生更低。首先,農(nóng)村了解程度低,究其原因是農(nóng)村學生的了解各個大學的消息途徑相對閉塞。其次,省會城市或直轄市的學生相對而言各類高校選擇的機會更多一些,因此關注S大學的信息可能會相對弱一些。最后,地級市、縣城、鄉(xiāng)鎮(zhèn)的同學對于S大學的期待更高,也會更加關注相關信息。由此可見,不同地區(qū)的學生對不同層次的高校的關注度是有區(qū)別的,因此高校在進行信息投放時應該區(qū)分學校受關注區(qū)域進行精準化信息投放。一方面,對于關注度高的區(qū)域,應重點利用新媒體技術(shù)加大信息投放,穩(wěn)固招生優(yōu)勢;另一方面,對于因信息途徑閉塞導致關注度低的區(qū)域,則可以結(jié)合傳統(tǒng)招生宣傳模式,選擇代表性地區(qū)或?qū)W校樹立典型,逐步擴大影響,提高知名度;最后,對于信息通暢但關注度不高的區(qū)域,則可采取精品宣傳模式,優(yōu)先重點宣傳高校優(yōu)勢項目,以突破該區(qū)域同類高校的招生優(yōu)勢,逐步形成品牌效應。精準化的信息投放能在有限招生成本下最大程度地擴大高校影響力。
6 總結(jié)
在目前高校生源競爭日趨激烈的環(huán)境下,如何在有限的條件下,提高招生宣傳效率,吸引更優(yōu)質(zhì)生源報考是各高校招生工作的重點。宣傳主體、宣傳客體和宣傳本體是招生宣傳工作中的三個組成部分。在傳統(tǒng)模式下,宣傳主體將設計的宣傳本體推送給宣傳客體,宣傳客體被動接收宣傳本體,經(jīng)驗占據(jù)主導地位。本文利用決策樹C4.5算法,建立基于決策樹的招生宣傳模型,宣傳本體的設置不僅依賴于宣傳主體的宣傳意愿,更重要是根據(jù)宣傳過程中主客體產(chǎn)生的決策數(shù)據(jù),設置精準化的招生宣傳策略。數(shù)據(jù)層、處理層、應用層三層建模模式,為招生宣傳決策提供數(shù)據(jù)支撐,最終形成多元化宣傳方式、個性化信息推送、精準化信息投放的高效招生模式;同時亦可避免人為因素干擾,利用隱藏在數(shù)據(jù)中的宣傳規(guī)律,科學指導宣傳策略設計,有利于高校招生宣傳工作的可持續(xù)發(fā)展。