拜亞萌
(焦作大學,河南 焦作454000)
隨著高等教育普及,高校畢業(yè)生人數(shù)日益增多,高校就業(yè)工作的壓力也變得越來越嚴峻。 國家層面和高校層面均出臺相應政策,不斷完善就業(yè)信息服務體系,提升就業(yè)工作效率與服務質量[1]。 大學生網(wǎng)絡就業(yè)信息服務就是通過各類就業(yè)網(wǎng)站獲取相應的求職信息,但目前大多數(shù)就業(yè)網(wǎng)站在個性化服務內容、崗位精準匹配等方面存在不足,如何解決大學生就業(yè)難和企業(yè)招聘人才難的問題,已經(jīng)成為大學生就業(yè)網(wǎng)絡服務模式研究的一項重要內容[2-3]。
運用大數(shù)據(jù)分析技術對海量就業(yè)信息數(shù)據(jù)進行挖掘處理,從而獲取具有價值的就業(yè)信息,提升高校畢業(yè)生精準就業(yè)服務水平, 成為大數(shù)據(jù)背景下高校精準就業(yè)服務工作的重點之一。 本文正是基于此目的,以大數(shù)據(jù)分析技術為基礎,優(yōu)化構建一種多層結構的就業(yè)網(wǎng)絡精準化服務模式。
在就業(yè)網(wǎng)絡招聘領域,求職用戶和招聘企業(yè)構成了供求關系, 本文將兩者作為研究主體,分析得到不同主體所具備的對應屬性信息[4]。其中,求職用戶的簡歷類資源主要包括客觀特征和主觀意向,客觀特征主要指基本信息、技能特長、教育水平、工作經(jīng)歷等客觀屬性,主觀意向則包括期望職業(yè)、期望行業(yè)、期望公司類別以及期望工作地等相關屬性。而招聘企業(yè)中的職位類資源需求,同樣又包括崗位客觀需求以及崗位主觀要求[5-6]。 其中,崗位客觀需求則主要對應聘者的基本信息、教育水平、工作經(jīng)歷以及技能水平進行客觀性約束,崗位主觀要求則針對職位所屬行業(yè)、 公司所屬行業(yè)、公司性質、職位所在地等主觀因素。 圖1 描述了求職用戶簡歷類資源和招聘企業(yè)職位類資源的不同屬性之間的對應關系。
圖1 簡歷類資源與職位類資源的對應關系
簡歷類資源和職位類資源中的某些屬性之間存在聯(lián)系。 其中,求職用戶的客觀特征屬性與招聘職位所需的能力要求之間存在對應關系,求職者的期望屬性與崗位主觀要求之間也存在對應關系。 因此,本文正是基于此思路,通過采集簡歷類資源和職位類資源中的關鍵屬性值,對用戶與就業(yè)信息數(shù)據(jù)向量進行匹配計算,根據(jù)匹配結果,對權重推薦度進行排序,取相似度靠前的推薦結果推薦給用戶,從而完成就業(yè)網(wǎng)絡信息服務模式的精準化推薦操作。
針對目前就業(yè)網(wǎng)絡信息服務中普遍存在的就業(yè)冗余信息多、就業(yè)信息不匹配、就業(yè)信息時效性差以及推薦系統(tǒng)不完善等問題,重點對就業(yè)網(wǎng)絡信息服務平臺、精準化就業(yè)服務推薦模型以及個性化推薦算法的設計過程進行了闡述。
就業(yè)網(wǎng)絡信息服務平臺是實現(xiàn)大學生就業(yè)網(wǎng)絡精準化服務模式的重要載體,該平臺可為不同用戶提供一站式就業(yè)信息服務。 設計思路采用分層架構思想, 自上而下分為信息服務平臺層、信息服務策略層、信息數(shù)據(jù)倉庫層。 每個層次又根據(jù)實際業(yè)務需求劃分為不同功能模塊,通過面向對象服務設計模式,使得不同功能模塊之間具備低耦合、可擴展等良好的技術特性。 圖2 描述了就業(yè)網(wǎng)絡信息服務平臺的體系模型結構。
圖2 大學生就業(yè)網(wǎng)絡信息服務平臺體系框架
2.1.1 服務平臺層
該層以就業(yè)信息服務網(wǎng)站的方式為求職者和用人單位等相關主體用戶提供訪問各種業(yè)務的操作, 同時通過該層實現(xiàn)交互式的訪問操作。另外, 該層還負責收集就業(yè)信息和基礎數(shù)據(jù),包括求職用戶和企業(yè)用戶的客觀屬性和主觀需求所涉及的相關數(shù)據(jù)信息,并將相應數(shù)據(jù)轉換為對應技能或就業(yè)需求。 該層主要向用戶提供各種就業(yè)信息服務,包括個人簡歷管理、個性化搜索管理、職業(yè)規(guī)劃管理、技能評估管理等多個核心模塊和基本的服務功能。
2.1.2 服務策略層
該層負責對服務平臺層所涉及的各種業(yè)務進行分析和計算,并將計算結果以策略的方式呈現(xiàn)給用戶。 該層以大數(shù)據(jù)分析、數(shù)據(jù)挖掘技術為技術支撐,構建信息采集、過濾、精準化推薦、智能搜索、就業(yè)預測分析等不同的服務策略。
其中,信息采集過濾服務主要負責對用戶求職行為(點擊、申請、收藏、瀏覽)以及個人基本信息、簡歷信息等數(shù)據(jù)進行清洗、轉化、過濾等操作,為數(shù)據(jù)分析提供規(guī)范化的數(shù)據(jù)集合。 精準化推薦的核心是協(xié)同過濾推薦引擎算法,根據(jù)求職用戶的興趣愛好、 期望職業(yè)等主觀意愿信息,預測用戶實際需求, 并檢索出相應的就業(yè)服務信息,主動為用戶提供各種個性化就業(yè)相關的服務信息。 智能搜索引擎服務則通過搜索引擎接收用戶信息,分析就業(yè)信息需求,并通過協(xié)同過濾推薦算法,在本地數(shù)據(jù)庫中進行信息匹配,將得到的匹配信息匯總,從而為用戶提供所需的搜索服務。 就業(yè)預測分析則主要通過個性化推薦引擎算法, 計算與目標求職者具有相似行為的其他用戶, 并獲取相似用戶的求職行為和職位獲取信息,并將該信息作為個性化推薦信息推送給目標求職者,從而完成就業(yè)趨勢預測分析等服務。
2.1.3 數(shù)據(jù)倉庫層
數(shù)據(jù)倉庫層主要由海量異構數(shù)據(jù)倉庫、就業(yè)網(wǎng)絡信息服務核心數(shù)據(jù)庫以及數(shù)據(jù)ETL 引擎三部分組成,其主要功能是負責為服務策略層提供必要的數(shù)據(jù)信息。 其中,海量易購數(shù)據(jù)倉庫則由用人單位招聘數(shù)據(jù)庫、 畢業(yè)生基本信息數(shù)據(jù)庫、用戶行為采集數(shù)據(jù)庫、高校畢業(yè)生信息數(shù)據(jù)庫構成。 ETL 引擎則是該層的核心,將各種異構數(shù)據(jù)庫的數(shù)據(jù)進行抽取、清洗、轉換、聚合后加載到核心數(shù)據(jù)庫中,為上層的數(shù)據(jù)挖掘和聯(lián)機分析提供必要的基礎數(shù)據(jù)。
就業(yè)信息推薦模型是整個就業(yè)網(wǎng)絡服務平臺的核心,也是服務策略層的重要組件之一。 在該模型中分別針對求職用戶和招聘企業(yè)進行內容屬性提取,并構建各自相應的用戶模型,再通過推薦引擎(內容匹配器)完成信息匹配,從而對求職者的真實求職意圖進行預測和推薦。 圖3 則是精準化就業(yè)服務推薦模型的工作流程,就業(yè)服務推薦模型工作步驟描述如下。
(1)采集信息:分別獲取求職用戶簡歷類資源信息以及招聘企業(yè)崗位需求類資源信息。 其中,用戶資源包括個人基本信息等顯式數(shù)據(jù)以及用戶行為等隱式數(shù)據(jù),崗位需求類資源則主要包括崗位客觀需求和崗位主觀需求等數(shù)據(jù)信息。
(2)創(chuàng)建模型:面向求職用戶和招聘企業(yè),分別創(chuàng)建求職用戶基本模型、用戶行為模型和職位需求模型。
(3)抽取集合:從所創(chuàng)建的資源模型中抽取由主觀興趣和客觀特征組成的關鍵屬性集合,并將對應的關鍵屬性值存儲到就業(yè)信息核心數(shù)據(jù)庫中,生成各自屬性向量集。
(4)數(shù)據(jù)處理:利用用戶協(xié)同過濾推薦算法,對用戶和就業(yè)信息數(shù)據(jù)向量進行匹配計算。
(5)結果推薦:根據(jù)匹配結果,對權重推薦度進行排序, 取相似度靠前的推薦結果推薦給用戶,從而獲取職位推薦信息。
圖3 精準化就業(yè)服務推薦流程
其中,用戶行為數(shù)據(jù)的采集主要包括顯式數(shù)據(jù)和隱式數(shù)據(jù)。 顯式數(shù)據(jù)包括個人基本信息、學歷專業(yè)、興趣愛好等用戶注冊所提交的靜態(tài)數(shù)據(jù)信息。 而隱式數(shù)據(jù)則主要指求職者通過點擊、瀏覽、搜索、查詢、收藏等行為所產(chǎn)生的行為數(shù)據(jù)信息。 通過對上述兩類數(shù)據(jù)信息的采集,并進行數(shù)據(jù)清洗、轉化、篩選等預處理,減少無效數(shù)據(jù)的參與量,降低模型計算量。 然后,根據(jù)用戶行為數(shù)據(jù),采用用戶畫像技術,構建用戶模型。 最后,通過推薦引擎(內容匹配器)完成職位信息的推薦。
本文采用協(xié)同過濾推薦算法作為推薦引擎的核心算法,首先對用戶顯式數(shù)據(jù)和隱式數(shù)據(jù)進行采集,并對采集的數(shù)據(jù)進行數(shù)據(jù)建模,計算分析出與目標求職者類似的相似用戶;最后,將相似用戶所具有的求職行為作為目標求職者的匹配結果,輸出職位推薦結果,從而實現(xiàn)個性化推薦。 該算法是在基于內容和規(guī)則的推薦算法基礎之上進行的改進,相比傳統(tǒng)的基于文本的推薦算法,協(xié)同過濾推薦算法在數(shù)據(jù)依賴度、數(shù)據(jù)模型創(chuàng)建、 數(shù)據(jù)集合采集等性能方面均有較大的提高。 同時,協(xié)同過濾推薦算法的最大優(yōu)勢在于對用戶隱式數(shù)據(jù)的分析和處理,從而可以從更多維度提升推薦結果的精準性。
高校畢業(yè)生就業(yè)網(wǎng)絡信息服務模式是一個綜合性的服務系統(tǒng),除了需要專業(yè)的技術支持之外,還需要從豐富就業(yè)資源、改進信息技術、完善就業(yè)指導體系、 加強就業(yè)信息服務隊伍建設、擴大機構合作等五個方面提供相應的保障機制。
(1)高質量的就業(yè)信息資源。 傳統(tǒng)就業(yè)信息服務模式已經(jīng)不能滿足高校畢業(yè)生的就業(yè)需求,要構建滿足不同學歷層次的畢業(yè)生就業(yè)信息資源庫,同時對就業(yè)信息進行細化分類,形成橫向和縱向布局、 專業(yè)和愛好交叉的信息分類模式。加強對異構就業(yè)資源信息庫的統(tǒng)一化管理,對各類數(shù)據(jù)資源進行標準化、規(guī)范化處理,更好實現(xiàn)就業(yè)信息資源的最優(yōu)化配置。
(2)改進個性化的信息服務技術。 要充分利用信息過濾技術、移動互聯(lián)網(wǎng)、云計算技術、WEB數(shù)據(jù)挖掘技術、 大數(shù)據(jù)分析等智能信息技術,針對大學生就業(yè)網(wǎng)絡信息服務實際需求,改進就業(yè)網(wǎng)絡信息服務模式,優(yōu)化個性化推薦引擎和推薦策略,不斷提高大學生對個性化就業(yè)信息服務的滿意度。
(3)完善高校畢業(yè)生就業(yè)指導體系。 各個高校要重視大學生職前培訓,加強學校和學生之間的聯(lián)系, 更多地獲取大學生的各種就業(yè)需求,進一步了解當前大學生在就業(yè)、擇業(yè)過程中面臨的各種實際問題。 將專業(yè)知識與企業(yè)崗位技能需求之間的關系進行重新梳理,一方面可以通過優(yōu)化高校課程體系及培養(yǎng)方案,更高效地為企業(yè)培養(yǎng)各種急需人才,另一方面,通過收集各類畢業(yè)生就業(yè)信息數(shù)據(jù),更好地優(yōu)化就業(yè)網(wǎng)絡信息服務模式, 進而更好地完善高校畢業(yè)生的就業(yè)服務體系。
(4)加強就業(yè)信息服務隊伍建設。 就業(yè)信息服務隊伍建設也是確保就業(yè)信息服務模式順利開展的重要環(huán)節(jié),要建立不同技術水平和服務能力的就業(yè)信息服務人員梯隊,圍繞大學生就業(yè)信息實際需求,形成技術開發(fā)、需求調研、培訓管理為一體的初級、中級、高級三類人才體系。 只有不斷加強技術人才儲備,定期開展技術交流和業(yè)務培訓,才能不斷完善技術服務水平,應對來自不同層面的競爭和壓力,為高校畢業(yè)生就業(yè)信息服務提供更為滿意的服務。
(5)擴大機構合作共享。 為提高推薦模型的精準度,還需要提供更多的學習樣本數(shù)據(jù),這就要求不同的就業(yè)信息服務平臺、服務機構和各個高校要打破界限,加強合作交流,提供更多的就業(yè)信息數(shù)據(jù)和職位需求信息, 提高資源利用率。另外,在不斷增加數(shù)據(jù)資源數(shù)量的同時,還要確保數(shù)據(jù)的質量,制訂標準化的數(shù)據(jù)格式,提高數(shù)據(jù)的有效性。
在本課題的研究過程中, 通過問卷調查、門戶網(wǎng)站調研、高校走訪等方式,明確高校畢業(yè)生的就業(yè)網(wǎng)絡信息服務需求。 利用云計算架構、大數(shù)據(jù)分析等技術, 釆用自頂向下的分層設計思想, 優(yōu)化高校畢業(yè)生就業(yè)網(wǎng)絡信息服務模式,提出個性化推薦算法來彌補當前就業(yè)信息服務中求職用戶與就業(yè)信息不匹配問題,為個性化推薦系統(tǒng)在就業(yè)信息服務領域的應用作參考,進而為就業(yè)信息實現(xiàn)精準化推薦服務提供解決思路。
該服務模式運用大數(shù)據(jù)分析技術挖掘就業(yè)相關數(shù)據(jù)的潛在價值,將大數(shù)據(jù)相關技術應用于高校就業(yè)工作,能夠更好地分析人才市場供需不匹配的現(xiàn)象,為高校畢業(yè)生個性化就業(yè)指導提供更加客觀、科學、準確的數(shù)據(jù)、算法和模型支撐,為畢業(yè)生提供精準化的就業(yè)推薦和就業(yè)指導服務,進而提高就業(yè)工作服務質量和效率。