• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)據(jù)表示和特征修正在人崗匹配研究中的應(yīng)用

      2022-04-12 20:32:14常兵褚志海印忠文趙龍軍
      計(jì)算機(jī)時(shí)代 2022年4期
      關(guān)鍵詞:指標(biāo)體系

      常兵 褚志海 印忠文 趙龍軍

      摘? 要: 人崗匹配度的合理測(cè)算是人才合理分配的基礎(chǔ),針對(duì)傳統(tǒng)人崗匹配研究中主觀評(píng)價(jià)占比高、數(shù)據(jù)表示粗糙等問題,對(duì)人崗匹配度測(cè)算方法進(jìn)行了研究。首先構(gòu)建了人崗匹配度指標(biāo)體系;其次進(jìn)行特征構(gòu)建得到特征字段屬性,采用數(shù)據(jù)表示和特征修正的技術(shù)方法進(jìn)行特征表示、多區(qū)間劃分及修正,完成各指標(biāo)匹配度的測(cè)算;最后采用XGBoost算法構(gòu)造人崗匹配度分類模型,將模型概率值作為匹配度測(cè)算值,通過真實(shí)招聘數(shù)據(jù)對(duì)該方法的有效性進(jìn)行了驗(yàn)證。

      關(guān)鍵詞: 指標(biāo)體系; 數(shù)據(jù)表示; 特征修正; 人崗匹配度

      中圖分類號(hào):TP391.1? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ?文章編號(hào):1006-8228(2022)04-09-04

      Application of data representation and feature modification

      in resume-post matching research

      Chang Bing Zhu Zhihai Yin Zhongwen Zhao Longjun

      (1. CETC big data Research Institute Co., Ltd, Guiyang, Guizhou 550022, China; 2. China xiongan Group Co., Ltd)

      Abstract: The reasonable estimation of resume-post matching degree is the basis of rational allocation of talents. Aiming at the problems of high proportion of subjective evaluation and rough data representation in the traditional resume-post matching research, the estimation method of resume-post matching degree is studied. Firstly, the index system of resume-post matching degree is constructed. Secondly, the feature field attributes are obtained by feature construction; the technical methods of data representation and feature modification are used for feature representation, division, modification, and the calculation of the matching degree of each index. Finally, the XGBoost algorithm is used to construct a classification model of resume-post matching degree and the model probability value is used as the matching degree estimation value. The effectiveness of the method is verified by real recruitment data.

      Key words: index system; data representation; feature modification; resume-post matching degree

      0 引言

      眾多企事業(yè)單位在評(píng)價(jià)簡(jiǎn)歷與崗位是否匹配時(shí)往往采用主觀評(píng)定的方法,該方法一般對(duì)評(píng)價(jià)人的經(jīng)驗(yàn)積累和精力投入要求較高,在時(shí)間充裕、小批量的情況下,效果較好,但是在互聯(lián)網(wǎng)信息技術(shù)高速發(fā)展的今天,主觀評(píng)定法已經(jīng)無法滿足短時(shí)間內(nèi)、大量人崗數(shù)據(jù)快速匹配的需求。如何快速、準(zhǔn)確地測(cè)算人才與崗位的匹配度,從而科學(xué)合理地進(jìn)行人崗分配管理成為眾多企業(yè)研究的重點(diǎn)。

      近年來,人崗匹配研究主要集中在概念、評(píng)價(jià)指標(biāo)體系、數(shù)據(jù)維度、數(shù)據(jù)處理與量化、計(jì)算模型等幾個(gè)方面。李曉寧等[1]從員工職業(yè)勝任力與企業(yè)需求方面研究了員工與崗位需求的匹配情況;袁珍珍等[2]和易斌等[3]分別研究了BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)在人崗匹配測(cè)算中的應(yīng)用;李娟等[4]進(jìn)行了基于灰色系統(tǒng)理論的人力資源崗位匹配度研究;李松等[5]研究了基于直覺模糊的多指標(biāo)人崗雙邊匹配決策方法;PAZZANI等[6]和GOPALAN[7]等根據(jù)崗位要求和應(yīng)聘者簡(jiǎn)歷研究了基于內(nèi)容匹配的方法。盡管目前人崗匹配測(cè)算的研究取得了一定成果,但是多數(shù)研究停留在人崗匹配度指標(biāo)體系構(gòu)建和簡(jiǎn)單的數(shù)值匹配層面,且評(píng)分公式權(quán)重的確定大多依賴于調(diào)查問卷或?qū)<以u(píng)估,存在數(shù)據(jù)利用程度低、智能化難度大、計(jì)算結(jié)果不準(zhǔn)等問題。因此,本文提出了一種基于數(shù)據(jù)表示和特征修正的人崗匹配度測(cè)算方法:首先構(gòu)建了人崗匹配度測(cè)算指標(biāo)體系;其次采用特征數(shù)據(jù)修正和數(shù)據(jù)處理與表示的技術(shù)方法對(duì)數(shù)據(jù)集進(jìn)行特征表的構(gòu)建、特征數(shù)據(jù)修正、多區(qū)間劃分及表示;最后,采用XGBoost算法構(gòu)建人崗匹配度分類模型,將模型輸出的概率值作為匹配度測(cè)算值,最終實(shí)現(xiàn)人崗匹配度測(cè)算。

      1 人崗匹配度測(cè)算指標(biāo)體系的構(gòu)建

      本文基于科學(xué)性、簡(jiǎn)單性、有效性、可實(shí)施性、可量化性、統(tǒng)一性的指標(biāo)體系構(gòu)建原則,結(jié)合真實(shí)招聘數(shù)據(jù)的統(tǒng)計(jì)分析結(jié)果和經(jīng)驗(yàn)常識(shí),確定影響人崗匹配的指標(biāo)因素,構(gòu)建的人崗匹配度測(cè)算指標(biāo)體系如圖1所示。735EF330-3615-4D53-B292-BA567E9EE863

      圖1所示的人崗匹配度測(cè)算指標(biāo)體系中一級(jí)指標(biāo)包含3個(gè)維度:基本信息匹配度、經(jīng)歷匹配度、經(jīng)驗(yàn)技術(shù)匹配度,其中基本信息匹配度包含4個(gè)二級(jí)指標(biāo),主要為人員與崗位中性別、年齡、政治面貌、城市的匹配程度;經(jīng)歷匹配度包含5個(gè)二級(jí)指標(biāo),分為學(xué)業(yè)經(jīng)歷和工作經(jīng)歷兩個(gè)方面,二級(jí)指標(biāo)包括學(xué)歷匹配度、專業(yè)匹配度、院校匹配度、工作年限匹配度和工作穩(wěn)定性;經(jīng)驗(yàn)技術(shù)匹配度包含4個(gè)二級(jí)指標(biāo),主要為項(xiàng)目經(jīng)驗(yàn)匹配度、薪水匹配度、行業(yè)匹配度和職類匹配度。

      2 特征數(shù)據(jù)修正及數(shù)據(jù)表示

      2.1 構(gòu)建特征表字段

      為了得到能夠應(yīng)用于模型訓(xùn)練測(cè)試的特征數(shù)據(jù)集,根據(jù)上述人崗匹配度測(cè)算指標(biāo)體系,對(duì)各大在線招聘網(wǎng)站的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,構(gòu)建簡(jiǎn)歷特征和崗位特征,其中簡(jiǎn)歷特征屬性反映了人員的背景信息及相應(yīng)的求職意愿,主要包括性別、年齡、政治面貌、居住地、專業(yè)、院校、工作經(jīng)驗(yàn)、行業(yè)、職類等屬性;崗位特征反映的是該崗位的特性及需求,主要包括崗位名稱、學(xué)歷要求、年齡要求、職位、性別要求、崗位描述、工作年限等屬性。

      2.2 特征數(shù)據(jù)修正

      結(jié)合上述所構(gòu)建的崗位特征,對(duì)簡(jiǎn)歷、崗位的真實(shí)數(shù)據(jù)進(jìn)行特征匹配和統(tǒng)計(jì)分析發(fā)現(xiàn)特征數(shù)據(jù)幾乎相同的兩條數(shù)據(jù)其匹配的結(jié)果是不一樣的,如同一份簡(jiǎn)歷特征數(shù)據(jù),針對(duì)兩條特征相同的崗位信息其匹配結(jié)果是不同的。針對(duì)上述問題,本文針對(duì)數(shù)據(jù)中匹配不一致的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析發(fā)現(xiàn),在結(jié)構(gòu)化特征字段相同的情況下,崗位特征表中的“崗位描述”字段屬性中包含了“性別要求”、“年齡要求”、“政治面貌要求”、“畢業(yè)院校類別要求”、“工作年限要求”、“崗位職責(zé)”、“福利待遇”等信息,如“年齡不超過35周歲”、“具有3~5年的工作經(jīng)驗(yàn)”。由于“崗位描述”在進(jìn)行人崗匹配過程中是招聘單位和人員所關(guān)注的重點(diǎn)信息,同時(shí)“崗位描述”中的長(zhǎng)文本信息無法直接用關(guān)鍵字匹配方式直接進(jìn)行處理,因此需要通過自然語言挖掘技術(shù)對(duì)其字段屬性進(jìn)行信息解析和提取。

      本文中基于崗位特征表的“崗位描述”字段信息,解析得到的特征主要包括:“年齡”、“學(xué)歷”、“性別”、“政治面貌”、“工作年限”、“院校類型”,由于招聘單位結(jié)合實(shí)際要求描述的“崗位描述”會(huì)與招聘系統(tǒng)默認(rèn)生成的特征信息會(huì)存在一定程度的偏差,因此,解析特征與原始崗位特征表中已有的“年齡要求”、“工作年限要求”、“性別要求”等特征數(shù)據(jù)存在一定程度的沖突。同時(shí),跨特征屬性信息也存在不合理的要求,如學(xué)歷要求為“碩士研究生及以上”且年齡要求為“不超過25周歲”,這在實(shí)際中大多情況下是不合理的。因此,需將“崗位描述”解析后的特征與原始特征數(shù)據(jù)進(jìn)行融合和修正,得到新的崗位特征表,具體操作有以下步驟:①獲取上述2.1構(gòu)建的原始崗位特征信息。②解析“崗位描述”特征字段的長(zhǎng)文本信息,獲取崗位解析特征(“年齡”、“學(xué)歷”、“性別”、“政治面貌”、“工作年限”、“院校類型”)。③將解析后的特征與原始崗位特征進(jìn)行融合,首先依次判斷解析后的特征是否存在于原始崗位特征中,若不存在,則直接將解析特征添加到崗位特征表中;若存在,則將解析特征與原始特征進(jìn)行統(tǒng)一數(shù)據(jù)映射,在此基礎(chǔ)上判斷特征屬性信息是否存在沖突,如不存在沖突,則對(duì)此特征信息不做更改。若存在沖突則將解析特征替換掉原始特征;④基于步驟③獲得新的崗位特征數(shù)據(jù)集,在此基礎(chǔ)上對(duì)特征重要性進(jìn)行排序,設(shè)定崗位特征數(shù)據(jù)修正策略。⑤基于修正策略進(jìn)行跨特征聯(lián)合交叉分析的合理性判斷,若不合理,則根據(jù)特征修正策略對(duì)數(shù)據(jù)中存在的異常屬性信息進(jìn)行逆向反推對(duì)特征數(shù)據(jù)進(jìn)行縮放和修正,否則不做修正。⑥完成特征數(shù)據(jù)的修正,獲得最終崗位特征數(shù)據(jù)表。具體操作流程如圖2所示。

      2.3 數(shù)據(jù)處理及表示

      基于2.1和2.2構(gòu)造的特征表和特征數(shù)據(jù)修正結(jié)果,對(duì)人崗匹配度測(cè)算指標(biāo)體系中的二級(jí)指標(biāo)性別匹配度、政治面貌匹配度、城市匹配度、學(xué)歷匹配度等結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理與表示,具體方法為:①建立結(jié)構(gòu)化文本數(shù)值映射表,如男性為1,女性為0;②通過構(gòu)建的文本數(shù)值映射表將所有結(jié)構(gòu)化數(shù)據(jù)表示為數(shù)值型數(shù)據(jù);③基于數(shù)據(jù)表示結(jié)果進(jìn)行人崗特征屬性匹配獲得各指標(biāo)匹配值。

      人崗匹配度測(cè)算指標(biāo)體系中的二級(jí)指標(biāo)年齡匹配度、工作年限匹配度、項(xiàng)目經(jīng)驗(yàn)匹配度、行業(yè)匹配度、職類匹配度、工作經(jīng)驗(yàn)等由特征表中非結(jié)構(gòu)化數(shù)據(jù)解析匹配得到,如“年齡不超過35周歲”、“具有3~5年的工作經(jīng)驗(yàn)”,由于此類數(shù)據(jù)無法直接用關(guān)鍵字匹配方式進(jìn)行處理,因此需要通過自然語言挖掘技術(shù)對(duì)其字段屬性進(jìn)行數(shù)據(jù)處理與表示,具體方法為:①首先,采用關(guān)鍵詞匹配算法進(jìn)行關(guān)鍵信息定位;②其次,從定位點(diǎn)分別向左右兩側(cè)進(jìn)行窗口滑動(dòng)提取文本信息作為待分析內(nèi)容;③對(duì)待分析內(nèi)容進(jìn)行解析,采用臨界值判斷法則建立臨界值映射策略對(duì)指標(biāo)數(shù)據(jù)進(jìn)行多區(qū)間覆蓋劃分,設(shè)定上下界閾值,將其映射為對(duì)應(yīng)的區(qū)間數(shù)據(jù),如“具有3~5年工作經(jīng)驗(yàn)”映射為[3,5],“年齡不超過35周歲”映射為(0,35];④參照步驟③完成長(zhǎng)文本特征數(shù)據(jù)表示。

      2.4 指標(biāo)體系特征匹配度計(jì)算

      基于上述人崗匹配度測(cè)算指標(biāo)體系和特征數(shù)據(jù)處理與表示方法,采用臨界值修正匹配法、余弦相似度、編輯距離相似度計(jì)算聯(lián)合計(jì)算公式完成上述指標(biāo)匹配度測(cè)算,獲得用于模型訓(xùn)練測(cè)試的特征數(shù)據(jù)集。

      3 人崗匹配測(cè)算模型的構(gòu)建及應(yīng)用

      3.1 構(gòu)建特征數(shù)據(jù)集

      基于人崗匹配度測(cè)算指標(biāo)體系,使用或參考章節(jié)2中的特征數(shù)據(jù)修正及數(shù)據(jù)表示的計(jì)算方法進(jìn)行人崗匹配度特征數(shù)據(jù)集的構(gòu)建,其中分類標(biāo)簽來源于人崗評(píng)定的人崗匹配結(jié)果數(shù)據(jù),1表示匹配,0表示不匹配,得到的部分特征數(shù)據(jù)如表1所示。

      3.2 模型構(gòu)建

      XGBoost的算法思想是通過不斷進(jìn)行特征分裂生成一棵樹,用于擬合上一輪預(yù)測(cè)的殘差。當(dāng)完成模型的訓(xùn)練之后會(huì)得到一系列的樹并根據(jù)樣本特征分布組合,最后將每棵樹計(jì)算得到的分?jǐn)?shù)累加即為樣本的預(yù)測(cè)值。

      為驗(yàn)證本文構(gòu)建的人崗匹配度測(cè)算指標(biāo)體系和提出的特征數(shù)據(jù)修正和數(shù)據(jù)表示技術(shù)及特征數(shù)據(jù)構(gòu)建的有效性,本文在Python3.6環(huán)境下,以特征數(shù)據(jù)集中分類標(biāo)簽作為訓(xùn)練樣本中的標(biāo)簽,采用交叉驗(yàn)證和XGBoost算法構(gòu)造訓(xùn)練人崗匹配度分類模型,將模型輸出的概率值作為人崗匹配度測(cè)算值,最終實(shí)現(xiàn)人崗匹配度的測(cè)算?;赬GBoost的人崗匹配度測(cè)算模型擁有學(xué)習(xí)的能力,可以有效地克服傳統(tǒng)人崗匹配度測(cè)算對(duì)主觀評(píng)價(jià)或?qū)<遗袛嗟戎饔^因素的依賴。735EF330-3615-4D53-B292-BA567E9EE863

      3.3 模型應(yīng)用

      將特征數(shù)據(jù)集輸入XGBoost人崗匹配度分類模型并完成模型的訓(xùn)練和優(yōu)化,將模型輸出的概率值作為人崗匹配度的測(cè)算結(jié)果,實(shí)現(xiàn)人崗匹配度的測(cè)算。表2為本文提出的人崗匹配度測(cè)算方法在部分真實(shí)數(shù)據(jù)上的測(cè)算結(jié)果。

      表2中人崗匹配度為XGBoost人崗匹配度分類模型計(jì)算出的概率值,范圍為[0,1],計(jì)算的概率值越接近于0表示人崗匹配度越低,反之,計(jì)算的概率值越接近于1表示人崗匹配度越高。以0.5為分類閾值,匹配度大于等于0.5標(biāo)簽分類結(jié)果為1,小于0.5標(biāo)簽分類結(jié)果為0,通過將人崗匹配度換算為標(biāo)簽分類結(jié)果可知:上述實(shí)驗(yàn)結(jié)果中的標(biāo)簽分類結(jié)果與特征數(shù)據(jù)中的標(biāo)簽基本一致,從而驗(yàn)證了本文構(gòu)造的指標(biāo)體系及數(shù)據(jù)表示和特征數(shù)據(jù)修正技術(shù)方法在人崗匹配度測(cè)算中的有效性。

      4 結(jié)論

      針對(duì)傳統(tǒng)人崗匹配測(cè)算方法中存在的問題,文本對(duì)人崗匹配度測(cè)算指標(biāo)及測(cè)算方法進(jìn)行探討,構(gòu)建了人崗匹配度測(cè)算指標(biāo)體系,提出了一種基于數(shù)據(jù)表示和特征數(shù)據(jù)修正的人崗匹配度測(cè)算方法,該方法一定程度上減少了傳統(tǒng)人崗匹配方法中指標(biāo)對(duì)主觀評(píng)價(jià)或?qū)<遗袛嗟热藶橹饔^因素的依賴,提升了人崗匹配度的測(cè)算準(zhǔn)確性和智能化程度,具有較強(qiáng)的普適性。

      參考文獻(xiàn)(References):

      [1] 李曉寧,王素偉,王成剛.員工職業(yè)勝任力與企業(yè)需求匹配度研究[J].中小企業(yè)管理與科技,2020(9):120-121

      [2] 袁珍珍,盧少華.BP神經(jīng)網(wǎng)絡(luò)在人崗匹配度測(cè)算中的應(yīng)用[J].武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版),2010,32(3):515-518

      [3] 易斌,姜飛.支持向量機(jī)在人崗匹配度測(cè)算中的應(yīng)用[J].中南林業(yè)科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2011,5(6):92-94

      [4] 李娟,高百寧.基于灰色系統(tǒng)理論的人力資源崗位匹配度研究[J].中國商界(下半月),2008(3):103-104

      [5] 李松,袁安琪.考慮直覺模糊的多指標(biāo)人崗雙邊匹配決策方法[J].計(jì)算機(jī)工程與應(yīng)用:1-8[2021-05-13].http://kns.cnki.net/kcms/detail/11.2127.TP.20210420.1121.040.html.

      [6] PAZZANI M J, BILLSUS D. Content-based recommen-dation systems[J].The Adaptive Web,2007: 325-341

      [7] GOPALAN P K, CHARLIN L, BLEI D. Content-basedrecommendations with poisson factorization[J].Advances in Neural Information Processing Systems,2014,27:3176-3184735EF330-3615-4D53-B292-BA567E9EE863

      猜你喜歡
      指標(biāo)體系
      2024新一線城市魅力指標(biāo)體系
      網(wǎng)絡(luò)空間攻防對(duì)聯(lián)合作戰(zhàn)體系支援度評(píng)估指標(biāo)體系構(gòu)建
      國土資源績(jī)效管理指標(biāo)體系的動(dòng)態(tài)性探討
      淺談公路統(tǒng)計(jì)指標(biāo)體系的構(gòu)建
      層次分析法在生態(tài)系統(tǒng)健康評(píng)價(jià)指標(biāo)體系中的應(yīng)用
      供給側(cè)改革指標(biāo)體系初探
      評(píng)標(biāo)工作中有關(guān)量化指標(biāo)體系建立的探討
      軍事體育訓(xùn)練評(píng)價(jià)指標(biāo)體系的設(shè)計(jì)與實(shí)施
      城鄉(xiāng)建設(shè)用地增減掛鉤評(píng)價(jià)指標(biāo)體系的構(gòu)建
      城鎮(zhèn)排水系統(tǒng)量化指標(biāo)體系研究
      邵东县| 北海市| 鲁山县| 南昌县| 高唐县| 南雄市| 吴桥县| 前郭尔| 永寿县| 丹寨县| 乌什县| 黄山市| 铜鼓县| 噶尔县| 平陆县| 越西县| 柳州市| 佛山市| 海门市| 石嘴山市| 岫岩| 宁陕县| 河北区| 侯马市| 江山市| 云南省| 锦州市| 封丘县| 呼和浩特市| 延吉市| 东海县| 连城县| 武夷山市| 汽车| 咸丰县| 菏泽市| 杭锦后旗| 武山县| 资溪县| 柳江县| 赤水市|