• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      大數(shù)據(jù)背景下的校園求職用戶畫像研究

      2022-06-10 04:14:11陳偉東
      中國(guó)新通信 2022年9期
      關(guān)鍵詞:用戶畫像大數(shù)據(jù)

      摘要:隨著大數(shù)據(jù)技術(shù)的發(fā)展和成熟,校園建設(shè)和管理方面可以使用大數(shù)據(jù)得到快速提升。本文通過對(duì)校園求職用戶研究,提出了大數(shù)據(jù)背景下校園求職用戶畫像研究的總體框架和實(shí)施方案。根據(jù)校園求職情況構(gòu)建對(duì)應(yīng)的求職用戶畫像,有效管理校園求職用戶,推動(dòng)學(xué)生就業(yè)工作開展。

      關(guān)鍵詞:大數(shù)據(jù);校園求職用戶;用戶畫像

      進(jìn)入21世紀(jì)后,我國(guó)高等教育事業(yè)快速發(fā)展,高校畢業(yè)生數(shù)量也隨之高速增長(zhǎng)。中商產(chǎn)業(yè)研究院數(shù)據(jù)顯示:2011-2020年畢業(yè)生人數(shù)按2%~5%的同比增長(zhǎng)率逐年增長(zhǎng),近10年畢業(yè)生人數(shù)累計(jì)達(dá)7603萬(wàn)[1]。數(shù)據(jù)證明當(dāng)前高校畢業(yè)生的數(shù)量增長(zhǎng)顯著,這一情況說(shuō)明社會(huì)對(duì)文化知識(shí)的需求數(shù)量增加,同時(shí)也是當(dāng)今社會(huì)發(fā)展的趨勢(shì),但是,高速的畢業(yè)生數(shù)量增長(zhǎng)也給社會(huì)各方面配套能力造成一定的壓力,逐年出現(xiàn)的“更難就業(yè)季”就是其中一大問題。

      一、校園招聘的現(xiàn)狀

      校園招聘是畢業(yè)生從學(xué)校步入社會(huì)的一個(gè)渠道,各類工作單位通過校園招聘的形式引進(jìn)新員工,校園招聘在連接過程中發(fā)揮著重要作用。校園招聘不同于其他形式的招聘,其具有獨(dú)特的優(yōu)勢(shì),一方面,招聘成本不高,涉及的專業(yè)數(shù)量多,應(yīng)聘率和簽約率都比較高,單位能夠通過校園招聘獲得一定的儲(chǔ)備人才,有利于提高品牌形象;另一方面,通過校園招聘錄用的員工,素質(zhì)水平高,能夠具備一定的可塑性,有年輕活力,對(duì)公司的認(rèn)同感強(qiáng)。因此,校園招聘在一定程度上吸引了大量用人單位,受到畢業(yè)生喜愛,具有顯著優(yōu)勢(shì)。

      但校園招聘也存在著一些痛點(diǎn)問題,學(xué)生對(duì)求職認(rèn)知有限,很多學(xué)生僅限于“找工作”幾個(gè)字,沒有認(rèn)真地去分析求職這件事;對(duì)于自己真正要找什么工作,什么工作最合適,分析不足;同時(shí)校園招聘紛雜繁多的招聘信息,學(xué)生往往會(huì)摸不著頭腦,無(wú)手下手,難以從招聘信息海洋中找全真正適合自己的職位;校園招聘信息亟需個(gè)性化推送服務(wù),但個(gè)性化推送缺乏基礎(chǔ)模型[2]。

      二、用戶畫像的定義與發(fā)展

      用戶畫像是根據(jù)用戶社會(huì)屬性、生活習(xí)慣和消費(fèi)行為等信息而抽象出的一個(gè)標(biāo)簽化的用戶模型[3]。其核心是用戶標(biāo)簽,在大數(shù)據(jù)技術(shù)支持下通過分析用戶信息提煉特征標(biāo)識(shí)豐富用戶標(biāo)簽,讓用戶畫像變得立體真實(shí)。

      用戶畫像是由Alan Cooper提出,是建立在一系列屬性數(shù)據(jù)之上的目標(biāo)用戶模型[4]。用戶畫像中分析的用戶信息主要是互聯(lián)網(wǎng)下的用戶信息,是隨著互聯(lián)網(wǎng)產(chǎn)生的,與網(wǎng)絡(luò)用戶行為密切相關(guān),根據(jù)用戶的行為提取用戶的特征,將用戶信息標(biāo)簽化。標(biāo)簽是人為定義的高度精練的特征標(biāo)識(shí)[5]。 其中可以對(duì)用戶的基本屬性進(jìn)行標(biāo)簽化,用戶基本屬性是指一些用戶的靜態(tài)屬性,例如性別、年齡、手機(jī)號(hào)碼、文化程度、職業(yè)等;可以對(duì)用戶的動(dòng)態(tài)屬性進(jìn)行標(biāo)簽化,這些屬性不是直接能得到,需要獲取信息后統(tǒng)計(jì)、計(jì)算、分析后才能得到特征值,例如消費(fèi)時(shí)間、購(gòu)買力、音樂內(nèi)容偏好、上網(wǎng)活躍度等。

      用戶畫像隨著大數(shù)據(jù)等技術(shù)的成熟發(fā)展很快,使原本大量沉睡的數(shù)據(jù)開始發(fā)揮商用價(jià)值。例如在電商領(lǐng)域,從以TB計(jì)的數(shù)據(jù)記錄中獲取消費(fèi)行為、社交網(wǎng)絡(luò)、生活習(xí)慣等方面的標(biāo)簽?zāi)P?,指?dǎo)商家個(gè)性化精確運(yùn)營(yíng)。

      用戶畫像就是通過收集用戶生活習(xí)慣、社會(huì)信息、心理特征等信息,然后建立數(shù)學(xué)模型,將用戶信息標(biāo)簽化,抽象出一個(gè)帶有標(biāo)簽的虛擬用戶[6]。

      鑒于以上背景,本文在針對(duì)用戶畫像的一系列研究基礎(chǔ)上,提出將用戶畫像應(yīng)用到校園招聘場(chǎng)景,進(jìn)而構(gòu)建大數(shù)據(jù)背景下的校園求職用戶畫像的設(shè)想,通過采集相關(guān)數(shù)據(jù)、設(shè)計(jì)畫像維度與標(biāo)簽體系、提取畫像標(biāo)簽等工作實(shí)現(xiàn)對(duì)校園求職用戶的全面可信的刻畫描述,為大數(shù)據(jù)時(shí)代的校園招聘開展創(chuàng)造了一種新思路。

      三、大數(shù)據(jù)背景下的校園求職用戶畫像研究總體框架

      大數(shù)據(jù)背景下的校園求職用戶畫像研究總體框架分為三個(gè)部分。校園求職用戶畫像驅(qū)動(dòng)力、校園求職用戶畫像構(gòu)建和校園求職用戶畫像應(yīng)用價(jià)值。

      (一)對(duì)現(xiàn)有校園招聘存在的痛點(diǎn)問題進(jìn)行研究,痛點(diǎn)問題主要集中在學(xué)生對(duì)求職認(rèn)知有限、學(xué)生求職需求分析不足、招聘信息紛雜繁多無(wú)從下手、個(gè)性化服務(wù)缺乏基礎(chǔ)模型,確定了校園求職用戶畫像建設(shè)的必要性。

      (二)利用適合校園招聘的畫像視角和方法,采集相關(guān)數(shù)據(jù),對(duì)校園求職用戶進(jìn)行數(shù)據(jù)建模分析并生成校園求職用戶標(biāo)簽,構(gòu)建校園求職用戶畫像。

      (三)利用校園求職用戶畫像助力校園招聘的高效進(jìn)行和良性發(fā)展,實(shí)現(xiàn)校園求職用戶畫像的應(yīng)用價(jià)值。

      四、大數(shù)據(jù)背景下的校園求職用戶畫像實(shí)施方案

      實(shí)施方案主要分為四部分:校園求職用戶畫像模型構(gòu)建、數(shù)據(jù)源獲取與數(shù)據(jù)采集、校園求職用戶標(biāo)簽加工、校園求職用戶模型實(shí)際應(yīng)用。

      (一)校園求職用戶畫像模型構(gòu)建

      校園求職用戶畫像模型由基本屬性標(biāo)簽、能力屬性標(biāo)簽、求職環(huán)境標(biāo)簽、求職類型標(biāo)簽、求職行業(yè)標(biāo)簽、求職單位標(biāo)簽、求職行為標(biāo)簽共七類用戶標(biāo)簽組成,具體子標(biāo)簽如圖1所示。

      (二)數(shù)據(jù)源獲取與數(shù)據(jù)采集

      用戶標(biāo)簽的獲取與計(jì)算,離不開各類數(shù)據(jù)源。數(shù)據(jù)來(lái)源按渠道分,主要包括系統(tǒng)本源數(shù)據(jù)、外部采集數(shù)據(jù)、第三方數(shù)據(jù)[7];按終端分,主要是線上數(shù)據(jù),線上數(shù)據(jù)包括移動(dòng)端數(shù)據(jù)、電腦端數(shù)據(jù),也有少量線下數(shù)據(jù);按類別分,主要包括人口屬性數(shù)據(jù)、行為數(shù)據(jù)、設(shè)備信息數(shù)據(jù)、用戶興趣數(shù)據(jù)等[8]。

      本項(xiàng)目需要用到的數(shù)據(jù)源包括學(xué)校本源數(shù)據(jù)和外部網(wǎng)絡(luò)爬蟲采集的數(shù)據(jù),本源數(shù)據(jù)包括用戶基本信息、網(wǎng)絡(luò)訪問日志、用戶行為、用戶問卷等。其中構(gòu)建校園求職用戶畫像的其他數(shù)據(jù),包括招聘單位的數(shù)據(jù)等,由網(wǎng)絡(luò)爬蟲方式采集。流程如下:

      1.首先根據(jù)用戶標(biāo)簽屬性定位調(diào)研校園求職情境下的目標(biāo)網(wǎng)站,分析目標(biāo)網(wǎng)站下目標(biāo)網(wǎng)頁(yè)特征,重點(diǎn)觀察網(wǎng)頁(yè)url變化規(guī)律,形成url列表,重點(diǎn)分析網(wǎng)頁(yè)DOM結(jié)構(gòu)、網(wǎng)頁(yè)層次和目標(biāo)數(shù)據(jù)規(guī)律,使得目標(biāo)數(shù)據(jù)盡可能完整。

      2.網(wǎng)絡(luò)爬蟲系統(tǒng)設(shè)計(jì)。選擇合適的爬蟲系統(tǒng)框架,可選取Scrapy爬蟲框架、Crawley爬蟲框架、PySpider爬蟲框架等框架,然后新增爬蟲系統(tǒng)輔助功能,輔助功能包括:URL管理,主要是URL的增刪改查操作;時(shí)間與頻率管理,主要是爬取時(shí)間定時(shí),爬取次數(shù)定頻率。

      網(wǎng)絡(luò)爬蟲系統(tǒng)完成后,選取一個(gè)或多個(gè)網(wǎng)頁(yè)作為網(wǎng)絡(luò)爬蟲程序的種子鏈接,從種子鏈接開始,將待爬蟲的URL鏈接列表移至待抓取隊(duì)列,依次讀取待抓取隊(duì)列URL,對(duì)該URL定位的網(wǎng)頁(yè)進(jìn)行針對(duì)性的數(shù)據(jù)抓取并將目標(biāo)數(shù)據(jù)并存入數(shù)據(jù)庫(kù),之后把已經(jīng)爬蟲過的URL移至已抓取隊(duì)列,在已抓取的網(wǎng)頁(yè)中如果還能獲取新的未爬取的URL則繼續(xù)移至待抓取隊(duì)列。支持定期爬取,可以設(shè)置定時(shí)器,自動(dòng)觸發(fā)爬取。

      3.數(shù)據(jù)分析處理和結(jié)構(gòu)化存儲(chǔ)。對(duì)于爬取的數(shù)據(jù)進(jìn)行解析、處理,去除無(wú)效數(shù)據(jù),形成結(jié)構(gòu)化數(shù)據(jù),存入結(jié)果數(shù)據(jù)庫(kù)。

      (三)校園求職用戶標(biāo)簽加工

      1.用戶標(biāo)簽加工步驟

      針對(duì)不同源的數(shù)據(jù),如何獲取校園求職用戶畫像所需的用戶標(biāo)簽數(shù)據(jù),一般需要經(jīng)歷4個(gè)步驟,包括數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)打通與標(biāo)準(zhǔn)化、標(biāo)簽挖掘與驗(yàn)證[9]。

      (1)數(shù)據(jù)采集。如上文所提,校園求職用戶標(biāo)簽所需的數(shù)據(jù)采集來(lái)源為學(xué)校本源數(shù)據(jù)和外部對(duì)應(yīng)網(wǎng)站。采集用戶的靜態(tài)屬性,包括用戶的基本屬性、求職環(huán)境、求職行業(yè)等;采集用戶的動(dòng)態(tài)屬性,包括用戶求職行為日志等[10]。

      (2)數(shù)據(jù)清洗。第一步中采集的數(shù)據(jù)存在完整性、唯一性、權(quán)威性、合法性、一致性等質(zhì)量問題[11],需要進(jìn)行數(shù)據(jù)清洗。數(shù)據(jù)清洗的目的是為了解決這些質(zhì)量問題,針對(duì)不同的問題采取不同的處理方式,例如針對(duì)數(shù)據(jù)完整性問題采用信息補(bǔ)全方法,針對(duì)唯一性問題采用去重方式,最終得到標(biāo)準(zhǔn)、正確的數(shù)據(jù),使得數(shù)據(jù)適合做分析、計(jì)算和挖掘。

      (3)數(shù)據(jù)打通與標(biāo)準(zhǔn)化。校園求職用戶數(shù)據(jù)來(lái)自不同的系統(tǒng),數(shù)據(jù)比較分散,關(guān)聯(lián)度低,而且不同系統(tǒng)間數(shù)據(jù)標(biāo)準(zhǔn)有可能不一樣,而對(duì)于用戶畫像來(lái)說(shuō),數(shù)據(jù)打通與標(biāo)準(zhǔn)化非常關(guān)鍵,需要尋找具有關(guān)聯(lián)性的用戶標(biāo)識(shí),這一類標(biāo)識(shí)有身份證號(hào)、手機(jī)號(hào)、設(shè)備id等,利用用戶標(biāo)識(shí)進(jìn)行信息關(guān)聯(lián),整合多源數(shù)據(jù),建立統(tǒng)一標(biāo)準(zhǔn)完整標(biāo)識(shí)實(shí)體。

      (4)標(biāo)簽挖掘與驗(yàn)證。分析加工校園求職用戶信息,獲取目標(biāo)要素,通過數(shù)據(jù)挖掘算法,計(jì)算用戶標(biāo)簽值,如果數(shù)據(jù)量非常大,可以利用大數(shù)據(jù)平臺(tái)并行計(jì)算。挖掘加工后的用戶標(biāo)簽,使用真實(shí)案例進(jìn)行驗(yàn)證,以保障用戶標(biāo)簽值挖掘的有效性、準(zhǔn)確性。

      2.動(dòng)態(tài)標(biāo)簽的加工

      動(dòng)態(tài)標(biāo)簽的標(biāo)簽值隨著時(shí)間推移可能會(huì)發(fā)生變化,因此需要建立實(shí)時(shí)更新或者定期更新機(jī)制。以“企業(yè)價(jià)值”用戶標(biāo)簽為例。如何計(jì)算企業(yè)價(jià)值,根據(jù)Wikipedia 上的企業(yè)價(jià)值公式進(jìn)行簡(jiǎn)化:

      企業(yè)價(jià)值 = 市值 + 負(fù)債 - 現(xiàn)金

      市值、負(fù)債、現(xiàn)金三個(gè)數(shù)據(jù)需要使用網(wǎng)絡(luò)爬蟲技術(shù)獲取。首先爬取天眼查、東方財(cái)富網(wǎng)等網(wǎng)站上企業(yè)數(shù)據(jù),利用代碼解析獲取目標(biāo)原始數(shù)據(jù),然后清洗分離市值、負(fù)債、現(xiàn)金三個(gè)數(shù)據(jù),最終計(jì)算企業(yè)價(jià)值。

      因?yàn)槭兄怠⒇?fù)債、現(xiàn)金會(huì)定期發(fā)生變化,所以“企業(yè)價(jià)值”也是動(dòng)態(tài)發(fā)生變化的,需要定期爬取,定期更新數(shù)據(jù)與計(jì)算值,本文中企業(yè)價(jià)值根據(jù)財(cái)報(bào)周期時(shí)間,按季度進(jìn)行更新。

      (四)校園求職用戶模型實(shí)際應(yīng)用

      校園求職用戶畫像具備七大領(lǐng)域用戶標(biāo)簽信息,可以應(yīng)用在推薦、分析等多個(gè)領(lǐng)域。

      應(yīng)用1:校園招聘信息個(gè)性化推薦。當(dāng)招聘單位輸入相關(guān)信息后,系統(tǒng)根據(jù)企業(yè)的招人要求,比如:學(xué)歷、專業(yè)、求職地、技能、崗位名稱等要求,將智能去匹配求職用戶畫像,在眾多紛雜的招聘信息中為求職者推薦最合適的招聘信息。

      應(yīng)用2 :求職者求職分析報(bào)告。根據(jù)求職用戶畫像,通過分析算法,輸出用戶全方位分析報(bào)告,內(nèi)容涉及用戶求職心態(tài)分析、適宜職位、求職策略等。

      五、結(jié)束語(yǔ)

      本文從四個(gè)方面闡述了大數(shù)據(jù)背景下的校園求職用戶畫像研究,提出了校園求職用戶畫像驅(qū)動(dòng)力、校園求職用戶畫像構(gòu)建和校園求職用戶畫像應(yīng)用價(jià)值的總體框架,制定了校園求職用戶畫像模型構(gòu)建、數(shù)據(jù)源獲取與數(shù)據(jù)采集、校園求職用戶標(biāo)簽加工、校園求職用戶模型實(shí)際應(yīng)用實(shí)施方案,有力支持校園就業(yè)用戶管理和就業(yè)工作開展。

      作者單位:陳偉東? ? 杭州職業(yè)技術(shù)學(xué)院信息工程學(xué)院

      參? 考? 文? 獻(xiàn)

      [1]李艷軍.論地方高校大學(xué)生就業(yè)維權(quán)意識(shí)的培養(yǎng)[J].商情,2019(48):204.

      [2]王鵬遠(yuǎn). 基于大數(shù)據(jù)的高校圖書館個(gè)性化推送服務(wù)研究[J]. 內(nèi)蒙古科技與經(jīng)濟(jì), 2016(19): 159-161.

      [3]沈金波. 用戶畫像在互聯(lián)網(wǎng)金融中的應(yīng)用[J]. 現(xiàn)代商業(yè), 2017(33): 55-56.

      [4]林燕霞. 網(wǎng)絡(luò)輿情中網(wǎng)民屬性及行為分析[D]. 廣東工業(yè)大學(xué), 2019.

      [5]趙剛, 姚興仁. 基于用戶畫像的異常行為檢測(cè)模型[J]. 信息網(wǎng)絡(luò)安全, 2017(7): 18-24.

      [6]仲瑋, 李志琛. 基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)教育系統(tǒng)研究[J]. 通信學(xué)報(bào), 2018, 39(A01): 135-140.

      [7]薄明霞.基于大數(shù)據(jù)的安全威脅情報(bào)分析與共享平臺(tái)技術(shù)架構(gòu)研究[J].電信技術(shù),2019(11):5-9.

      [8]丁偉.基于大數(shù)據(jù)技術(shù)的手機(jī)用戶畫像與征信研究[J].郵電設(shè)計(jì)技術(shù),2016(3):64-69.

      [9]甘偉.大數(shù)據(jù)臨床科研平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[J].中國(guó)數(shù)字醫(yī)學(xué),2019(2):40-43.

      [10]王傳清.面向用戶的科技期刊智能內(nèi)容生產(chǎn)模型構(gòu)建[J].中國(guó)科技期刊研究,2020(5):541-549.

      [11]郭宏毅. 大數(shù)據(jù)在金融風(fēng)控和精準(zhǔn)營(yíng)銷中的應(yīng)用及大數(shù)據(jù)項(xiàng)目風(fēng)險(xiǎn)研究[D]. 山東大學(xué), 2017.

      猜你喜歡
      用戶畫像大數(shù)據(jù)
      貝葉斯網(wǎng)絡(luò)在用戶畫像構(gòu)建中的研究
      把聲音的魅力發(fā)揮到極致
      移動(dòng)用戶畫像構(gòu)建研究
      基于微博的大數(shù)據(jù)用戶畫像與精準(zhǔn)營(yíng)銷
      大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
      新聞世界(2016年10期)2016-10-11 20:13:53
      基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
      科技視界(2016年20期)2016-09-29 10:53:22
      數(shù)據(jù)+輿情:南方報(bào)業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
      移動(dòng)互聯(lián)網(wǎng)下手機(jī)用戶使用行為特征的研究
      一種基于內(nèi)容的新聞推薦系統(tǒng)實(shí)例
      图们市| 石狮市| 九龙县| 铜陵市| 通州市| 塔河县| 文水县| 灵寿县| 临洮县| 连平县| 什邡市| 西畴县| 九寨沟县| 松滋市| 南靖县| 赤峰市| 广州市| 外汇| 苏尼特左旗| 枣庄市| 金昌市| 大方县| 揭西县| 古蔺县| 甘洛县| 福建省| 申扎县| 遂溪县| 肃北| 南康市| 景洪市| 安徽省| 桂林市| 丽水市| 谷城县| 西盟| 鄂尔多斯市| 内江市| 米脂县| 琼中| 南涧|