• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于文本挖掘的網(wǎng)絡(luò)問答社區(qū)求職者關(guān)注行為研究

      2021-10-29 01:02:38王梅源劉天穎沃秋爽
      科技創(chuàng)業(yè)月刊 2021年9期
      關(guān)鍵詞:求職者頁面社區(qū)

      王梅源 劉天穎 沃秋爽

      (中南民族大學(xué) 管理學(xué)院,湖北 武漢 430074)

      0 引言

      隨著人才質(zhì)量的提升和信息網(wǎng)絡(luò)技術(shù)的發(fā)展,網(wǎng)絡(luò)招聘已經(jīng)成為國內(nèi)眾多企業(yè)首選的人才募集方式,越來越多的求職者在網(wǎng)絡(luò)問答社區(qū)中產(chǎn)生和分享求職信息[1]。相對(duì)傳統(tǒng)招聘渠道,網(wǎng)絡(luò)招聘不僅擁有更便捷的操作方式,而且信息的時(shí)效性和廣泛性也可以得到保證,有效提高了招聘效率[2]。但對(duì)于招聘企業(yè)和求職者來說,在龐大的信息流中找尋并辨識(shí)相關(guān)招聘和求職信息并非易事。近幾年,網(wǎng)絡(luò)問答社區(qū)作為特殊的社交平臺(tái)走進(jìn)大眾的視線,在平臺(tái)上,用戶既是信息的傳遞者,也是信息的使用者,在創(chuàng)造問題的同時(shí)解決問題[3]。突破傳統(tǒng)搜索引擎和工具的局限,幫助求職者高效獲取所需知識(shí)和信息。

      用戶持續(xù)使用問答社區(qū)往往是由于他們對(duì)高質(zhì)量、高相關(guān)性和易獲得性信息與知識(shí)的需求,不斷拓展自身的知識(shí)深度與廣度。Phang[4]通過虛擬社區(qū)的用戶參與度分析發(fā)現(xiàn),易使用性和可信賴性是用戶進(jìn)行搜尋答案行為的重要影響指標(biāo),而對(duì)于回答者而言,促使他們持續(xù)進(jìn)行平臺(tái)知識(shí)貢獻(xiàn)的主要原因是更高的社會(huì)參與度。

      近年來隨著文本挖掘技術(shù)的廣泛應(yīng)用,很多研究者將以文本挖掘技術(shù)為代表的智能化處理手段應(yīng)用于網(wǎng)絡(luò)社區(qū)的文本處理中。夏立新等學(xué)者[6]通過對(duì)網(wǎng)絡(luò)社區(qū)中與就業(yè)問題有關(guān)的文本進(jìn)行挖掘,構(gòu)建就業(yè)知識(shí)需求關(guān)系,為高校就業(yè)率的提升和發(fā)展提供建議。Macias等學(xué)者[7]在24個(gè)常用健康網(wǎng)絡(luò)論壇中選擇了791個(gè)與健康信息相關(guān)的帖子,發(fā)現(xiàn)需求建議、個(gè)人病情簡介及病情恢復(fù)是討論最多的話題。宋學(xué)峰等學(xué)者[8]使用內(nèi)容分析法和社會(huì)網(wǎng)絡(luò)分析法對(duì)知乎平臺(tái)中在線教育話題進(jìn)行編碼分析,發(fā)現(xiàn)答案多數(shù)都是針對(duì)問題進(jìn)行解釋和辨別,較少有評(píng)估、反思和共識(shí)。黃魯成等學(xué)者[9]在通過抓取知乎上關(guān)于老年人關(guān)鍵詞的相關(guān)問題并進(jìn)行詞頻統(tǒng)計(jì)分析后,找尋到現(xiàn)今老年人健康話題關(guān)注和發(fā)展的重點(diǎn)。

      目前國內(nèi)外學(xué)者對(duì)求職者行為的研究主要集中在求職動(dòng)機(jī)[10-11]、求職意向影響因素[2,12-13]等方面;問答社區(qū)的研究主要集中在運(yùn)營模式[14]、用戶體驗(yàn)[15]、社區(qū)內(nèi)容答案質(zhì)量[16-17]等方面;將文本挖掘技術(shù)運(yùn)用到問答社區(qū)的研究則多為問答評(píng)價(jià)[18]、答案模型預(yù)測[19-20]、話題內(nèi)容分析和識(shí)別[21]等;應(yīng)用領(lǐng)域多為醫(yī)療健康[9]和學(xué)科體系評(píng)價(jià)[22]方面。而對(duì)于求職者在問答社區(qū)中討論和關(guān)注話題的研究較少。且以往對(duì)求職者行為的研究多采用訪談或問卷調(diào)查的實(shí)證研究方法[23-24],這類方法受主觀影響較大,無法保證數(shù)據(jù)源文本的多樣性和隨機(jī)性,很難勝任大數(shù)據(jù)量、非結(jié)構(gòu)化環(huán)境下的文本內(nèi)容分析。將文本挖掘技術(shù)運(yùn)用到網(wǎng)絡(luò)問答社區(qū)中,使用求職者真實(shí)的話題內(nèi)容分析其關(guān)注行為的研究較少。

      本文將文本挖掘方法運(yùn)用到網(wǎng)絡(luò)問答社區(qū)求職者關(guān)注行為研究中,利用爬蟲技術(shù)從網(wǎng)絡(luò)問答社區(qū)互動(dòng)平臺(tái)抽取大量求職者提問和相關(guān)回答,借助分詞技術(shù)對(duì)數(shù)據(jù)進(jìn)行處理和分析,構(gòu)建求職者關(guān)注高頻詞云圖和關(guān)注話題互動(dòng)分布圖,分析求職者在當(dāng)今招聘環(huán)境中的關(guān)注行為,從而為招聘企業(yè)的發(fā)展和求職者能力提升提供參考。

      1 數(shù)據(jù)挖掘

      本文使用數(shù)據(jù)挖掘、文本分析、可視化分析等文本挖掘方法,試圖在更充足和真實(shí)的數(shù)據(jù)樣本中提煉求職者關(guān)注行為,并分析其特點(diǎn)與應(yīng)用價(jià)值。

      1.1 數(shù)據(jù)來源

      “知乎”如今是國內(nèi)參與數(shù)和流量最大的中文開放社區(qū),比起歷史更為悠久的“百度知道”,知乎的成功主要在于對(duì)問題的深度探討,鼓勵(lì)回答的延展性,其專業(yè)嚴(yán)謹(jǐn)?shù)纳鐓^(qū)內(nèi)容、理性融洽的交流氛圍和廣泛效率的傳播理念深受網(wǎng)民認(rèn)可[9]。截至2018年8月,知乎的個(gè)人注冊(cè)用戶量已超過2億,日活躍用戶達(dá)2600萬,其中,求職話題下的關(guān)注量達(dá)30萬左右。企業(yè)信息、企業(yè)社會(huì)輿論熱點(diǎn)與評(píng)價(jià)較充足,且越來越多的企業(yè)HR選擇在相關(guān)企業(yè)互動(dòng)區(qū)域下方留下最新招聘信息,為合適的求職者提供機(jī)會(huì)。其討論話題遍布就業(yè)規(guī)劃、發(fā)展前景、求職知識(shí)提升等各方面,參與者多為求職或潛在求職人員。

      “看準(zhǔn)網(wǎng)”相比知乎問答社區(qū),由于加入了企業(yè)點(diǎn)評(píng)和問答欄目,與求職者的關(guān)系和信息聯(lián)系更為密切。求職者可以針對(duì)所選公司提出問題,并可收到來自其他用戶的反饋信息?;卮鹫咧灰煜は嚓P(guān)公司的對(duì)應(yīng)提問,都可公開發(fā)表自己的見解,其身份包括對(duì)應(yīng)公司職員、參與求職人員及已離職的老員工。累計(jì)的問答信息可以為更多后續(xù)求職者提供寶貴的參考意見和建議。

      知乎和看準(zhǔn)網(wǎng)對(duì)求職話題相關(guān)的關(guān)注和討論及求職問答功能契合本文研究,本文選取知乎和看準(zhǔn)網(wǎng)求職問答社區(qū)的大量隨機(jī)問題作為研究數(shù)據(jù)源,通過Node.js網(wǎng)絡(luò)爬蟲隨機(jī)獲取用戶對(duì)于各公司的提問與回答數(shù)據(jù),包括提問內(nèi)容與數(shù)量、回答內(nèi)容與數(shù)量等原始文本數(shù)據(jù),既可排除同行業(yè)領(lǐng)域求職關(guān)注問題單一的可能,又可細(xì)化求職熱門領(lǐng)域關(guān)注問題的區(qū)別與聯(lián)系。

      1.2 數(shù)據(jù)采集

      目前數(shù)據(jù)采集主要有系統(tǒng)日志采集、數(shù)據(jù)庫采集和網(wǎng)絡(luò)數(shù)據(jù)采集三類。其中,網(wǎng)絡(luò)數(shù)據(jù)采集面向非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),通過網(wǎng)絡(luò)爬蟲和網(wǎng)站平臺(tái)提供的公共API(如Twitter和新浪微博API)將網(wǎng)站上獲取的網(wǎng)頁數(shù)據(jù)提取出來,將其清洗后轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù),并將其存儲(chǔ)為統(tǒng)一的本地文件數(shù)據(jù)。其特點(diǎn)是采集效率高并能保證數(shù)據(jù)的真實(shí)性[25]。

      本文專注于評(píng)論型內(nèi)容研究,適合選用網(wǎng)絡(luò)數(shù)據(jù)采集方法。

      目前網(wǎng)絡(luò)上多使用request + cheerio來進(jìn)行爬蟲開發(fā),request為http請(qǐng)求庫,用于發(fā)起一個(gè)http請(qǐng)求,在開發(fā)爬蟲的過程中,主要用于使用get方式,將目標(biāo)頁面的代碼進(jìn)行抓取,然后使用cheerio解析頁面元素,獲取目標(biāo)數(shù)據(jù)。知乎和看準(zhǔn)網(wǎng)平臺(tái)都有一個(gè)共同特點(diǎn),即頁面內(nèi)數(shù)據(jù)都使用ajax進(jìn)行請(qǐng)求并渲染到頁面上。ajax是一種網(wǎng)頁上常用的無刷新讀取技術(shù),主要用于前端向后端請(qǐng)求數(shù)據(jù)。具有這種特點(diǎn)的網(wǎng)頁,目標(biāo)數(shù)據(jù)默認(rèn)是沒有渲染在頁面中的,也就意味著request庫抓取到的代碼并不包含我們所需要的目標(biāo)元素。

      因此,本文使用puppeteer來實(shí)現(xiàn)爬蟲。puppeteer 是谷歌官方出品的一個(gè)通過DevTools協(xié)議控制Headless Chrome的node.js庫,庫的內(nèi)部封裝了一系列對(duì)Chrome的操作API,開發(fā)者可以通過這些API對(duì)Chrome進(jìn)行模擬用戶行為、自動(dòng)化測試、爬蟲等操作。為了使爬蟲中的異步操作更簡單直觀,采用11版本的node.js,支持async/await的方式處理異步,避免陷入回調(diào)地獄,且11版本可以使用更新的JavaScript規(guī)范的語法,對(duì)于開發(fā)效率有顯著提升。

      puppeteer可以通過瀏覽器的API,控制程序監(jiān)聽到ajax請(qǐng)求,等到數(shù)據(jù)成功渲染到頁面上,再對(duì)目標(biāo)數(shù)據(jù)進(jìn)行爬取,將獲取數(shù)據(jù)的步驟封裝成一個(gè)函數(shù)kanzhunGet,該函數(shù)的傳入?yún)?shù)page和url,其中,page為上一步操作實(shí)例化的page對(duì)象,url為要爬取數(shù)據(jù)的頁面的地址。

      (1)調(diào)用page實(shí)例的goto方法,操作page實(shí)例進(jìn)入要爬取數(shù)據(jù)的頁面;

      (2)調(diào)用page的evaluate方法,將操作環(huán)境進(jìn)入到瀏覽器內(nèi),將代碼的執(zhí)行上下文指向page對(duì)象所打開的頁面,從而保證對(duì)頁面內(nèi)元素的操作不會(huì)產(chǎn)生跨域行為,再定義一個(gè)getNum方法,用于匹配回答數(shù)中的數(shù)字,得出回復(fù)數(shù)結(jié)果;

      (3)根據(jù)上述對(duì)頁面結(jié)構(gòu)的分析,定義askWrap變量,用于保存所有問答的列表,通過遍歷該列表,對(duì)所有問答元素的內(nèi)容進(jìn)行解析,生成一個(gè)包含question和answer鍵的對(duì)象,并將該對(duì)象追加到定義好的res結(jié)果數(shù)組中,最終返回給函數(shù)的調(diào)用方。

      兩個(gè)網(wǎng)站在爬取機(jī)制上有所不同,“知乎”通過滾動(dòng)頁面到最底部以后,由前端向后端發(fā)起請(qǐng)求,并將后端返回的數(shù)據(jù)繼續(xù)追加到頁面的底部來實(shí)現(xiàn)大量數(shù)據(jù)展示,其對(duì)接口的請(qǐng)求做鑒權(quán)處理,每次請(qǐng)求會(huì)對(duì)訪問來源進(jìn)行校驗(yàn)?!翱礈?zhǔn)網(wǎng)”通過分頁的方式展現(xiàn)大量數(shù)據(jù),每頁共十條數(shù)據(jù),共十頁,通過頁面請(qǐng)求抓取,可以得到頁面請(qǐng)求數(shù)據(jù)時(shí)所調(diào)用的后端數(shù)據(jù)接口,對(duì)接口請(qǐng)求頭及請(qǐng)求體進(jìn)行解析發(fā)現(xiàn),接口并未做鑒權(quán)處理,即不需要登錄同樣可以獲取到數(shù)據(jù)。

      兩個(gè)網(wǎng)站在獲取數(shù)據(jù)上也有所不同,對(duì)于知乎數(shù)據(jù),使用puppeteer通過模擬真實(shí)用戶訪問的方式獲取數(shù)據(jù)。

      (1)選擇求職相關(guān)的話題,對(duì)頁面中的元素進(jìn)行分析,發(fā)現(xiàn)每條數(shù)據(jù)的問題可以通過ContentItem-title來獲取,而評(píng)論數(shù)的標(biāo)識(shí)與贊同數(shù)的標(biāo)識(shí)只能通過元素的兄弟元素來辨別。對(duì)獲取單條數(shù)據(jù)的方式進(jìn)行封裝后,需要對(duì)頁面進(jìn)行自動(dòng)滾動(dòng)處理,自動(dòng)滾動(dòng)的操作使用了puppeteer中的evaluate方法。

      (2)使用JavaScript進(jìn)行頁面滾動(dòng)條的操作,先獲取當(dāng)前頁面的總高度,后操作滾動(dòng)條滾動(dòng)到頁面的最底部,即可觸發(fā)頁面加載更多事件。經(jīng)過多次嘗試后發(fā)現(xiàn),當(dāng)頁面元素過多時(shí),會(huì)導(dǎo)致爬蟲程序進(jìn)入假死狀態(tài),導(dǎo)致抓取的數(shù)據(jù)丟失,且由于知乎加載新數(shù)據(jù)的方式比較特殊,每次請(qǐng)求的數(shù)據(jù)條數(shù)無法確定。

      (3)對(duì)爬蟲程序進(jìn)行修改,在每次進(jìn)行頁面滾動(dòng)之前,將上次加載時(shí)抓取到的數(shù)據(jù)存儲(chǔ)到本地文件中,這樣可以保證即使爬蟲程序假死后,也可以通過手動(dòng)終止的方式結(jié)束程序,而又不會(huì)導(dǎo)致崩潰前所抓取到的數(shù)據(jù)丟失。

      對(duì)于看準(zhǔn)網(wǎng)數(shù)據(jù),則選擇postman請(qǐng)求工具對(duì)接口進(jìn)行測試,發(fā)現(xiàn)無法獲取正確數(shù)據(jù),后端返回?cái)?shù)據(jù)為請(qǐng)求錯(cuò)誤,進(jìn)一步測試后發(fā)現(xiàn),后端對(duì)請(qǐng)求中的referer做了限制,在對(duì)referer進(jìn)行模擬后,成功獲取到數(shù)據(jù)。由于無需從頁面中抓取數(shù)據(jù)而直接從接口獲取數(shù)據(jù),雖然頁面中前端對(duì)總頁數(shù)做了10頁的限制,但是通過直接調(diào)用接口的方式,可以獲取共55頁數(shù)據(jù)。

      經(jīng)過數(shù)據(jù)爬取,最終獲取兩個(gè)平臺(tái)的問題數(shù)據(jù)源共1781條,回答共97732個(gè)。

      1.3 文本分詞

      從知乎和看準(zhǔn)網(wǎng)采集的求職問題信息是非結(jié)構(gòu)化的文本內(nèi)容,含有一定的雜質(zhì),需要進(jìn)行數(shù)據(jù)預(yù)處理后再進(jìn)行分詞。

      (1)數(shù)據(jù)初步篩選和清洗,借助哈爾濱工業(yè)大學(xué)信息檢索中心發(fā)布的停用詞表擴(kuò)展板與問答社區(qū)中提問語句的特點(diǎn),將為什么、怎么、有沒有、哪些、怎么辦、什么等詞加入到停用詞表,并在統(tǒng)計(jì)結(jié)果中去掉虛詞、介詞、連詞、助詞及標(biāo)點(diǎn)符號(hào)。

      (2)使用node.js中文分詞包jieba對(duì)獲取的1781條問題數(shù)據(jù)進(jìn)行分詞,jieba對(duì)自然語言分析及文本分析的支持較為友好,其采用的算法及策略使得分詞結(jié)果精準(zhǔn)可靠。目前常見的分詞方法主要分為基于字符串匹配的分詞方法和全切分的方法。前者按照不同的掃描方式,逐個(gè)查找詞庫進(jìn)行分詞。后者則首先切分出與詞庫匹配的所有可能的詞,再運(yùn)用統(tǒng)計(jì)語言模型決定最優(yōu)的切分結(jié)果。它的優(yōu)點(diǎn)在于可以解決分詞中的歧義問題。本文選擇使用全切分的方式進(jìn)行分詞,通過計(jì)算高頻詞的相關(guān)回答數(shù)和出現(xiàn)次數(shù)的權(quán)重,得到根據(jù)權(quán)重大小排列的分詞結(jié)果,部分結(jié)果如表1所示,權(quán)重是指與上下文主旨相關(guān)性較高的詞語,問答中出現(xiàn)次數(shù)多少并不能直接反映出權(quán)重的高低,通過算法計(jì)算權(quán)重排名,更貼近文章所講述的內(nèi)容;“相關(guān)問答數(shù)”指出現(xiàn)該關(guān)鍵詞的問答數(shù)量;“出現(xiàn)次數(shù)”指在相關(guān)問答中關(guān)鍵詞出現(xiàn)的詞頻。

      2 文本分析

      根據(jù)文本分詞結(jié)果,可得到各關(guān)鍵話題詞的詞頻和特征詞“問題-回答”對(duì)應(yīng)的互動(dòng)頻率,針對(duì)該數(shù)據(jù)結(jié)果進(jìn)行可視化分析,可以直觀有效地反映求職者討論話題熱點(diǎn)。

      2.1 高頻特征詞分析

      從1781個(gè)關(guān)于求職的問題中,通過數(shù)據(jù)處理和文本分詞,得到初步的詞匯頻率排布,然后對(duì)這些詞匯做權(quán)重判斷,并取權(quán)重前100的詞,過濾掉與求職信息無關(guān)或特定公司名稱等與求職關(guān)注行為研究無關(guān)的詞語后,得到的關(guān)鍵詞即具有高權(quán)重、高頻率、高相關(guān)度的詞。關(guān)鍵詞云圖如圖1所示,字體越大者代表該詞詞頻越高。這些高權(quán)重的高頻特征詞反映了當(dāng)下在擁有求職問答功能的在線問答社區(qū)中,求職者討論和關(guān)注的主要話題內(nèi)容。

      表1 部分分詞結(jié)果

      通過高頻特征詞及詞頻可初步看出,求職者在求職過程中對(duì)于如何順利通過考核最為關(guān)心,如“面試”“簡歷”“HR”“面試官”“Offer”“技巧”等。對(duì)于求職者的學(xué)歷和經(jīng)驗(yàn)在意程度比較高,如“應(yīng)屆生”“研究生”“經(jīng)驗(yàn)”“畢業(yè)生”“碩士”“考研”等。針對(duì)求職公司的雇主品牌吸引力關(guān)注程度較高,如“管理”“專業(yè)”“工資”“薪資”“待遇”“加班”等。且從用戶使用角色來看,使用網(wǎng)絡(luò)問答社區(qū)參與求職關(guān)注行為討論的求職者以年輕求職者居多,高校畢業(yè)生占主導(dǎo)地位,如“兼職”“實(shí)習(xí)”“應(yīng)屆生”“大學(xué)生”“畢業(yè)生”“校招”等。

      圖1 關(guān)鍵詞云圖

      2.2 特征詞互動(dòng)分布分析

      特征詞話題互動(dòng)分布可以區(qū)分關(guān)注話題的廣泛受眾度和潛在受眾度。根據(jù)表1中各特征詞的出現(xiàn)次數(shù)、回答數(shù)和權(quán)重進(jìn)行標(biāo)準(zhǔn)化處理,制作關(guān)注點(diǎn)特征詞互動(dòng)分布四象限氣泡圖,如圖2所示。其中四象限的橫坐標(biāo)代表回答數(shù),縱坐標(biāo)表示出現(xiàn)該問題的詞頻數(shù),氣泡的大小代表權(quán)重。根據(jù)特征詞所對(duì)應(yīng)的位置,分為四種話題類型:①輿論焦點(diǎn)區(qū)(第一象限):此區(qū)域代表詞頻較高且回答數(shù)較高的話題;②關(guān)注焦點(diǎn)區(qū)(第二象限):此區(qū)域代表詞頻較高但回答數(shù)較低的話題;③潛在熱點(diǎn)區(qū)(第四象限):此區(qū)域代表詞頻較低但回答數(shù)較高的話題;④沉默區(qū)(第三象限):此區(qū)域代表詞頻和回答數(shù)都較低的話題。

      圖2 特征詞話題互動(dòng)分布?xì)馀輬D

      2.2.1 輿論焦點(diǎn)區(qū)(第一象限)

      圖2中,“面試”“簡歷”“HR”三個(gè)特征詞的提問量與回答量都非常高,這說明這組問題是目前求職者關(guān)注與討論的重點(diǎn)和熱點(diǎn)。綜合來看,這三個(gè)特征詞反映的都是作為求職者進(jìn)入心儀公司的必經(jīng)考核方式。

      (1)在如今企業(yè)高速發(fā)展、人才兼?zhèn)涞男畔r(shí)代,企業(yè)招聘變得越發(fā)嚴(yán)格,不僅涉獵專業(yè)知識(shí)、團(tuán)隊(duì)協(xié)作等多方面能力考查,且形式也更為多樣化。將溝通表達(dá)、邏輯思維、團(tuán)隊(duì)合作、壓力承受、職業(yè)規(guī)劃等全部列入考核范圍,使得廣大求職者,特別是應(yīng)屆畢業(yè)生在求職過程中更加有壓力和學(xué)習(xí)的動(dòng)力,在求職的各個(gè)環(huán)節(jié)都需要認(rèn)真準(zhǔn)備。

      (2)求職者的簡歷作為求職的“敲門磚”,需要突出專業(yè)能力,重點(diǎn)挖掘崗位匹配信息并盡可能數(shù)據(jù)化表達(dá)。

      (3)面試準(zhǔn)備則除了長期積累的專業(yè)知識(shí)外,對(duì)應(yīng)聘企業(yè)的企業(yè)文化、發(fā)展理念、主要產(chǎn)品等也都應(yīng)提前了解。

      (4)通過網(wǎng)絡(luò)招聘問答社區(qū)的交流互動(dòng),已經(jīng)歷求職過程或已入職人員的經(jīng)驗(yàn)分享,不僅可以讓更多將要參與面試的求職者找到現(xiàn)階段努力的方向,修改更新個(gè)人簡歷,還可以增強(qiáng)潛在求職者對(duì)心儀企業(yè)的深入了解,更加有針對(duì)性地完善求職目標(biāo),這也正是此類話題成為輿論熱點(diǎn)的重要原因。

      2.2.2 關(guān)注焦點(diǎn)區(qū)(第二象限)

      圖2中,“應(yīng)屆生”“求職”“offer”“加班”“經(jīng)驗(yàn)”“實(shí)習(xí)”及薪資福利類特征詞的提問量都比較高但是回答數(shù)相對(duì)較少,說明此類問題亟待解決且有較高的發(fā)展空間。另外,“工資”“待遇”“薪資”三個(gè)關(guān)鍵詞雖在氣泡圖中分布于沉默區(qū),但考慮到語義理解,其含義基本相同,故將此類話題的詞頻和回答數(shù)合并計(jì)算。

      (1)企業(yè)招聘員工看重其十分出色的勝任力和執(zhí)行力,由于眾多民營企業(yè)和創(chuàng)業(yè)型小微企業(yè)的快速發(fā)展,其在新人培訓(xùn)階段更加關(guān)注企業(yè)文化和綜合素質(zhì)的提升,而對(duì)于不同崗位不同工作內(nèi)容的指導(dǎo)培訓(xùn)卻相對(duì)弱化,這就需要求職者有較好的項(xiàng)目經(jīng)驗(yàn)和學(xué)習(xí)能力。

      (2)越來越多的招聘人員看重求職者的崗位與技能匹配度,特別對(duì)應(yīng)屆畢業(yè)生來說,僅靠在學(xué)校掌握的專業(yè)知識(shí)無法直接勝任招聘要求,想要快速實(shí)現(xiàn)從校園到職場的轉(zhuǎn)變,需要求職者更早地參與到企業(yè)實(shí)踐中,因此實(shí)習(xí)經(jīng)驗(yàn)的積累成為眾多求職者關(guān)注的重點(diǎn)。

      (3)目前,眾多著名企業(yè)在校園招聘階段專門開設(shè)實(shí)習(xí)生招聘模塊,其考核制度也更加嚴(yán)格規(guī)范,有些甚至不低于對(duì)正式員工的要求,因此,實(shí)習(xí)生的含金量也逐年增加,一份優(yōu)秀的實(shí)習(xí)經(jīng)驗(yàn)在正式求職時(shí)常常能起到至關(guān)重要的作用。

      (4)實(shí)習(xí)經(jīng)驗(yàn)與正式求職已逐漸成為一種互利共存的關(guān)系。針對(duì)此類話題回答數(shù)相對(duì)較少的原因主要是應(yīng)屆生與需要實(shí)習(xí)經(jīng)驗(yàn)的求職者一般是首次進(jìn)入求職圈的用戶群,他們關(guān)注此類問題,但是難以向他人提供經(jīng)驗(yàn)分享,而參與社會(huì)招聘的資深求職者又很少參與此類話題討論。這也反映出使用網(wǎng)絡(luò)招聘問答社區(qū)的用戶群更為廣泛,不受年齡和資質(zhì)的約束,更多資歷豐富和年長的求職者也在互聯(lián)網(wǎng)高速發(fā)展的今天參與到平臺(tái)互動(dòng)中。

      (5)招聘企業(yè)的雇主吸引力也是關(guān)注焦點(diǎn)。文獻(xiàn)研究中,雇主吸引力評(píng)價(jià)通常采用六維模型,包括工作本身、管理風(fēng)格、團(tuán)隊(duì)合作、薪酬福利、職業(yè)發(fā)展和組織實(shí)力。本研究中,薪資福利、屬于工作本身范疇的加班均出現(xiàn)在高頻詞中,說明雇主吸引力也是求職者選擇企業(yè)的重要指標(biāo)。

      眾多民營企業(yè)和創(chuàng)業(yè)型公司在其發(fā)展上升期通常業(yè)務(wù)繁忙,相對(duì)傳統(tǒng)企業(yè)更加繁忙,對(duì)員工的業(yè)務(wù)效率和產(chǎn)品熟悉度要求更高。無論是新入職的零經(jīng)驗(yàn)求職者,還是已有資歷但剛剛跳槽試圖找尋新機(jī)會(huì)的有經(jīng)驗(yàn)求職者來說,在還未熟練掌握崗位工作要領(lǐng)卻面臨高強(qiáng)度壓力和要求的情況下,加班成了普遍的工作狀態(tài)。薪酬福利是求職者所能獲得的最直觀的報(bào)酬和評(píng)價(jià),它反映了員工的工作勝任能力和企業(yè)對(duì)員工的重視程度,因此,求職者對(duì)薪酬福利的關(guān)注程度較高。

      綜合來看,求職者對(duì)于雇主吸引力相關(guān)因素的重點(diǎn)關(guān)注體現(xiàn)了當(dāng)今求職雇主-員工的雙向匹配性,求職者不再被動(dòng)等待企業(yè)的選擇,而是擁有了主觀選擇企業(yè)的權(quán)利,因此,招聘企業(yè)需要不斷提升自身的實(shí)力和品牌吸引力,才能在人才招募中占得先機(jī)。

      根據(jù)回答內(nèi)容語義分析顯示,此類關(guān)注焦點(diǎn)話題的回答數(shù)相對(duì)較少的原因主要有兩方面,一是使用網(wǎng)絡(luò)招聘問答社區(qū)的用戶更多為準(zhǔn)備或正在進(jìn)行求職的潛在員工,已入職的企業(yè)內(nèi)部員工參與相對(duì)較少,因此無法給該類問題提供充足的回答建議;二是即使有部分企業(yè)內(nèi)部員工參與討論,但因其所在企業(yè)、部門、崗位等的不同而無法提供廣泛適用性參考建議。

      2.2.3 潛在熱點(diǎn)區(qū)(第三象限)

      2.1.3 二維相關(guān)光譜 將人參、紅參、西洋參3種配方顆粒壓片后,在室溫狀態(tài)下放置,間隔10~30 min測定紅外光譜并進(jìn)行基線校正,將獲得的數(shù)量足夠的紅外光譜導(dǎo)入清華大學(xué)的TD4.2二維分析軟件,即可獲得二維相關(guān)紅外光譜圖,并可根據(jù)需要選取不同波數(shù)范圍進(jìn)行分析。

      圖2中,“管理”出現(xiàn)詞頻雖少但討論數(shù)卻多,說明該類話題可能會(huì)成為以后關(guān)注的重點(diǎn)。管理在求職社區(qū)中主要有兩層含義,一是指管理工作本身,例如從企業(yè)角度來說,企業(yè)內(nèi)部的管理架構(gòu)、管理模式和管理內(nèi)容都在不同角度反映企業(yè)的社會(huì)價(jià)值和發(fā)展空間,擁有良好的管理制度和管理決策不僅能讓企業(yè)在激烈的市場競爭中找到適合自身持續(xù)發(fā)展的道路,還能更好地吸引優(yōu)質(zhì)人才;二是從學(xué)科專業(yè)角度來說,管理類相關(guān)專業(yè)歷經(jīng)數(shù)十年發(fā)展,已經(jīng)形成了良好的專業(yè)體系,近幾年又與眾多熱門前沿領(lǐng)域進(jìn)行學(xué)科交叉,使得管理及交叉專業(yè)畢業(yè)生的求職機(jī)會(huì)逐年增加。這也進(jìn)一步推動(dòng)了高校管理類及相關(guān)專業(yè)人才培養(yǎng)的改革,要求高校在培養(yǎng)方案、目標(biāo)設(shè)置和知識(shí)能力結(jié)構(gòu)等方面均應(yīng)緊跟發(fā)展趨勢,及時(shí)修正和完善理論和實(shí)踐教學(xué)體系,為企業(yè)培育和輸送更多復(fù)合型專業(yè)人才。

      2.2.4 沉默區(qū)(第四象限)

      圖2中,該區(qū)域的數(shù)據(jù)相對(duì)其它區(qū)域其提問數(shù)和回答數(shù)都相對(duì)較少,但經(jīng)過大數(shù)據(jù)樣本后仍舊出現(xiàn)較高權(quán)重,說明該部分詞仍有研究價(jià)值,并可能會(huì)成為未來討論熱點(diǎn)。沉默區(qū)中與學(xué)歷及薪資待遇相關(guān)的話題詞較多,學(xué)歷雖不是求職的硬性門檻,但是眾多招聘反饋顯示,用人單位對(duì)于求職者的學(xué)歷重視程度依然不減。尤其隨著人才質(zhì)量平均水平的提高、各高校每年招生人數(shù)的擴(kuò)張等,學(xué)歷的含金量也在不斷提升。之所以討論話題較少,最大的可能是站在求職者角度,很難判定企業(yè)對(duì)求職者學(xué)歷是否會(huì)真正考量?,F(xiàn)在許多企業(yè)為了廣招人才,在招聘信息中并不明確規(guī)定學(xué)歷限制,但在真實(shí)考評(píng)中是否參考卻很難判定。

      薪資福利類話題占比較少的原因主要是目前民營、私企數(shù)量增多,薪資模式不同于以往的“同工同酬”,多數(shù)采用“差異化薪資模式”,即根據(jù)每個(gè)人的能力或價(jià)值細(xì)分成不同的待遇。即便是一同進(jìn)入公司的同一個(gè)崗位,也會(huì)有所區(qū)別,其目的還是為了更好地激勵(lì)員工實(shí)現(xiàn)更大的價(jià)值?!安町惢劫Y”在求職話題領(lǐng)域?qū)儆谙鄬?duì)私密的話題,也很難在開放社區(qū)得到真實(shí)答案。

      3 對(duì)策與建議

      分析求職者關(guān)注行為的目的在于為提升企業(yè)招聘質(zhì)量和效率、為求職者提高競爭實(shí)力和求職滿意度提出意見和建議,以期建立企業(yè)與求職者互利共贏的新型求職關(guān)系。通過對(duì)網(wǎng)絡(luò)問答社區(qū)求職者關(guān)注行為的分析,不僅讓求職者可以在海量招聘企業(yè)中更清晰、全面地了解心儀公司,以便更有針對(duì)性地準(zhǔn)備自己的求職過程,還幫助企業(yè)在使用網(wǎng)絡(luò)招聘社區(qū)進(jìn)行企業(yè)宣傳、人才招募過程中更好地掌握求職者的內(nèi)在驅(qū)動(dòng)力,及時(shí)改進(jìn)企業(yè)內(nèi)部和外部的資質(zhì)條件,從而在人才競爭中取勝。

      3.1 對(duì)招聘企業(yè)建議

      對(duì)于招聘企業(yè)來說,想要招聘到合適,高素質(zhì)的員工無疑是企業(yè)發(fā)展最重要的一環(huán),想要打贏人才爭奪戰(zhàn),分別要從內(nèi)在和外在兩方面入手。

      3.1.1 充分識(shí)別求職者群體關(guān)注行為特征

      一個(gè)城市的發(fā)展離不開經(jīng)濟(jì)增長和人均GDP的提高,這些增長來源于企業(yè)的發(fā)展,城市內(nèi)擁有的優(yōu)秀企業(yè)越多,經(jīng)濟(jì)增長就越快,留住人才的機(jī)率也越大。近幾年各大經(jīng)濟(jì)競爭力較強(qiáng)的城市都紛紛出臺(tái)了相應(yīng)的人才優(yōu)惠政策:2017年初,武漢市“五年內(nèi)留住百萬大學(xué)生”計(jì)劃打響了爭奪人才第一槍;2018年3月,北京市宣布建立人才引進(jìn)“綠色通道”;同月,上海也提出打造“人才高峰”。2018年,全國超過100個(gè)城市發(fā)布了人才政策。2019年一開年,各地爭奪人才政策集中發(fā)布,其中購房和生活補(bǔ)貼是兩大最主要也是最常見的吸引人才手段。數(shù)據(jù)說明,人才吸引政策的背后,正是對(duì)求職者尤其是高素質(zhì)求職者的看重。

      3.1.2 努力實(shí)現(xiàn)雇主品牌吸引力的提升

      當(dāng)今時(shí)代的求職者學(xué)習(xí)能力較強(qiáng),目標(biāo)定位和自我追求都比較高,企業(yè)只有盡力滿足高素質(zhì)求職者的期望條件,才能成為優(yōu)秀人才的求職目標(biāo)。

      招聘企業(yè)應(yīng)重視自身品牌吸引力的提升,從而為任何一個(gè)有上進(jìn)心并不斷提升自我的求職者帶來最大程度的就業(yè)滿意度。綜合國內(nèi)外學(xué)者對(duì)雇主品牌吸引力的研究以及求職者關(guān)注話題數(shù)據(jù)可知,雇主品牌的功能性、象征性和發(fā)展性對(duì)潛在員工有重要的影響作用。其中,功能性主要強(qiáng)調(diào)企業(yè)承諾的工作本身,包括提供真實(shí)、完整的崗位職責(zé)和工作內(nèi)容供求職者參考,最大限度地解決信息不對(duì)稱而造成的擇業(yè)困難問題等。象征性強(qiáng)調(diào)企業(yè)展示的品牌形象,包括企業(yè)的聲譽(yù)、名譽(yù)以及外在形象等反映企業(yè)內(nèi)在精神力量等因素。發(fā)展性則側(cè)重企業(yè)提供的職業(yè)發(fā)展前景,包括良好的職業(yè)發(fā)展路徑、完善的晉升體制、充分的職業(yè)培訓(xùn)等。

      以阿里巴巴集團(tuán)為例,公司十分注重發(fā)掘員工的潛能,同時(shí)也關(guān)注員工的成長。其內(nèi)部招聘和輪崗制度給很多員工提供了新崗位、新機(jī)會(huì),使員工在職業(yè)發(fā)展路徑上可以得到持續(xù)發(fā)展。阿里巴巴推出的“青橙計(jì)劃”“百年阿里系列培訓(xùn)”“領(lǐng)導(dǎo)力發(fā)展”“阿里夜?!钡纫幌盗袉T工培訓(xùn)措施,為員工提供了更多自我提升平臺(tái)。阿里深知在競爭文化中,企業(yè)的信譽(yù)、形象、品牌和知名度都是企業(yè)不可估量的無形資產(chǎn),員工的思想、行為和心態(tài)也會(huì)受其影響和熏陶。于是,讓企業(yè)所有成員從進(jìn)入公司的那一刻起,就擁有金庸武俠人物的名號(hào),不僅讓武俠文化中的正義感影響到公司每一個(gè)員工,也為員工營造出一種輕松愉悅的工作氛圍,使員工能夠拋開壓力,更加團(tuán)結(jié),也更加愿意為組織實(shí)現(xiàn)共同的價(jià)值而奮斗。

      3.2 對(duì)求職者的建議

      對(duì)于求職者來說,應(yīng)充分利用線上線下各類知識(shí)渠道和資源,不斷豐富閱歷,掌握面試要領(lǐng),注重思考和經(jīng)驗(yàn)總結(jié),全面提升崗位勝任力。

      3.2.1 充分利用網(wǎng)絡(luò)求職社區(qū)的各類資源和信息

      互聯(lián)網(wǎng)時(shí)代,掌握更多的信息就意味著掌握更大的主動(dòng)權(quán)和選擇權(quán)。求職者可以在網(wǎng)絡(luò)問答社區(qū)匿名討論求職問題,傳達(dá)行業(yè)知識(shí),實(shí)現(xiàn)全方位信息交流和人際網(wǎng)絡(luò)互動(dòng),還可以利用平臺(tái)了解企業(yè)非公開化信息,加深崗位職責(zé)了解,熟悉業(yè)內(nèi)薪資水平,掌握面試技巧,不斷完善自己的知識(shí)儲(chǔ)備,更好地進(jìn)行規(guī)劃對(duì)比分析,從而選擇更適合自己的公司。

      除了知乎和看準(zhǔn)網(wǎng)平臺(tái)之外,信息資源較為豐富且用戶活躍度較高的還有國內(nèi)的拉勾網(wǎng)、脈脈、實(shí)習(xí)僧等,國外的Linkedln等,這些平臺(tái)利用其社交媒介特性與招聘指導(dǎo)相融合,最大化幫助求職者實(shí)現(xiàn)滿意就業(yè)。

      以2018年10月剛完成D輪融資的社交招聘新秀“脈脈”來看,一旦求職者選定了自己的職業(yè)領(lǐng)域,求職者在脈脈平臺(tái)上看到的內(nèi)容、可以接觸的人幾乎全部與這個(gè)職業(yè)有關(guān)。如該職業(yè)其他人的實(shí)名或匿名動(dòng)態(tài)、人脈推薦、職業(yè)資訊推薦等等。這種聚焦垂直領(lǐng)域的組織方法,強(qiáng)化了職場人群因行業(yè)相通而帶來的內(nèi)部凝結(jié),讓行業(yè)內(nèi)部信息的交流溝通變得更加方便快捷,使得求職過程中求職者與企業(yè)雙方并不完全信息對(duì)等的關(guān)系變得更加透明,從而讓求職者有更多的機(jī)會(huì)和方式去了解企業(yè)更深層次的信息。

      3.2.2 多渠道高效提升崗位勝任力

      對(duì)求職者來說,想要順利進(jìn)入理想企業(yè),就必須在眾多優(yōu)秀競爭者中脫穎而出。學(xué)歷文憑早已不再是企業(yè)挑選人才的唯一指標(biāo),只要擁有求職崗位的專業(yè)技能,都有機(jī)會(huì)獲得工作機(jī)會(huì)。開放性的招聘環(huán)境帶給了求職者更多的職業(yè)選擇,但同時(shí)也增加了競爭難度。在招聘過程中,企業(yè)更加看重的是求職者的崗位優(yōu)勢、核心競爭力等綜合素質(zhì)。

      除了在求學(xué)期間系統(tǒng)扎實(shí)地學(xué)習(xí)專業(yè)知識(shí)、提高專業(yè)技能之外,求職者還可充分利用企業(yè)針對(duì)求職者實(shí)習(xí)實(shí)踐能力提升的渠道和途徑。目前,眾多企業(yè)都在開放實(shí)習(xí)生招錄計(jì)劃,可以讓職場新人提前得到鍛煉的機(jī)會(huì),零距離接觸實(shí)際工作內(nèi)容,提升就業(yè)技能。

      以普華永道為例,每年1月和7月,其審計(jì)部、管理部、風(fēng)險(xiǎn)及控制服務(wù)部、稅務(wù)部均會(huì)開放實(shí)習(xí)生機(jī)會(huì)。實(shí)習(xí)期間,學(xué)生不僅可以親身體驗(yàn)在專業(yè)服務(wù)公司里的真實(shí)客戶項(xiàng)目工作,還可學(xué)到各種基本職業(yè)技能,從而提高專業(yè)能力。若實(shí)習(xí)期間表現(xiàn)優(yōu)異,還可以獲得畢業(yè)后優(yōu)先錄用的機(jī)會(huì)。

      在線上付費(fèi)平臺(tái)和虛擬社群方面,以當(dāng)今較為火熱的互聯(lián)網(wǎng)人在線大學(xué)“三節(jié)課”平臺(tái)為例,該平臺(tái)以專業(yè)輔導(dǎo)互聯(lián)網(wǎng)產(chǎn)品和運(yùn)營崗位相關(guān)技能為切入點(diǎn),主打互聯(lián)網(wǎng)熱點(diǎn)人物事件專業(yè)分析解讀。并通過內(nèi)容入口集聚粉絲,開展多層次的互聯(lián)網(wǎng)職業(yè)培訓(xùn),以提升職業(yè)能力為目標(biāo),倡導(dǎo)終生學(xué)習(xí)。平臺(tái)關(guān)注和強(qiáng)調(diào)從“知識(shí)獲得”到“能力提升”的轉(zhuǎn)化過程,提供“設(shè)計(jì)體系化課程+高強(qiáng)度實(shí)戰(zhàn)練習(xí)+專家助教1對(duì)1點(diǎn)評(píng)+班主任深度服務(wù)”的線上教學(xué)模式。不僅讓求職者省去了線下課程成本,可以更加自由靈活地安排學(xué)習(xí)時(shí)間,有針對(duì)性地完善崗位專業(yè)知識(shí),而且能在不斷學(xué)習(xí)中迭代技能體系,利用集聚效應(yīng),提升應(yīng)聘競爭優(yōu)勢。

      4 結(jié)語

      本文將文本挖掘方法運(yùn)用于網(wǎng)絡(luò)問答社區(qū)求職者關(guān)注行為的研究中,利用Node.js爬蟲的方式從知乎求職話題圈和看準(zhǔn)網(wǎng)求職專業(yè)互動(dòng)平臺(tái)抽取大量求職者提問和相關(guān)回答,并借助分詞詞典和Node.js中的jieba技術(shù)對(duì)數(shù)據(jù)進(jìn)行處理和分析,構(gòu)建求職者關(guān)注高頻詞云圖和關(guān)注話題互動(dòng)分布圖,分析求職者在當(dāng)今招聘環(huán)境中的關(guān)注行為。

      研究結(jié)果表明:①使用網(wǎng)絡(luò)問答社區(qū)參與求職關(guān)注行為討論的求職者以年輕人居多,其中高校畢業(yè)生占比最大,管理類專業(yè)人才和崗位需求相比數(shù)量更多。②求職者對(duì)于如何順利通過考核最為關(guān)注,討論熱度也最強(qiáng),開放的問答社區(qū)使得用戶參與和知識(shí)分享更為便捷,求職者可化被動(dòng)為主動(dòng),提前了解更多考核信息并針對(duì)性地學(xué)習(xí)和準(zhǔn)備。③雇主的吸引力是求職者擇業(yè)最先考慮的因素,這其中包括企業(yè)內(nèi)部競爭力和外部競爭力,內(nèi)部競爭力體現(xiàn)在企業(yè)發(fā)展、晉升機(jī)制、企業(yè)文化和創(chuàng)新是否滿足人才需求,外部競爭力主要體現(xiàn)在薪資待遇等物質(zhì)條件方面,但由于目前各公司相同崗位的待遇沒有統(tǒng)一的標(biāo)準(zhǔn),且該類問題私密性較強(qiáng),所以較難在開放社區(qū)得到充足的反饋。④工作經(jīng)驗(yàn)也成為求職者更為在意的話題,因?yàn)槠髽I(yè)目前更傾向于經(jīng)驗(yàn)豐富,實(shí)踐能力強(qiáng)的優(yōu)質(zhì)人才,即便針對(duì)應(yīng)屆畢業(yè)生,也更加看重實(shí)習(xí)或綜合實(shí)訓(xùn)的技能培養(yǎng)。

      因此,招聘企業(yè)需要在提高自身競爭力的同時(shí)更加了解求職者的關(guān)注行為。求職者需要充分利用線上線下各渠道和資源,豐富閱歷,提高專業(yè)技能,實(shí)現(xiàn)更理想的人-崗匹配。

      本文在數(shù)據(jù)來源的選取上存在一定的局限性,僅選擇了知乎和看準(zhǔn)網(wǎng)兩大問答社區(qū),在后續(xù)的研究中可以增設(shè)更多的平臺(tái)驗(yàn)證數(shù)據(jù)結(jié)果。另外,對(duì)于問答發(fā)表者的用戶畫像沒有很完善的判定,可在以后的研究中增設(shè)相關(guān)內(nèi)容,更加豐富求職者關(guān)注行為研究的準(zhǔn)確性。

      猜你喜歡
      求職者頁面社區(qū)
      起初為娛樂,現(xiàn)在做招聘:直播幫中國求職者找工作
      英語文摘(2022年9期)2022-10-26 06:58:38
      刷新生活的頁面
      社區(qū)大作戰(zhàn)
      幼兒園(2021年6期)2021-07-28 07:42:08
      3D打印社區(qū)
      在社區(qū)推行“互助式”治理
      加納移民局招聘:有妊娠紋不行
      民生表情
      面試中的12個(gè)禁忌
      如何積極應(yīng)對(duì)社區(qū)老年抑郁癥
      同一Word文檔 縱橫頁面并存
      英吉沙县| 开原市| 清流县| 涞源县| 兴业县| 南通市| 贡嘎县| 绥德县| 徐闻县| 师宗县| 巴塘县| 穆棱市| 定兴县| 洪湖市| 阿城市| 屏山县| 汤原县| 增城市| 金堂县| 万年县| 沭阳县| 长乐市| 台州市| 高唐县| 盈江县| 嘉鱼县| 绥化市| 武安市| 民丰县| 肥乡县| 喜德县| 运城市| 隆昌县| 乌兰县| 盐亭县| 米易县| 卢湾区| 汉阴县| 宁陕县| 郧西县| 当涂县|