劉彩娜 路健 封逍遙
摘要:隨著大數(shù)據(jù)、云計算、人工智能等技術(shù)的出現(xiàn),我國物流產(chǎn)業(yè)正向智慧物流轉(zhuǎn)型升級,企業(yè)對智慧物流人才的需求大大增加。文章以前程無憂網(wǎng)站上收集的1 685條智慧物流相關(guān)招聘信息為數(shù)據(jù)來源,運(yùn)用文本挖掘技術(shù),通過詞庫優(yōu)化、分詞優(yōu)化、詞頻統(tǒng)計等方法獲取智慧物流人才需求的關(guān)鍵詞,并繪制詞云圖進(jìn)行可視化展示。對提取的關(guān)鍵詞進(jìn)行分析,進(jìn)一步從業(yè)務(wù)知識、信息技術(shù)和基本素質(zhì)等方面總結(jié)智慧物流人才需求的詳細(xì)特征,為智慧物流人才培養(yǎng)提供參考。
關(guān)鍵詞:智慧物流;文本挖掘;人才需求
中圖分類號:TP3? 文獻(xiàn)標(biāo)志碼:A
0 引言
隨著大數(shù)據(jù)、云計算、人工智能和物聯(lián)網(wǎng)的發(fā)展,傳統(tǒng)物流業(yè)不斷向智慧物流轉(zhuǎn)型升級,條形碼、射頻識別技術(shù)、傳感器、無人技術(shù)、全球定位系統(tǒng)等先進(jìn)的信息技術(shù)在物流企業(yè)中廣泛應(yīng)用,大大提高了倉儲、包裝、分揀、裝卸、運(yùn)輸以及加工配送等物流各環(huán)節(jié)的效率[1]。智慧物流為企業(yè)帶來高效的同時,企業(yè)對物流人才的需求也發(fā)生變化,智慧物流人才需求越來越多,要求也越來越高,但當(dāng)前多數(shù)高校的物流人才培養(yǎng)目標(biāo)與社會發(fā)展脫節(jié),因此各高校應(yīng)以物流企業(yè)需求為導(dǎo)向來確定人才培養(yǎng)方案,選擇有效的人才培養(yǎng)路徑[2]。本文對智慧物流相關(guān)工作崗位的招聘信息進(jìn)行了挖掘,并提取招聘信息里詞頻較高的知識和技能,以便為高校智慧物流人才的培養(yǎng)、課程的設(shè)置提供建議。
1 智慧物流招聘信息采集
1.1 選擇招聘數(shù)據(jù)源
本文采集的數(shù)據(jù)源自2021年10月到2021年11月的前程無憂網(wǎng)站中關(guān)于智慧物流相關(guān)行業(yè)的招聘信息。前程無憂招聘網(wǎng)站發(fā)布的招聘信息主要包括兩個部分,第一部分是企業(yè)相關(guān)信息,包括企業(yè)的名稱、介紹、類型、規(guī)模、所屬行業(yè)等;第二部分是崗位相關(guān)信息,包括招聘崗位、薪資、所在地、工作經(jīng)驗、學(xué)歷、所招人數(shù)、福利標(biāo)簽、職位信息、上班地址等。其中職位信息主要描述崗位的主要職責(zé)、任職要求等信息,這部分內(nèi)容是文本分析的重點(diǎn)內(nèi)容。
1.2 信息采集步驟及規(guī)則
本文的數(shù)據(jù)采集過程分為兩步驟,一是使用爬蟲工具對前程無憂以“智慧物流”為關(guān)鍵字對全國的數(shù)據(jù)進(jìn)行采集;二是對采集到的招聘信息進(jìn)行篩選、去重等整合處理,剔除部分不良樣本和無關(guān)樣本。
1.3 數(shù)據(jù)采集結(jié)果匯總
從前程無憂招聘網(wǎng)站發(fā)布的招聘信息中共采集到1 954條智慧物流相關(guān)數(shù)據(jù),通過對數(shù)據(jù)的整合處理,主要包括剔除無效數(shù)據(jù)、篩選、去重等操作,共保留了1 685條數(shù)據(jù),以便進(jìn)行下一步的數(shù)據(jù)處理和分析。本文采集到的數(shù)據(jù)包括的字段為:關(guān)鍵詞、城市頁碼、城市網(wǎng)址、招聘崗位、薪資、所在地、工作經(jīng)驗、學(xué)歷、所招人數(shù)、發(fā)布時間、福利標(biāo)簽、職位信息、上班地址、公司、公司介紹鏈接、公司信息、公司類型、上市公司、公司規(guī)模、所屬行業(yè)、頁面網(wǎng)址和采集時間。對于處理好的數(shù)據(jù),寫入MySQL數(shù)據(jù)庫。
2 智慧物流招聘信息文本挖掘
智慧物流招聘信息文本挖掘主要包括規(guī)范語料庫和分詞挖掘,具體步驟包括:數(shù)據(jù)預(yù)處理,分詞詞頻統(tǒng)計,分詞抽取出包含智慧物流的候選詞并加入語料集,再次處理招聘信息語料集,優(yōu)化分詞結(jié)果,最終生成智慧物流詞云圖。具體過程如圖1所示。
2.1 中文分詞
2.1.1 文本預(yù)處理
采集到的職位信息的文本格式不符合分詞要求,需要的是不含有換行、回車、水平制表符的單行文本,并且此文本還存在網(wǎng)頁空格變成亂碼的問題,因此需對職位信息進(jìn)行文本格式化。前面問題的根源在于UTF-8這種編碼里面,存在一個特殊的字符,其編碼是“0xC2 0xA0”,轉(zhuǎn)換成字符的時候,表現(xiàn)為一個空格,跟一般的半角空格(ASCII 0x20)一樣,唯一的不同是它的寬度不會被壓縮,因此比較多的被用于網(wǎng)頁排版(如首行縮進(jìn)之類)。而其他的編碼方式如GB2312,Unicode等并沒有這樣的字符,因此如果簡單地進(jìn)行編碼轉(zhuǎn)換,生成的GB2312/Unocode字符串中,這個字符就會被替換成為問號(ASCII ox3F)。此時如果進(jìn)行寫庫、寫文件,就會把問號直接寫入。因此使用replaceAll()把這個特殊的空格替換為普通的空格,再用正則表達(dá)式去掉所有換行、回車、水平制表符。
2.1.2 基于前綴字典的分詞
本文通過調(diào)用Java版本的Jieba方法實(shí)現(xiàn)中文文本分詞,Jieba分詞Java版本有兩種模式精確模式(Search)和全模式(Index),本文主要使用精確模式。
Jieba分詞主要是基于統(tǒng)計詞典,構(gòu)造一個前綴詞典;然后利用前綴詞典對輸入句子進(jìn)行切分,得到所有的切分可能,根據(jù)切分位置,構(gòu)造一個有向無環(huán)圖;通過動態(tài)規(guī)劃算法,計算得到最大概率路徑,也就得到了最終的切分形式[3]。Jieba詞庫自帶包含349 045條詞匯的詞典,可以實(shí)現(xiàn)中文文本的基本分詞。本文采集的文本是智慧物流崗位的職位信息,其中包含了大量的專業(yè)詞匯。例如,“智慧物流”一詞在分詞模塊會將其分為“智慧”和“物流”,這改變了文本原本想要表達(dá)的意思。為了這一問題,本文在使用Jieba庫時選擇添加包含40 760條詞匯的自定義詞典。根據(jù)本文采集數(shù)據(jù)的特點(diǎn),分別添加搜狗細(xì)胞詞庫中ERP軟件、阿里巴巴產(chǎn)品詞匯-交通運(yùn)輸、常用計算機(jī)技術(shù)詞庫、高校專業(yè)、計算機(jī)專業(yè)詞庫、物流貨運(yùn)專業(yè)術(shù)語、物流詞匯大全等詞庫,有效地提高了招聘文本分詞的精確度。
2.2 去停用詞
分詞完畢后統(tǒng)計詞頻時與期望值不符,由于高頻詞匯常常是“的”“和”等一些沒有實(shí)際意義的詞,蘊(yùn)含有價值的信息非常少,而且分詞之后含有大量的標(biāo)點(diǎn)符號,使得文本的維度增多,因此需要將這類詞剔除[4]。對于停用詞的選擇,本文選擇的是Jieba自帶的停詞表,經(jīng)過分詞與停用詞后,發(fā)現(xiàn)仍然包含一些高頻出現(xiàn)但是很少體現(xiàn)招聘信息語境的詞語,比如每條招聘信息都包含“工作內(nèi)容”“微信分享”,因此根據(jù)文本自身情況擴(kuò)充了一些停用詞。并且還發(fā)現(xiàn)剔除停用詞之后缺少例如“c”和“R”與編程語言相關(guān)的單字英文詞,因此對算法進(jìn)行優(yōu)化防止剔除與智慧物流相關(guān)的詞匯。經(jīng)過分詞、去停用詞處理后的文本語料去除文本中的助詞、連詞、特殊字符、標(biāo)點(diǎn)符號等無意義的詞匯及符號,保留下來的詞匯能夠比較好地傳遞文本信息中蘊(yùn)藏的招聘需求。
2.3 分詞結(jié)果降維
基于上述方法對每條招聘信息進(jìn)行分詞后得到223 844個分詞,再經(jīng)過對分詞進(jìn)行匯總和統(tǒng)計詞頻后發(fā)現(xiàn)仍存在8 589個分詞。欲直觀了解與智慧物流招聘信息直接相關(guān)的信息還是比較困難的,可以使用前期準(zhǔn)備的智慧物流自定義詞典作為篩選標(biāo)準(zhǔn),只有自定義詞典中存在的分詞才會被保留,再次處理后保留了1 158個分詞。經(jīng)過詞頻排序,排名靠前的詞為“負(fù)責(zé)”“物流”“客戶”“能力”“產(chǎn)品”“系統(tǒng)”“供應(yīng)鏈”等,觀察發(fā)現(xiàn)詞頻較高的大部分為兩字詞。不能很好地表達(dá)具體需求,比如“能力”包括“表達(dá)能力”“思維能力”“管理能力”等,不同的能力對應(yīng)不同的要求,如果片面地要求“能力”不能很好地說明智慧物流具體所需,所以需要進(jìn)一步優(yōu)化智慧物流詞庫。
2.3.1 優(yōu)化物流詞庫
首先用SQL查詢語句找出分詞為兩個字的詞,為了讓招聘信息盡可能分出所有詞,避免只按照自定義詞典進(jìn)行分詞,所以采用Jieba分詞的Index模式對招聘信息重新進(jìn)行分詞。在原招聘信息中含有大量具有實(shí)際意義的4字詞,如“性格外向”,如果僅以Jieba詞庫來劃分,最終只能得到“性格”和“外向”,通過Index模式進(jìn)行分詞,將所有可以成詞的詞語切分開。
對分詞進(jìn)行去除停用詞,詞頻統(tǒng)計后。使用SQL的模糊查詢語句對出現(xiàn)的兩字詞進(jìn)行查詢,對查詢到的詞剔除兩字詞就得到了包含更具體的“能力”等的詞語,如“能力”“學(xué)習(xí)能力”“抗壓能力”“能力強(qiáng)”“表達(dá)力”的詞頻分別為2 167,188,130,106,89。將這些詞寫入智慧物流自定義詞典中,使得詞庫更加豐富全面,提高分詞精度。
2.3.2 優(yōu)化分詞
使用優(yōu)化后的智慧物流詞典以Jieba分詞的Search模式重新進(jìn)行分詞,在剔除與智慧物流無關(guān)的分詞時也使用優(yōu)化后的詞典。在詞頻統(tǒng)計排序后,使用SQL語句篩選出分詞大于兩個字的詞,為了防止剔除英文分詞,只進(jìn)行篩選中文分詞,英文不做處理。最終得到部分分詞,如智慧物流、自動化、供應(yīng)鏈、客戶需求、大客戶、JAVA、物流管理、計算機(jī)、抗壓能力、物流服務(wù) 、團(tuán)隊合作精神、銷售經(jīng)理、WMS、供應(yīng)商、數(shù)據(jù)分析、智能制造、商務(wù)談判、自動化系統(tǒng)、協(xié)作精神、資源整合、數(shù)據(jù)庫等。
3 智慧物流人次需求分析
3.1 智慧物流人次需求關(guān)鍵詞提取
選取優(yōu)化后分詞結(jié)果中詞頻最高的前600個關(guān)鍵詞,并利用繪圖工具繪制詞云,如圖2所示,圖中詞的大小表示關(guān)鍵詞出現(xiàn)的頻次高低。
3.2 智慧物流人次需求分析
根據(jù)前文利用分詞技術(shù)與詞頻統(tǒng)計,得到的智慧物流領(lǐng)域招聘相關(guān)的前600個關(guān)鍵詞,經(jīng)人工篩選可發(fā)現(xiàn)關(guān)鍵詞主要集中在業(yè)務(wù)知識、信息技術(shù)和基本素質(zhì)3個方面。
(1)業(yè)務(wù)知識需求分析。
從詞云圖可以看出,物流產(chǎn)業(yè)本身相關(guān)的物流業(yè)務(wù)知識仍是企業(yè)需求的一個重要方向。主要包括立體倉儲管理、物流專員、物流服務(wù)、配送規(guī)劃與設(shè)計、企業(yè)資源規(guī)劃、供應(yīng)鏈管理、銷售方案規(guī)劃等。因此,高校在確定智慧物流人才培養(yǎng)方案的目標(biāo)時,應(yīng)包含物流業(yè)務(wù)方面的內(nèi)容,在課程體系設(shè)置上應(yīng)包括諸如運(yùn)輸管理、倉儲與配送管理、物流系統(tǒng)規(guī)劃與設(shè)計、ERP、供應(yīng)鏈管理等專業(yè)必修課程。
(2)信息技術(shù)需求分析。
智慧物流相關(guān)崗位要求的信息技術(shù)方面的技能包括數(shù)據(jù)分析、數(shù)據(jù)庫、自動化系統(tǒng)、軟件開發(fā)、智能制造、系統(tǒng)集成等,說明企業(yè)希望應(yīng)聘者擁有一定的計算機(jī)、人工智能、自動化、軟件工程、數(shù)學(xué)等相關(guān)知識背景,具有較強(qiáng)的編程能力,一定的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等算法基礎(chǔ)。因此,高校在確定智慧物流人才培養(yǎng)方案的目標(biāo)時,應(yīng)包含信息技術(shù)方面的內(nèi)容,在課程體系設(shè)置上應(yīng)包括計算機(jī)基礎(chǔ)、數(shù)據(jù)庫原理、管理信息系統(tǒng)、數(shù)據(jù)挖掘技術(shù)、數(shù)據(jù)分析等專業(yè)必修或選修課程。
(3)基本素質(zhì)需求分析。
除了物流業(yè)務(wù)和信息技術(shù)上的核心技能外,員工? 的基本素質(zhì)也是企業(yè)招聘時非常關(guān)注的因素。從詞云圖中可以看到,學(xué)習(xí)能力、抗壓能力、團(tuán)隊合作精神、表達(dá)能力、敬業(yè)精神等關(guān)鍵詞出現(xiàn)頻率較高,說明企業(yè)對應(yīng)聘者的綜合素質(zhì)也有一定的要求。因此,高校在確定智慧物流人才培養(yǎng)方案的目標(biāo)時,應(yīng)包含基本素質(zhì)培養(yǎng)方面的內(nèi)容,在課程體系設(shè)置上應(yīng)包括思想道德修養(yǎng)、社會調(diào)查、ERP沙盤模擬、大學(xué)生職業(yè)規(guī)劃、口才與表達(dá)等專業(yè)基礎(chǔ)課程。同時,增加學(xué)生競賽、學(xué)生集體活動、社會活動、創(chuàng)新創(chuàng)業(yè)活動等第二課堂以鍛煉學(xué)生的基本素質(zhì)。
綜合上述分析,高校對物流人才的培養(yǎng)應(yīng)及時做出調(diào)整,以企業(yè)對物流人才業(yè)務(wù)知識、信息技術(shù)和基本素質(zhì)的需求為導(dǎo)向,以培養(yǎng)滿足智慧物流新要求的物流人才為目標(biāo),構(gòu)建物流業(yè)務(wù)知識和信息技術(shù)知識有效融合的課程體系,搭建“校內(nèi)實(shí)訓(xùn)+校?;ネ?校企合作”的智慧物流實(shí)踐平臺,提升智慧物流人才實(shí)踐能力和綜合素質(zhì)。
4 結(jié)語
在智慧物流的大背景下,高校應(yīng)以企業(yè)需求為導(dǎo)向,深入剖析物流行業(yè)相關(guān)崗位需求,獲取企業(yè)對物流人才的新需求,提出物流人才培養(yǎng)的新標(biāo)準(zhǔn)。本文在深刻理解智慧物流內(nèi)涵的基礎(chǔ)上,探索滿足智慧物流需求、助力區(qū)域經(jīng)濟(jì)發(fā)展的物流人才培養(yǎng)新路徑,提出將大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)、云計算等元素融入智慧物流人才培養(yǎng)全過程,旨在促進(jìn)教學(xué)與未來職業(yè)需求相結(jié)合,使學(xué)生所學(xué)與就業(yè)銜接,提升學(xué)生的核心競爭力,實(shí)現(xiàn)高質(zhì)量就業(yè)。
參考文獻(xiàn)
[1]鐘茂林,孫君.智慧物流趨勢下物流管理人才培養(yǎng)再定位與新路徑[J].無錫商業(yè)職業(yè)技術(shù)學(xué)院學(xué)報,2019(6):84-87.
[2]孫學(xué)軍,齊俊景,闞曲欣.基于招聘數(shù)據(jù)挖掘的高職人才培養(yǎng)方案構(gòu)建研究—以物流類專業(yè)為例[J].職教論壇,2019(8):159-164.
[3]張長華.大數(shù)據(jù)視域下網(wǎng)絡(luò)招聘數(shù)據(jù)信息挖掘的研究[J].科學(xué)技術(shù)創(chuàng)新,2021(10):114-115.
[4]楊靜.基于文本挖掘的網(wǎng)絡(luò)招聘信息分析[D].濟(jì)南:山東師范大學(xué),2019.
(編輯 沈 強(qiáng))
Text mining of intelligent logistics talent demand based on recruitment information
Liu? Caina, Lu? Jian*, Feng? Xiaoyao
(Huaxin College,Hebei GEO University, Shijiazhuang 050070, China)
Abstract:? With the emergence of technologies such as big data, cloud computing, artificial intelligence, etc., Chinese logistics industry is transforming and upgrading to intelligent logistics, and enterprises demand for intelligent logistics talents has increased greatly. This paper is based on 1685 intelligent logistics related recruitment information collected from 51job.com, uses text mining technology, obtains the keywords of intelligent logistics talent demand through thesaurus optimization, word segmentation optimization, word frequency statistics and other methods, and draws a word cloud map for visual presentation. The extracted keywords are analyzed, and the detailed characteristics of the demand for intelligent logistics talents are further summarized from the aspects of business knowledge, information technology and basic quality, so as to provide a reference for the cultivation of intelligent logistics talents.
Key words: intelligent logistics; text mining; demand for talent