梁亞玲,高 銘
(江漢大學(xué) 商學(xué)院,武漢 430056)
信息技術(shù)的發(fā)展帶來(lái)了數(shù)據(jù)量爆發(fā)式的增長(zhǎng),“互聯(lián)網(wǎng)+”模式逐漸成為主流,如今大數(shù)據(jù)應(yīng)用已經(jīng)滲透到各個(gè)行業(yè)的各種業(yè)務(wù)模式之中。中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布的《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,截至2020年12月,我國(guó)網(wǎng)民規(guī)模達(dá)9.89億,較2020 年3 月增長(zhǎng)8540 萬(wàn),互聯(lián)網(wǎng)普及率達(dá)70.4%。
新冠疫情進(jìn)入常態(tài)化以來(lái),大數(shù)據(jù)技術(shù)幾乎應(yīng)用于全球范圍內(nèi)各個(gè)領(lǐng)域與各個(gè)行業(yè)中,進(jìn)一步擴(kuò)大了市場(chǎng)對(duì)于數(shù)字化人才的需求。根據(jù)領(lǐng)英人才報(bào)告庫(kù)發(fā)布的《全球數(shù)字人才發(fā)展年度報(bào)告(2020)》顯示,歐洲有將近一半的數(shù)字化人才流向亞太地區(qū),這也間接表明了亞太地區(qū)數(shù)字經(jīng)濟(jì)的發(fā)展活力。在“第十四個(gè)五年規(guī)劃”提出之后,政府也陸續(xù)出臺(tái)了相關(guān)政策推進(jìn)大數(shù)據(jù)行業(yè)的發(fā)展與傳統(tǒng)行業(yè)的數(shù)字化轉(zhuǎn)型,導(dǎo)致不同領(lǐng)域?qū)?shù)字化人才需求的側(cè)重點(diǎn)與要求出現(xiàn)了非常大的差異。
中國(guó)信通院《2021 年中國(guó)數(shù)字經(jīng)濟(jì)就業(yè)發(fā)展研究報(bào)告》指出:產(chǎn)業(yè)數(shù)字化領(lǐng)域招聘人數(shù)占總招聘人數(shù)的75.8%。數(shù)據(jù)經(jīng)濟(jì)大力發(fā)展的同時(shí),進(jìn)一步擴(kuò)大了數(shù)字化人才的需求缺口,目前國(guó)內(nèi)大數(shù)據(jù)產(chǎn)業(yè)主要集中在東部沿海地區(qū),與之相比中西部地區(qū)的數(shù)字化經(jīng)濟(jì)發(fā)展則相對(duì)落后。數(shù)字經(jīng)濟(jì)發(fā)展的不平衡也說(shuō)明了整個(gè)大數(shù)據(jù)行業(yè)缺乏明確的發(fā)展方向與規(guī)劃,而根本原因是已有人才在數(shù)量與質(zhì)量上都不能滿足數(shù)字化發(fā)展的需求,制約了數(shù)字經(jīng)濟(jì)的發(fā)展。
一般認(rèn)為掌握ICT(信息與通信技術(shù))相關(guān)技能并能夠運(yùn)用的人就是數(shù)字化人才,但這樣的定義是不充分、不全面的。本文認(rèn)為,2019 年怡安翰威特咨詢公司提出的“數(shù)字化人才”概念對(duì)數(shù)字化人才的定義是比較符合企業(yè)需求的。該公司認(rèn)為,僅有優(yōu)秀ICT技能的技術(shù)人員并不足以滿足企業(yè)的數(shù)字化變革需求,在企業(yè)中一般要求員工具有真正匹配數(shù)字化時(shí)代的勝任力——由于職能的不同,未必需要其掌握數(shù)字化的技術(shù),但必須具有數(shù)字化的思維與特質(zhì)。怡安翰威特咨詢公司發(fā)布的數(shù)字化勝任力模型指出:數(shù)字化人才有三大勝任力,即學(xué)習(xí)能力、靈活性與好奇心,以及八大輔助勝任力即成功的意愿、數(shù)據(jù)處理能力,解決問(wèn)題的策略、商業(yè)敏銳度、遠(yuǎn)程協(xié)作、數(shù)字化溝通、毅力以及樂(lè)于助人的品質(zhì),這些,都是數(shù)字化人才的“軟實(shí)力”。
數(shù)字化人才不僅需要懂得相關(guān)的技能,同時(shí)還要掌握統(tǒng)計(jì)學(xué)、管理學(xué)等方面的知識(shí)。數(shù)字化人才培養(yǎng)過(guò)程漫長(zhǎng),同時(shí)又會(huì)涉及多個(gè)學(xué)科交叉的過(guò)程,而企業(yè)的培養(yǎng)模式通常都不夠成熟和系統(tǒng)。不少企業(yè)員工都是邊工作邊學(xué)習(xí)相關(guān)的培訓(xùn)課程,而且企業(yè)培訓(xùn)的進(jìn)度安排較為緊湊,沒(méi)有考慮到員工能否掌握。同時(shí),大數(shù)據(jù)相關(guān)的知識(shí)體系非常復(fù)雜,對(duì)員工開(kāi)展在職培訓(xùn)也很難收到實(shí)質(zhì)性的效果。
目前大多數(shù)高校大數(shù)據(jù)專(zhuān)業(yè)是新設(shè)立的,對(duì)于使用的教材與教師講授的內(nèi)容沒(méi)有明確的規(guī)劃。同時(shí)在講授過(guò)程中也不夠注重實(shí)踐,課堂上缺乏項(xiàng)目來(lái)引導(dǎo)學(xué)生的興趣,學(xué)生往往在結(jié)課時(shí)才能有系統(tǒng)的實(shí)驗(yàn)課程來(lái)練手,導(dǎo)致許多大數(shù)據(jù)專(zhuān)業(yè)的學(xué)生往往對(duì)于相關(guān)理論概念有印象,但是對(duì)于企業(yè)中真正的大數(shù)據(jù)處理與分析的具體流程與相關(guān)技能要求一知半解。事實(shí)上,學(xué)生在缺少實(shí)際應(yīng)用場(chǎng)景的學(xué)習(xí)模式下,通過(guò)書(shū)本去學(xué)習(xí)大數(shù)據(jù)本身就是一個(gè)問(wèn)題,從而導(dǎo)致高校培養(yǎng)的畢業(yè)生往往不能滿足企業(yè)的用人需求,企業(yè)需要進(jìn)行漫長(zhǎng)的二次培養(yǎng)。
本文綜合考慮招聘網(wǎng)站的權(quán)威性、抓取難度后,以“大數(shù)據(jù)”為檢索關(guān)鍵字從51job 上搜索招聘信息。本文的研究方案主要從以下五個(gè)方面進(jìn)行:第一,對(duì)獲得的數(shù)據(jù)進(jìn)行清洗,去除無(wú)效、非結(jié)構(gòu)化數(shù)據(jù);第二,再對(duì)招聘信息的崗位描述進(jìn)行文本整合,通過(guò)python 進(jìn)行分詞處理,提取出頻率最高的關(guān)鍵詞;第三,運(yùn)用數(shù)據(jù)挖掘技術(shù)對(duì)相應(yīng)關(guān)鍵詞進(jìn)行詞頻統(tǒng)計(jì)并以K-means算法對(duì)關(guān)鍵詞進(jìn)行聚類(lèi)分析;第四,運(yùn)用FineBI 數(shù)據(jù)可視化工具進(jìn)行數(shù)據(jù)可視化;第五,對(duì)上述結(jié)果進(jìn)行相應(yīng)分析。
本文為保證數(shù)據(jù)量的可靠性,通過(guò)自己編寫(xiě)程序抓取了51job 上59 222 條原始數(shù)據(jù),通過(guò)Excel 對(duì)所得信息進(jìn)行清洗,保留按“月”顯示的工資信息;工作地點(diǎn)為具體城市;工作經(jīng)驗(yàn)為:年、無(wú)須經(jīng)驗(yàn)、在校生/應(yīng)屆生;學(xué)歷要求為:博士、碩士、本科、大專(zhuān)、高中、初中及以下的數(shù)據(jù),最后對(duì)重復(fù)值進(jìn)行刪除,保留清洗后的44 663 條數(shù)據(jù)。
對(duì)清洗后數(shù)據(jù)“崗位描述”字段進(jìn)行文本整合,將整合好的文本內(nèi)容進(jìn)行預(yù)處理,包括更新詞表、分詞、詞頻統(tǒng)計(jì)等過(guò)程,保留詞頻大于100 的關(guān)鍵詞81 個(gè)。
采用K-means 聚類(lèi)算法進(jìn)行聚類(lèi)分析,在使用該算法進(jìn)行分析之前需要將文本進(jìn)行向量化處理,所以本文使用TF-IDF(逆文檔頻率)算法來(lái)實(shí)現(xiàn)文本信息的向量化,例如,tf 代表詞頻,對(duì)于某一關(guān)鍵詞t來(lái)說(shuō),它的詞頻計(jì)算公式如下:
逆向文本頻率idf 如果包含詞條t 的文檔越少,idf 越大,說(shuō)明詞條具有很好的類(lèi)別區(qū)分能力。其中|D|代表劃分的文件總數(shù),|D|代表包含關(guān)鍵詞ti 的文件數(shù)目,公式如下:
最后計(jì)算出t的權(quán)重,公式如下:
對(duì)于K-means 算法,其中K 的值代表聚類(lèi)的數(shù)量,本文設(shè)置為4,分別為:業(yè)務(wù)能力、技能要求、專(zhuān)業(yè)及學(xué)歷要求、個(gè)人素質(zhì)相關(guān)要求。
目前來(lái)說(shuō),大數(shù)據(jù)的主要應(yīng)用領(lǐng)域依舊為計(jì)算機(jī)軟件行業(yè),占比大致為27.16%,但是對(duì)比以前,占比已經(jīng)大幅度下降。電子商務(wù)、房地產(chǎn)、網(wǎng)絡(luò)通信、金融類(lèi)、教育、零售業(yè)等行業(yè)對(duì)于數(shù)字化人才的需求大幅度增加,其中金融類(lèi)行業(yè)占比達(dá)到2.37%,對(duì)高校商學(xué)院畢業(yè)生來(lái)說(shuō)也是一個(gè)新的就業(yè)方向,如圖1 所示。
圖1 招聘行業(yè)分布圖
同時(shí),在疫情的影響下,教育、醫(yī)療、電子商務(wù)、金融等行業(yè)對(duì)于數(shù)字化人才的需求增加。疫情期間,線上辦公、學(xué)習(xí)使得線上作業(yè)成為一種常態(tài);疫情后像京東等大型企業(yè)也開(kāi)始進(jìn)軍“互聯(lián)網(wǎng)+”醫(yī)療領(lǐng)域;而電子商務(wù)在這次疫情中充分發(fā)揮了自身優(yōu)勢(shì),許多新用戶開(kāi)始網(wǎng)上購(gòu)物,用戶數(shù)量的激增加速了電子商務(wù)數(shù)字化的發(fā)展;對(duì)金融行業(yè)來(lái)說(shuō),由于疫情原因,90%以上的業(yè)務(wù)都需要通過(guò)線上的渠道完成,進(jìn)一步推動(dòng)了行業(yè)的數(shù)字化轉(zhuǎn)型。
數(shù)字化崗位在全國(guó)的分布不是非常廣泛,全國(guó)大數(shù)據(jù)發(fā)展中心集中在長(zhǎng)三角、珠三角地區(qū),其中人才需求數(shù)量最多的8 個(gè)城市為:上海、深圳、廣州、北京、南京、成都、武漢、杭州。由于國(guó)家對(duì)受疫情影響企業(yè)的扶持以及“十四五”規(guī)劃的實(shí)施,在2020 年,武漢借助國(guó)家與湖北省的支持,大力發(fā)展新興行業(yè),提供了大量的數(shù)字化就業(yè)崗位,同時(shí)通過(guò)降低畢業(yè)生的生活成本與創(chuàng)業(yè)成本,使得更多武漢畢業(yè)生愿意留漢工作創(chuàng)業(yè)。
本文繪制在不同工作經(jīng)驗(yàn)區(qū)間的薪資分布圖來(lái)分析大數(shù)據(jù)崗位招聘對(duì)于工作經(jīng)驗(yàn)的偏好,如圖2、圖3 所示。數(shù)字化相關(guān)崗位對(duì)于應(yīng)聘者無(wú)經(jīng)驗(yàn)數(shù)量占比為31.4%,薪資主要分布在6 000~ 15 000 元/月,良好的薪資待遇一定程度上說(shuō)明了疫情之后全國(guó)范圍對(duì)于數(shù)字化崗位需求的迫切程度。而對(duì)于需要經(jīng)驗(yàn)的崗位,需求主要集中在3~ 4 年工作經(jīng)驗(yàn),同時(shí)薪資10 000~ 20 000 元/月之間的人數(shù)占比超過(guò)一半,從用人成本上來(lái)說(shuō),3~ 4年經(jīng)驗(yàn)人才也更容易令企業(yè)接受。工作經(jīng)驗(yàn)在5~ 7 年的需求人數(shù)大幅度減少,但是相應(yīng)的薪資也是遠(yuǎn)遠(yuǎn)高于其他工作經(jīng)驗(yàn)區(qū)間,其中最高能達(dá)到40 000 元/月??偨Y(jié)來(lái)說(shuō),數(shù)字化人才的需求缺口非常之大,導(dǎo)致對(duì)于工作經(jīng)驗(yàn)的要求不是很看重的同時(shí)薪資福利非??捎^。
圖2 數(shù)字化人才工作經(jīng)驗(yàn)與薪資分布圖
圖3 數(shù)字化相關(guān)崗位經(jīng)驗(yàn)分布圖
在學(xué)歷方面,大專(zhuān)和本科的需求數(shù)量占據(jù)了整個(gè)需求的93.9%,其中對(duì)大專(zhuān)學(xué)歷的需求達(dá)到32.94%,對(duì)互聯(lián)網(wǎng)行業(yè)來(lái)說(shuō)是罕見(jiàn)的,說(shuō)明企業(yè)往往難以招聘到足夠的人才。但其對(duì)于人才也具有一定的技能性要求和學(xué)習(xí)能力的偏好;而碩士與博士?jī)H占3.31%,主要集中在涉及算法的崗位,其對(duì)于專(zhuān)業(yè)技能的掌握程度有更嚴(yán)格的要求。如圖4 所示。
圖4 數(shù)字化相關(guān)崗位學(xué)歷要求占比
總結(jié)來(lái)說(shuō),數(shù)字化人才的缺口導(dǎo)致企業(yè)對(duì)招聘學(xué)歷的要求不像以前一樣嚴(yán)格,企業(yè)更加看重人才的綜合能力。
3.5.1 數(shù)字化人才整體技能要求
本文通過(guò)自定義分詞的方式對(duì)招聘描述文本信息進(jìn)行分詞處理,選取了英文詞頻數(shù)前28 個(gè)與中文詞頻數(shù)前53個(gè)關(guān)鍵詞通過(guò)FineBI生成詞云圖,如圖5所示。數(shù)字化崗位更加看重人才是否具備經(jīng)驗(yàn),包含學(xué)習(xí)、工作經(jīng)驗(yàn),以及生活中的人際交往與團(tuán)隊(duì)協(xié)作等方面的經(jīng)驗(yàn)。同時(shí),對(duì)于“開(kāi)發(fā)”能力也有一定要求??偟膩?lái)說(shuō),數(shù)字化相關(guān)的崗位不僅僅只看專(zhuān)業(yè)技能,也注重個(gè)人綜合素質(zhì)。
圖5 數(shù)字化相關(guān)崗位整體能力要求
3.5.2 數(shù)字化崗位高頻率的技能需求分析
使用技能分類(lèi)關(guān)鍵詞生成詞云,如圖6 所示。其中數(shù)據(jù)庫(kù)出現(xiàn)的次數(shù)最多,說(shuō)明對(duì)于數(shù)據(jù)處理、分析方面的要求比較高,除了SQL 相關(guān)基礎(chǔ)技能外,對(duì)于hadoop、python、spark、redis 等大數(shù)據(jù)處理工具也要求掌握。在編程語(yǔ)言方面,對(duì)人才的編程能力要求不高,工作中大多使用java 與python,但是對(duì)于算法方面會(huì)有一定的要求??偨Y(jié)來(lái)說(shuō),數(shù)字化行業(yè)進(jìn)入門(mén)檻不高。
圖6 數(shù)字化相關(guān)崗位高頻技能
3.5.3 數(shù)字化崗位綜合素質(zhì)需求分析
通過(guò)對(duì)綜合能力類(lèi)的關(guān)鍵詞生成詞云,如圖7 所示。大多數(shù)企業(yè)更加喜歡招聘具有相關(guān)經(jīng)驗(yàn)的人才來(lái)減少企業(yè)的用人成本;同時(shí)要求應(yīng)聘者能夠通過(guò)團(tuán)隊(duì)合作溝通來(lái)快速完成崗位工作;硬性要求具備相應(yīng)的分析能力,需要對(duì)公司的業(yè)務(wù)與客戶的需求能深度理解,能夠通過(guò)分析、處理、團(tuán)隊(duì)協(xié)作來(lái)解決相應(yīng)的問(wèn)題。
圖7 數(shù)字化崗位綜合素質(zhì)要求
大多數(shù)企業(yè)對(duì)數(shù)字化人才的專(zhuān)業(yè)技能掌握程度要求不高,更多聚焦在綜合素質(zhì)方面。在2016 年中國(guó)首次設(shè)立大數(shù)據(jù)專(zhuān)業(yè)時(shí),僅僅只有3 所高校設(shè)立該專(zhuān)業(yè),到目前全國(guó)大部分高校都相繼設(shè)立了大數(shù)據(jù)專(zhuān)業(yè),足以看出大數(shù)據(jù)未來(lái)的發(fā)展趨勢(shì)。但目前企業(yè)招聘的數(shù)字化人才中大部分都是計(jì)算機(jī)類(lèi)專(zhuān)業(yè)的學(xué)生,讓他們通過(guò)短期的崗前培訓(xùn)來(lái)填補(bǔ)數(shù)字化崗位的缺口。高校培養(yǎng)的人才數(shù)量、質(zhì)量遠(yuǎn)遠(yuǎn)達(dá)不到預(yù)期。
本文研究發(fā)現(xiàn):企業(yè)對(duì)人才招聘的注重點(diǎn)更偏向于招收具有相關(guān)經(jīng)驗(yàn)的人才,用以減少企業(yè)的培養(yǎng)成本;相較于傳統(tǒng)互聯(lián)網(wǎng)行業(yè)來(lái)說(shuō),企業(yè)對(duì)于專(zhuān)業(yè)技能掌握程度的要求并不是很高,更注重人才的綜合素質(zhì)以及工作中的分析、處理問(wèn)題能力。但目前高校培養(yǎng)人才過(guò)于注重理論學(xué)習(xí),導(dǎo)致畢業(yè)生沒(méi)有相應(yīng)的項(xiàng)目經(jīng)驗(yàn),而且許多高校的大數(shù)據(jù)專(zhuān)業(yè)往往都是在原有信息管理或計(jì)算機(jī)相關(guān)專(zhuān)業(yè)的基礎(chǔ)上設(shè)立,相關(guān)課程的設(shè)置不夠合理、科學(xué)。
高校應(yīng)當(dāng)是數(shù)字化人才的培養(yǎng)基地,培養(yǎng)的畢業(yè)生除了具有基礎(chǔ)知識(shí),還要具有一定的實(shí)踐能力。如果剛畢業(yè)就能滿足企業(yè)中低崗位的從業(yè)要求,即有一定的實(shí)際應(yīng)用能力,那么就會(huì)具有相當(dāng)?shù)母?jìng)爭(zhēng)力。這種實(shí)際應(yīng)用能力可以通過(guò)參與具體的大數(shù)據(jù)開(kāi)發(fā)項(xiàng)目獲得。因此本文提出以下建議。
(1)高校需要時(shí)刻關(guān)注新技術(shù)的發(fā)展與應(yīng)用,及時(shí)關(guān)注企業(yè)的需求,適時(shí)調(diào)整人才培養(yǎng)計(jì)劃,并同步進(jìn)行新學(xué)科、新專(zhuān)業(yè)建設(shè)。
(2)在不放松理論基礎(chǔ)知識(shí)教育的同時(shí),增加應(yīng)用能力培養(yǎng)。理論基礎(chǔ)知識(shí)對(duì)于人才的綜合素養(yǎng)與發(fā)展?jié)摿τ兄匾饬x,不能削弱,但如果不具備實(shí)際應(yīng)用能力,進(jìn)入企業(yè)還需要再培訓(xùn),則畢業(yè)生的競(jìng)爭(zhēng)力有限。應(yīng)用能力培養(yǎng)可以通過(guò)具體的項(xiàng)目實(shí)施完成,這樣不僅能提高學(xué)生對(duì)于課程的興趣,更能提升對(duì)專(zhuān)業(yè)技能的認(rèn)識(shí)。
(3)大數(shù)據(jù)的應(yīng)用十分廣泛,在專(zhuān)業(yè)建設(shè)時(shí)可設(shè)置多個(gè)發(fā)展方向,教學(xué)方面則對(duì)應(yīng)不同的側(cè)重點(diǎn),例如,數(shù)據(jù)的采集與可視化方向、數(shù)據(jù)的分析與挖掘方向、機(jī)器學(xué)習(xí)與深度算法方向。
(4)高校可加強(qiáng)與企業(yè)之間的深度合作,使得地方企業(yè)成為高校人才的實(shí)踐基地,培養(yǎng)學(xué)生的實(shí)踐能力與項(xiàng)目經(jīng)驗(yàn)。
(5)高校應(yīng)重視學(xué)生職業(yè)規(guī)劃教育,引導(dǎo)學(xué)生在實(shí)踐的過(guò)程中積累工作、生活經(jīng)驗(yàn),提升自身綜合能力,完善職業(yè)生涯規(guī)劃。