文/江勇
人才大數(shù)據(jù)綜合架構(gòu)及應(yīng)用研究
文/江勇
本文作者江勇
2015年,全球產(chǎn)生約8.6ZB的數(shù)據(jù),該數(shù)據(jù)量正在以每年約50%的速度增長。以領(lǐng)英(LinkedIn)為例,該機(jī)構(gòu)全球會員數(shù)已超過4億人,《財(cái)富》世界500強(qiáng)中每個(gè)公司均有高管加入該平臺。構(gòu)建聚集效應(yīng)下的人才機(jī)制,合理化配置人才資源,已成為國家創(chuàng)新、產(chǎn)業(yè)聯(lián)動和組織協(xié)同發(fā)展的必備要素。
人才大數(shù)據(jù)的內(nèi)涵。人才大數(shù)據(jù),一般是指人才成長過程中產(chǎn)生大量有價(jià)值的信息,這些信息構(gòu)成特定的成長軌跡。運(yùn)用現(xiàn)代信息技術(shù),將人們在成長和受教育階段中產(chǎn)生的各種有效信息以結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)的形態(tài)進(jìn)行采集和存儲。
人才大數(shù)據(jù)的外延。人才大數(shù)據(jù)一方面通過科學(xué)模型和人工智能來幫助組織機(jī)構(gòu)進(jìn)行職位匹配,另一方面構(gòu)建動態(tài)機(jī)制下的人才服務(wù)系統(tǒng),從關(guān)鍵詞篩選到精準(zhǔn)匹配,同時(shí)引導(dǎo)用戶通過手機(jī)移動端,參與在線考評和個(gè)人信息更新。
人才大數(shù)據(jù)來源。人才大數(shù)據(jù)來自各種渠道,其數(shù)據(jù)的格式和起源各不相同,擁有結(jié)構(gòu)化、半結(jié)構(gòu)化或非結(jié)構(gòu)化的各類數(shù)據(jù),數(shù)據(jù)到達(dá)的速度和傳送速率都會因數(shù)據(jù)源不同而不同,收集數(shù)據(jù)的位置或直接或間接,分別以實(shí)時(shí)或以批量模式進(jìn)行收集。以下列舉人才大數(shù)據(jù)的主要來源:組織遺留系統(tǒng)屬于組織內(nèi)部應(yīng)用程序,執(zhí)行業(yè)務(wù)需要的分析并獲取需要的洞察,其中包括客戶關(guān)系管理系統(tǒng)(CRM)、用戶結(jié)算操作和企業(yè)資源規(guī)劃(ERP)系統(tǒng)等,這些系統(tǒng)中包含各種類型的人才數(shù)據(jù)。人才數(shù)據(jù)管理系統(tǒng)(HDMS)存儲邏輯數(shù)據(jù)、流程、策略和各種其他類型的文檔,具體包含各種文檔和電子表格,這些文檔可以轉(zhuǎn)換為可用于分析的結(jié)構(gòu)化數(shù)據(jù),在某種程度上也可以公開為領(lǐng)域?qū)嶓w。人才數(shù)據(jù)存儲包含數(shù)據(jù)倉庫、操作數(shù)據(jù)庫和事務(wù)數(shù)據(jù)庫,此數(shù)據(jù)通常是結(jié)構(gòu)化數(shù)據(jù),可直接使用或輕松地轉(zhuǎn)換來滿足需求。
人才大數(shù)據(jù)分布式存儲。包含改動和存儲兩個(gè)動作,主要是從各種數(shù)據(jù)源獲取數(shù)據(jù),并在必要時(shí),將它轉(zhuǎn)換為適合數(shù)據(jù)分析方式的格式。
人才大數(shù)據(jù)分析和使用。分析層的主要作用是讀取數(shù)據(jù)改動和存儲層整理(digest)的數(shù)據(jù)。設(shè)計(jì)分析層需要認(rèn)真地進(jìn)行事先籌劃和規(guī)劃,進(jìn)而制定系列決策保證如何從海量的人才大數(shù)據(jù)中獲得洞察、并且找到所需的實(shí)體,進(jìn)而有效理解并執(zhí)行分析需要哪些算法和工具。
基于廣泛適用性的人才數(shù)據(jù)的應(yīng)用平臺,能夠從社交網(wǎng)站、學(xué)術(shù)平臺以及研究機(jī)構(gòu)進(jìn)行分門別類的數(shù)據(jù)采集,實(shí)施有效的數(shù)據(jù)管理。包含數(shù)據(jù)合并、數(shù)據(jù)提取和智能分析。智能分析環(huán)節(jié),人才數(shù)據(jù)平臺可以進(jìn)行用戶、年齡、社會關(guān)系識別,并依照研究能力、創(chuàng)新能力、創(chuàng)業(yè)能力對各級人才進(jìn)行打分,以準(zhǔn)確、實(shí)時(shí)、有效的人才機(jī)制為組織機(jī)構(gòu)和社會提供深度服務(wù)。
針對專家學(xué)者的人才大數(shù)據(jù)管理及應(yīng)用服務(wù),能夠?qū)崿F(xiàn)學(xué)術(shù)內(nèi)容搜索、學(xué)術(shù)空間架構(gòu)和學(xué)術(shù)推薦等系列服務(wù)。隨著科技不斷成熟,人才大數(shù)據(jù)會成為常態(tài),以跨界合作、模式創(chuàng)新為切入點(diǎn),分享國內(nèi)外聯(lián)合研發(fā)的智慧和經(jīng)驗(yàn)。
未來研究中,能夠通過個(gè)體信息的規(guī)?;占⒔Y(jié)構(gòu)化分析、數(shù)據(jù)化整合和深度挖掘,構(gòu)建真實(shí)有效的人才畫像,為各類組織機(jī)構(gòu)提供基于個(gè)性化信息的搜索、挖掘與人才應(yīng)用,實(shí)現(xiàn)用戶洞察、市場分析和個(gè)性化客服等諸多服務(wù)。
(作者單位:清華大學(xué)深圳研究生院)