• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于知識(shí)圖譜的人才服務(wù)研究

      2021-07-28 06:02:34牛雨晨郭思妙周俊敏陳彥君
      關(guān)鍵詞:專家芯片人工智能

      牛雨晨 郭思妙 周俊敏 陳彥君

      DOI:10.16660/j.cnki.1674-098x.2011-5640-5706

      摘 要:本文立足于南京江北自貿(mào)區(qū)在芯片產(chǎn)業(yè)上的痛點(diǎn)—人工智能芯片,在招聘方法的基礎(chǔ)上,提出一種基于數(shù)據(jù)挖掘、文本主題提取、文本聚類分析等技術(shù)實(shí)現(xiàn)尋找、匹配合適人才的新模型:技術(shù)—專家模型。企業(yè)通過技術(shù)關(guān)鍵詞可以直接查詢對(duì)應(yīng)人才的相關(guān)信息,通過知識(shí)圖譜使技術(shù)-專家模型可視化,通過構(gòu)建網(wǎng)站實(shí)現(xiàn)人才與企業(yè)雙向匹配,從而更好地開展人才服務(wù)。

      關(guān)鍵詞:知識(shí)圖譜? 人才服務(wù) 數(shù)據(jù)挖掘? 南京江北自貿(mào)區(qū)

      中圖分類號(hào):c964? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? ? ? ? ? ? 文章編號(hào):1674-098X(2021)01(c)-0247-04

      Research on Talent Service Based on Knowledge Graph? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?—Take Jiangbei Free Trade Zone in Nanjing as an Instance

      NIU Yuchen? GUO Simiao? ZHOU Junmin? CHEN Yanjun

      (School of Economy and Management, Nanjing Tech University,Nanjing,Jiangsu Province,211800 China)

      Abstract: This article takes the shortfalls of chip industry in Jiangbei New Area:artificial intelligence chip, as an example. On the basis of the previous recruitment methods, this project proposes a new method to find talents with data mining, text subject extraction and text cluster analysis to establish technology—expert model. Enterprises can directly find professional talents who are good at the technology by technical keywords. The Knowledge Graph is established to visualize the model. In addition,we will establish a talent service website with the functions of retrieval and data analysis to realize the bidirectional matching between enterprises and professional talents so as to improve the level of talent services.

      Key Words: Knowledge Graph; Talent service; Data mining; Jiangbei Free Trade Zone in Nanjing

      2019年,中國(江蘇)自由貿(mào)易試驗(yàn)區(qū)南京片區(qū)(簡(jiǎn)稱江北自貿(mào)區(qū))正式成立,大力發(fā)展芯片產(chǎn)業(yè)。目前自貿(mào)區(qū)內(nèi)芯片產(chǎn)業(yè)已初具規(guī)模,但在人工智能芯片、大規(guī)模集成電路等領(lǐng)域仍存在技術(shù)難題,需要大量技術(shù)人才參與,因此,自貿(mào)區(qū)出臺(tái)了一系列人才服務(wù)政策來推動(dòng)人才引進(jìn)。

      目前企業(yè)主要通過公開招聘、內(nèi)部推薦、參加行業(yè)峰會(huì)等傳統(tǒng)方法引進(jìn)人才,具有很大的局限性。第一,耗費(fèi)較多時(shí)間與精力;第二,對(duì)人才全面考察的程度較淺,難以全面遴選人才;第三,尋找人才的范圍較為狹隘。已有的商業(yè)招聘網(wǎng)站主要針對(duì)普通人才,在尋找高端人才方面仍存在較大的空白。本文針對(duì)南京江北自貿(mào)區(qū)芯片企業(yè)高端人才引進(jìn)機(jī)制的痛點(diǎn),提出一種運(yùn)用大數(shù)據(jù)技術(shù)尋找高端人才的新模型,即建立技術(shù)-專家模型,企業(yè)通過技術(shù)關(guān)鍵詞能夠直接找到擅長(zhǎng)該項(xiàng)技術(shù)的人才,了解其詳細(xì)信息,并通過構(gòu)建知識(shí)圖譜將該模型可視化。該模型旨在挖掘?qū)<遗c技術(shù)間的深層次聯(lián)系,降低企業(yè)遴選專家的成本,提升企業(yè)與專家合作的深度和廣度,進(jìn)而促進(jìn)自貿(mào)區(qū)集成電路產(chǎn)業(yè)的發(fā)展。

      1? 相關(guān)研究

      挖掘技術(shù)與專家間的深層次聯(lián)系,歷來是數(shù)據(jù)分析領(lǐng)域的熱點(diǎn)研究主題。已有的研究成果主要集中在技術(shù)與專家間的聯(lián)系(專家知識(shí)網(wǎng))、專家間的聯(lián)系(專家聚集網(wǎng))兩方面。專家知識(shí)網(wǎng)方面,清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系教授唐杰率領(lǐng)團(tuán)隊(duì)建立了科技情報(bào)大數(shù)據(jù)挖掘與服務(wù)系統(tǒng)平臺(tái)AMiner[1],構(gòu)建科研人員、科技文獻(xiàn)、學(xué)術(shù)活動(dòng)之間的關(guān)聯(lián)關(guān)系,支持學(xué)者、論文文獻(xiàn)等學(xué)術(shù)信息資源檢索以及面向科技文獻(xiàn)、專利和科技新聞的搜索、分析等。專家聚集網(wǎng)方面,香港城市大學(xué)馬建團(tuán)隊(duì)的科研人員專業(yè)社區(qū)網(wǎng)絡(luò)服務(wù)平臺(tái)——科研之友[2],支持跨文獻(xiàn)庫檢索和保存科研論文成果、文獻(xiàn)和文件,與好友和群組共享信息和科研合作。

      2? 構(gòu)建技術(shù)-專家模型

      2.1 模型簡(jiǎn)介

      2.1.1 研究意義

      本文在已有研究成果的基礎(chǔ)上,提出構(gòu)建技術(shù)-專家模型。該模型除專家聚集網(wǎng)、專家知識(shí)網(wǎng)外,增加了知識(shí)聚集網(wǎng),提高了文本分析的精度。此外,深度學(xué)習(xí)提升了技術(shù)與專家之間的關(guān)聯(lián)的準(zhǔn)確性,提高了企業(yè)通過特定技術(shù)尋找到擅長(zhǎng)該項(xiàng)技術(shù)的專家的準(zhǔn)確性;語義關(guān)聯(lián)則分析專家之間的聯(lián)系,從而實(shí)現(xiàn)相似專家智能推薦功能,進(jìn)一步擴(kuò)大了企業(yè)尋找專家的范圍。模型運(yùn)用互聯(lián)網(wǎng)與大數(shù)據(jù)分析技術(shù),極大地降低了企業(yè)尋找人才的成本。

      2.1.2 構(gòu)成

      技術(shù)-專家模型由技術(shù)的內(nèi)在聯(lián)系(技術(shù)聚集網(wǎng))、技術(shù)與專家的聯(lián)系(專家知識(shí)網(wǎng))、專家間的聯(lián)系(專家聚集網(wǎng))三部分構(gòu)成,見圖1。技術(shù)的內(nèi)在聯(lián)系指不同的技術(shù)關(guān)鍵詞可以共同實(shí)現(xiàn)某項(xiàng)成果;技術(shù)與專家的聯(lián)系指通過某個(gè)技術(shù)關(guān)鍵詞可以找到擅長(zhǎng)該項(xiàng)技術(shù)的專家;專家之間的聯(lián)系指共同合作成果較多的專家組合。

      2.2 人才分類

      根據(jù)人才取得成果類型的不同,將人才分為研究型人才和應(yīng)用型人才兩種。理論型人才通常為知名高校教授、研究所研究員等從事理論研究的人才,通過分析文獻(xiàn)數(shù)據(jù)得到;實(shí)踐型人才為在相關(guān)技術(shù)領(lǐng)域擁有多項(xiàng)發(fā)明專利的人才,通過分析專利數(shù)據(jù)得到。對(duì)兩種人才考慮采取不同的合作方式,研究型人才考慮遠(yuǎn)程合作、研究成果共享等;應(yīng)用型人才則考慮引進(jìn)本地。挖掘兩種人才的過程類似,本部分以挖掘研究型人才為例,對(duì)整個(gè)過程進(jìn)行說明。

      2.3 數(shù)據(jù)處理

      數(shù)據(jù)處理的目標(biāo)是獲取數(shù)據(jù)并縮小文本主題,由與“人工智能”或“芯片”有關(guān)的文獻(xiàn)提取出主題是“人工智能芯片”的文獻(xiàn)。同時(shí)減小文本數(shù)量,將每篇文獻(xiàn)抽象為一個(gè)文獻(xiàn)信息列表。

      2.3.1 數(shù)據(jù)獲取

      在英文文獻(xiàn)數(shù)據(jù)庫SpringerLink中同時(shí)檢索“人工智能”和“芯片”兩個(gè)關(guān)鍵詞,得到與“人工智能”或“芯片”有關(guān)的文獻(xiàn)。下載搜索結(jié)果,字段包括標(biāo)題(Title)、作者(Authors)等字段,得到共計(jì)847條搜索結(jié)果。對(duì)搜索結(jié)果進(jìn)行作者詞頻統(tǒng)計(jì),原理是作者的出現(xiàn)頻數(shù)與該作者的研究領(lǐng)域和“人工智能芯片”的關(guān)聯(lián)性成正比。這樣,過濾掉那些發(fā)表文獻(xiàn)數(shù)量過少的作者的論文,可縮小文本主題范圍。

      2.3.2 LDA提取摘要主題詞

      在文獻(xiàn)數(shù)據(jù)庫中爬取每一位高頻作者的全部摘要和關(guān)鍵詞。用LDA文本主題模型提取摘要的主題詞,減小文本數(shù)量,將每篇文章抽象為一個(gè)包含LDA主題詞和關(guān)鍵詞的文獻(xiàn)信息列表。運(yùn)行LDA的步驟如下:第一步,對(duì)摘要預(yù)處理,去掉停用詞、標(biāo)點(diǎn);第二步,創(chuàng)建語料的詞語詞典,每個(gè)單獨(dú)的詞語都會(huì)被賦予一個(gè)索引,使用該詞典將語料轉(zhuǎn)換成DT矩陣。第三步,創(chuàng)建LDA模型對(duì)象并在DT矩陣上訓(xùn)練LDA模型。第四步,設(shè)置參數(shù)主題數(shù)量n、表示主題的詞數(shù)m,得到反應(yīng)出n種與可能主題相關(guān)的m個(gè)原文中的詞的多項(xiàng)式。第五步,對(duì)提取結(jié)果進(jìn)行數(shù)據(jù)清洗,去掉無關(guān)字符,只保留單詞,即原文中反映文章主題的詞[3]。本步共得到3501篇文獻(xiàn)的文獻(xiàn)信息列表。

      2.4 提取技術(shù)詞

      通過數(shù)據(jù)處理對(duì)數(shù)據(jù)做了初步分析,提取出與“人工智能芯片”有關(guān)文獻(xiàn)的主題詞和關(guān)鍵詞,但粒度較粗,結(jié)果中仍包含一些無關(guān)文獻(xiàn)。因此,需要對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步分析,提取出反映“人工智能芯片”相關(guān)技術(shù)的關(guān)鍵詞。此外,與“人工智能芯片”有關(guān)的技術(shù)關(guān)鍵詞分為不同類別,如“芯片制造”、“芯片設(shè)計(jì)”等與硬件相關(guān)的技術(shù)詞,及與“算法改進(jìn)”等軟件算法有關(guān)的技術(shù)詞,每一類的技術(shù)關(guān)鍵詞差異較大,應(yīng)當(dāng)分類提取、分析。采用K-means聚類算法對(duì)每篇文章根據(jù)LDA提取的主題詞進(jìn)行分類,對(duì)每一類中的每一篇文獻(xiàn),通過主題詞在文獻(xiàn)信息列表中匹配其對(duì)應(yīng)的關(guān)鍵詞,若上一步爬取時(shí)沒有爬取到關(guān)鍵詞,則取TextBlob算法提取的摘要中的詞組作為關(guān)鍵詞。分別對(duì)每一類的技術(shù)關(guān)鍵詞通過TF-IDF算法提取出高頻詞,作為每一類的技術(shù)關(guān)鍵詞[4]。

      將每篇文章的LDA提取的主題詞轉(zhuǎn)換為一個(gè)詞袋向量,并進(jìn)行降維處理轉(zhuǎn)換為二維向量,緩解維度災(zāi)難。接著通過K-means算法聚類提取出“與人工智能芯片技術(shù)有關(guān)“的文獻(xiàn),并分類提取分析技術(shù)關(guān)鍵詞。K-means將每一篇文獻(xiàn)根據(jù)詞袋向量間的文本相似度分成不同的類別,參數(shù)為分類數(shù)k,采用歐氏距離計(jì)算文本相似度。因?yàn)槌绦蛎看坞S機(jī)選擇的質(zhì)心不同,所以每次分類結(jié)果有細(xì)微差異。設(shè)置分類種數(shù)k=4,運(yùn)行算法,經(jīng)過平均10次迭代,得到聚類結(jié)果如表1所示。

      每類中權(quán)數(shù)較大的前5%的詞為候選技術(shù)關(guān)鍵詞。相同類別的技術(shù)關(guān)鍵詞反映了人工智能芯片有關(guān)技術(shù)中的某個(gè)子技術(shù)類,這些技術(shù)協(xié)同合作可共同實(shí)現(xiàn)該子技術(shù)類的成果,因此,可推導(dǎo)出技術(shù)-專家模型中技術(shù)間的聯(lián)系,即不同的技術(shù)關(guān)鍵詞可以共同實(shí)現(xiàn)某項(xiàng)成果[5]。

      2.5 人才畫像

      依次在文獻(xiàn)數(shù)據(jù)庫中搜索上一步得到的技術(shù)關(guān)鍵詞,對(duì)作者出現(xiàn)次數(shù)進(jìn)行詞頻統(tǒng)計(jì),選取每個(gè)技術(shù)關(guān)鍵詞發(fā)表文獻(xiàn)數(shù)量較多的作者為某一類技術(shù)的人才。依次搜索這些人才的全部文獻(xiàn),爬取這些文獻(xiàn)的關(guān)鍵詞,進(jìn)行詞頻統(tǒng)計(jì)并計(jì)算權(quán)重,得到人才技術(shù)畫像,推導(dǎo)出技術(shù)-專家模型中專家與技術(shù)間的聯(lián)系(專家技術(shù)網(wǎng))。爬取每一位人才的全部合作作者,根據(jù)頻數(shù)計(jì)算權(quán)重,推導(dǎo)出該模型中專家間的聯(lián)系(專家聚集網(wǎng))。

      2.6 挖掘?qū)嵺`人才

      一項(xiàng)專利的申請(qǐng)人一般是公司,而發(fā)明人一般是在該公司工作的個(gè)人。通過這個(gè)特點(diǎn),在專利數(shù)據(jù)庫中,將人工智能芯片行業(yè)前十強(qiáng)的企業(yè)作為專利申請(qǐng)人,查找專利發(fā)明人,可以實(shí)現(xiàn)行業(yè)頂尖企業(yè)——專利——人才的尋找過程。以專利號(hào)作為技術(shù)關(guān)鍵詞,建立人才畫像,下載分析結(jié)果,最終,合計(jì)建立了309個(gè)人才畫像。

      3? 技術(shù)-專家模型的應(yīng)用

      3.1 人才與技術(shù)的關(guān)聯(lián)

      通過淺層聯(lián)系進(jìn)行推斷,進(jìn)一步挖掘沒有從文本分析中挖掘出的人才與技術(shù)間的深層聯(lián)系。例如,技術(shù)間的聯(lián)系是,F(xiàn)PGA與MPSoc同屬一類技術(shù)詞,技術(shù)與人才間的聯(lián)系是專家A擅長(zhǎng)FPGA,人才間的聯(lián)系是人才A與人才B有多項(xiàng)合作專利。若某企業(yè)需要尋找擅長(zhǎng)MPSoc的人才,但通過文本挖掘沒有找到這類人才,通過上述聯(lián)系,可推導(dǎo)出人才B有一定的可能性擅長(zhǎng)MPSoc[6]。

      3.2 知識(shí)圖譜可視化

      完成人才畫像后,可以對(duì)研究型專家與應(yīng)用型專家建立專家知識(shí)圖譜,對(duì)兩類專家的專家知識(shí)網(wǎng)、專家聚集網(wǎng)、技術(shù)聚集網(wǎng)分別建立。專家聚集網(wǎng)、技術(shù)聚集網(wǎng)為一層結(jié)構(gòu),結(jié)點(diǎn)分別為專家和技術(shù),專家知識(shí)網(wǎng)為二層結(jié)構(gòu),第一層結(jié)點(diǎn)為技術(shù)關(guān)鍵詞,第二層結(jié)點(diǎn)為人才,展開關(guān)鍵詞結(jié)點(diǎn)可以顯示擅長(zhǎng)該技術(shù)的所有人才。兩個(gè)結(jié)點(diǎn)間連線的粗細(xì)與該結(jié)點(diǎn)間聯(lián)系的緊密程度成正比。這樣用戶可以有選擇性地查看技術(shù)-專家模型中的部分節(jié)點(diǎn),實(shí)現(xiàn)該模型的可交互可視化。

      3.3 構(gòu)建專家與企業(yè)雙向匹配的網(wǎng)站

      作為對(duì)模型的實(shí)際應(yīng)用,建立一個(gè)促進(jìn)專家與企業(yè)雙向匹配的網(wǎng)站。網(wǎng)站功能分為兩部分:第一,企業(yè)尋找專家。公司可以自己選擇檢索數(shù)據(jù)庫的類型,在網(wǎng)站首頁將技術(shù)關(guān)鍵詞、專利號(hào)分類、文獻(xiàn)名、作者等輸入到自定義搜索字段,網(wǎng)站將調(diào)用一系列算法,輸出擅長(zhǎng)該項(xiàng)技術(shù)的專家,同時(shí)提供一系列可視化圖表。第二,專家尋找企業(yè),如果會(huì)某種技術(shù)的專家想找一個(gè)公司與其合作,在搜索欄中輸入技術(shù)名、企業(yè)即可,使專家能夠更好地尋找企業(yè)。網(wǎng)站還支持企業(yè)發(fā)布技術(shù)需求與專家發(fā)布簡(jiǎn)歷,網(wǎng)站首頁可根據(jù)搜索歷史智能推薦專家或企業(yè)。這樣,本網(wǎng)站能夠成功地幫助實(shí)現(xiàn)企業(yè)與專家間的雙向匹配,實(shí)現(xiàn)了技術(shù)-專家模型的實(shí)際應(yīng)用。

      4? 結(jié)語

      人才的引進(jìn)對(duì)江北自貿(mào)區(qū)的發(fā)展有著至關(guān)重要的作用,是一個(gè)長(zhǎng)期、發(fā)展的過程。本文提出的技術(shù)-專家匹配方法仍在實(shí)踐使用中。后續(xù)計(jì)劃將這種方法的使用范圍從集成電路行業(yè)擴(kuò)展到其他行業(yè),從江北自貿(mào)區(qū)逐漸擴(kuò)展到全國其他地區(qū)。

      參考文獻(xiàn)

      [1] WAN HUAIYU,ZHANG YUTAO,ZHANG JING,etal. AMiner: Search and Mining of Academic Social Networks[J]. Data Intelligence,2019:58-76

      [2] JIAN MA, WEI XU, YONG-HONG SUN,etal.An Ontology-Based Text-Mining Method to Cluster Proposals for Research Project Selection[J]. IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS—PART A: SYSTEMS AND HUMANS, 2012 ,VOL. 42, NO. 3:784-790

      [3] 劉昕,白婷婷,張淯舒,等.基于 EA-LDA 算法的領(lǐng)域知識(shí)圖譜潛在關(guān)系擴(kuò)展[J]. 計(jì)算機(jī)工程,2020

      [4] 張斌.交叉學(xué)科主題探究:從主題聚類視角[J]. 情報(bào)科學(xué),2020(38):49-55.

      [5] 鄭飛,韋德壕,黃勝.基于LDA和深度學(xué)習(xí)的文本分類方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2020(8):2184-2189.

      [6] 朱光,劉蕾,李鳳景. 基于LDA和LSTM模型的研究主題關(guān)聯(lián)與預(yù)測(cè)研究——以隱私研究為例[J].現(xiàn)代情報(bào),2020(8):38-50.

      猜你喜歡
      專家芯片人工智能
      致謝審稿專家
      2019:人工智能
      商界(2019年12期)2019-01-03 06:59:05
      人工智能與就業(yè)
      數(shù)讀人工智能
      小康(2017年16期)2017-06-07 09:00:59
      芯片測(cè)試
      下一幕,人工智能!
      請(qǐng)叫我專家
      多通道采樣芯片ADS8556在光伏并網(wǎng)中的應(yīng)用
      專家面對(duì)面
      74HC164芯片的應(yīng)用
      河南科技(2014年10期)2014-02-27 14:09:18
      化隆| 贵定县| 临海市| 来宾市| 乌拉特后旗| 桃源县| 安平县| 瑞安市| 沙坪坝区| 保山市| 昔阳县| 肃宁县| 开原市| 新郑市| 雷山县| 四平市| 榕江县| 启东市| 自治县| 井陉县| 马边| 西峡县| 苏州市| 德令哈市| 黄平县| 莲花县| 宁安市| 临汾市| 巩留县| 呈贡县| 镇平县| 上蔡县| 泉州市| 新平| 海口市| 临武县| 凭祥市| 樟树市| 庆安县| 高碑店市| 乳源|