李慧妍
摘要:近年來,我國電子信息科學領域研究發(fā)展迅速,電子信息科學類學科的研究成果顯著。本文通過分析電子信息科學領域的研究熱點、主題演化趨勢,為研究者及時把握學科發(fā)展動向,緊跟學術前沿,加強交流合作提供參考。該文以國內十種電子信息科學領域的核心期刊在2011-2020年間刊發(fā)的論文為數(shù)據(jù)源,采用文獻計量分析、VOSviewer繪制知識圖譜等方法對相關數(shù)據(jù)進行統(tǒng)計與分析,進而探究此領域的研究熱點以及主題演化趨勢。研究發(fā)現(xiàn),電子信息科學領域近十年的研究熱點主要包含無線傳感器網(wǎng)絡、云計算、深度學習、遺傳算法和壓縮感知等主題;根據(jù)同質性差異和共現(xiàn)次數(shù),可以將電子信息科學領域的研究主題聚類為六大簇,分別以無線傳感器網(wǎng)絡、云計算等為中心點;2011-2020年電子信息科學領域的理論、技術研究經(jīng)歷了從發(fā)展到完善,不斷探究新理論、新技術的過程,隱私保護、深度學習等將成為未來一段時間內的研究熱點。
關鍵詞:電子信息科學;文獻計量學;知識圖譜;研究熱點;主題演化;VOSviewer
中圖分類號:G642? ? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)13-0224-03
1引言
電子信息科學是涉及電子科學、通信和計算機技術等多學科交叉的綜合性研究領域,包含信息安全、微電子學、光信息科學與技術和電子信息科學與技術等具體專業(yè)。近年來,我國電子信息科學領域的研究發(fā)展迅速,但仍有較大的進步空間。及時把握領域研究的發(fā)展動向,洞察研究熱點的演化趨勢,對科研人員明晰研究方向具有參考意義。
羅宇文(2013)[1]提出電子信息技術在不同領域的技術需求差別很大, 這些應用特點決定了各自的發(fā)展方向。在微電子技術高集成化發(fā)展方向中,他指出采用納米集成技術的arm、fpga、asic、dsp等嵌入式產(chǎn)品在電子產(chǎn)品中得到了廣泛應用。
張璇,蘇楠等(2012)[2]以2000-2011年Web of Science數(shù)據(jù)庫收錄的3000篇國際電子政務研究文獻為樣本,利用CiteSpace和VOSviewer繪制出科學知識圖譜,將國際電子政務研究歸為電子政務技術應用創(chuàng)新研究、電子政務管理實踐研究、電子政務用戶服務研究三個大類。李躍艷,王昊等(2020)[3]以SIGIR年會2008-2019年的錄用論文為數(shù)據(jù)源,采用Python中的工具包構建LDA模型并生成主題,并使用Gephi軟件分析了近十年信息檢索領域研究主題的演化路徑。文獻計量學、知識圖譜等方法在不同學科領域知識發(fā)現(xiàn)、主題演化、熱點探析等方面有較廣泛的應用。
目前,關于電子信息科學領域發(fā)展的研究很多,但大部分關注電子信息學科的實踐應用特點和專業(yè)課程體系和人才培養(yǎng)模式,且停留在較為宏觀的層面上,對電子信息科學的發(fā)展方向和研究熱點的研究較少。因此,本文以國內電子信息科學領域核心期刊近十年錄用的論文為數(shù)據(jù)源,通過文獻計量分析、大數(shù)據(jù)處理技術、VOSviewer可視化等方法對研究熱點、研究主題的演化趨勢以及合作者的特征進行深入研究,為科研人員選擇研究方向、了解研究前沿提供參考。
2數(shù)據(jù)來源與研究方法
本文數(shù)據(jù)來源是中國知網(wǎng)(CNKI),它提供CNKI源數(shù)據(jù)庫、外文類、工業(yè)類、農(nóng)業(yè)類、醫(yī)藥衛(wèi)生類、經(jīng)濟類和教育類等多種數(shù)據(jù)庫,內容豐富,數(shù)據(jù)準確。參考電子信息科學綜合專題分類,選取電子信息科學領域影響力較大的十種核心期刊(見表1),以期刊名為文獻來源進行檢索,共檢索出95568篇文獻,選取其2011-2020年發(fā)表的35853篇文獻作為本文的數(shù)據(jù)源,數(shù)據(jù)采集時間為2021年1月11日。
采用文獻計量分析方法對文獻數(shù)據(jù)進行統(tǒng)計分析,利用VOSviewer繪制關鍵詞共現(xiàn)圖譜,分析電子信息科學領域的研究熱點和主題演化趨勢。
3結果分析
3.1研究熱點分析
3.1.1 高頻關鍵詞
關鍵詞出現(xiàn)的次數(shù)越多,與之相關的研究就越多。通過詞頻統(tǒng)計軟件分析,發(fā)現(xiàn)出現(xiàn)頻次≥5次的有效關鍵詞4460個,出現(xiàn)總頻次超過6.2萬余次。表2為前50位的高頻關鍵詞列表,這些高頻關鍵詞是2011-2020年間電子信息領域的代表性術語。出現(xiàn)頻率較高的關鍵詞分別是無線傳感器網(wǎng)絡558次、云計算439次、深度學習431次、遺傳算法389次、壓縮感知348次。
其中,無線傳感器網(wǎng)絡是一項通過無線通信技術把數(shù)以萬計的傳感器節(jié)點以自由式進行組織與結合進而形成的網(wǎng)絡形式,在環(huán)境監(jiān)測、軍事、醫(yī)療護理等領域有廣泛應用;從廣義上來看,云計算是與信息技術、軟件、互聯(lián)網(wǎng)相關的一種服務,是繼互聯(lián)網(wǎng)、計算機后在信息時代的又一革新;深度學習是機器學習領域中一個新的研究方向,它是學習樣本數(shù)據(jù)的內在規(guī)律和表示層次,這些學習過程中獲得的信息對諸如文字、圖像等數(shù)據(jù)的解釋有很大的幫助。它是一個復雜的機器學習算法,在語音和圖像識別方面取得的效果,遠超先前相關技術。
3.1.2 關鍵詞共現(xiàn)分析
使用VOSviewer軟件對電子信息科學領域十種核心期刊在2011-2020年間的發(fā)文數(shù)據(jù)進行分析,每個顏色分別代表一個聚類,每個圓圈代表一個關鍵詞,圓圈大小代表關鍵詞頻數(shù),圓圈越大、字體越大表明該關鍵詞出現(xiàn)次數(shù)越多。關鍵詞之間的線段代表彼此之間的共現(xiàn)強度,強度越大,線段越粗。關鍵詞含義越接近,彼此之間連線越短。選取論文關鍵詞中的術語條目,設置最少出現(xiàn)次數(shù)為50,從1000個術語中篩選出172個高頻術語顯示在地圖上,得到關鍵詞共現(xiàn)可視化視圖,結果如圖1所示:
對期刊論文的關鍵詞進行共現(xiàn)分析可以揭示該領域的研究熱點[4]。根據(jù)圖譜中關鍵詞同質性差異、共現(xiàn)次數(shù)和關鍵節(jié)點的信息,將2011-2020年電子信息科學領域的研究聚類為六個簇,簇中心點分別為:無線傳感網(wǎng)絡、云計算、深度學習、遺傳算法、壓縮感知、隱私保護。表3列出了中心點在關鍵詞共現(xiàn)圖譜中的連線次數(shù)(Links)、共現(xiàn)次數(shù)(Occurrences)、共現(xiàn)強度總計(Total link strength)以及中心點所在的簇主要包含的對象。
由圖1和表3可知,2011年-2020年間電子信息科學領域的研究熱點主要分為六大類:第一類是以無線傳感器網(wǎng)絡為中心點的研究,主要涉及網(wǎng)絡編碼、物聯(lián)網(wǎng)、認知無線電、協(xié)作通信、安全、路由算法、博弈論等研究主題,無線傳感網(wǎng)絡一詞作為關鍵詞共現(xiàn)的次數(shù)為559次,是電子信息科學領域學者關注較多的研究熱點;第二類是以云計算為中心點的研究,主要涉及大數(shù)據(jù)、虛擬化、云存儲等研究主題;第三類是以深度學習為中心點的研究,卷積神經(jīng)網(wǎng)絡、機器學習、人工智能、遷移學習、圖像分類等都與深度學習有較大關聯(lián),且近年來,深度學習在搜索技術、機器學習、機器翻譯、自然語言處理,多媒體學習、推薦和個性化技術等相關領域都取得了很多成果。深度學習使機器模仿視聽和思考等人類的活動,解決了很多復雜的模式識別難題,使得人工智能相關技術取得了很大進步;第四類是以遺傳算法為中心點的研究,遺傳算法(Genetic Algorithm,GA)最早是由美國的 John holland于20世紀70年代提出,是一種通過模擬自然進化過程搜索最優(yōu)解的方法。該算法利用計算機仿真運算,將問題的求解過程轉換成類似生物進化中的染色體基因的交叉、變異等過程[5]。遺傳算法現(xiàn)如今已被人們廣泛地應用于信號處理、組合優(yōu)化和自適應控制等領域;第五類是以壓縮感知為中心點的研究。壓縮感知理論一經(jīng)提出,就引起學術界和工業(yè)界關注,與信息論、圖像處理、地球科學、模式識別、無線通信等方面的研究結合緊密;第六類我以隱私保護為中心點的研究,主要與社會網(wǎng)絡、數(shù)據(jù)挖掘、推薦系統(tǒng)等研究熱點關聯(lián)較大。在電子信息快速發(fā)展的背景下,大眾的個人信息有很大一部分都是通過電子形式進行存儲,因此,個人隱私保護也成為當前電子信息科學領域關注的重要問題。
3.2 主題演化分析
使用VOSviewer軟件對選取的十種期刊在2011-2020年所有發(fā)文數(shù)據(jù)進行分析,提取關鍵詞,設置最少出現(xiàn)次數(shù)為50,篩選出172個高頻術語,得到關鍵詞疊加可視化圖譜(見圖2),從而探究研究主題的演化路徑。從2011-2020年間的關鍵詞演化來看,研究主題呈從中心向邊緣擴散的趨勢,且研究熱點的平均出現(xiàn)年份集中在2013-2018年。
2011-2013年,研究主題主要有無線傳感器網(wǎng)絡、網(wǎng)絡編碼、協(xié)助通信和信號處理等,網(wǎng)絡編碼技術應用于無線通信、無線傳感器網(wǎng)絡中基于網(wǎng)絡編碼的協(xié)助通信等研究均體現(xiàn)了研究熱點關鍵詞間的聯(lián)系。此后,關注點逐漸轉向云計算、遺傳算法和壓縮感知相關研究。
2014-2015年,研究熱點主題主要分為三個部分:以云計算為中心的技術與應用、以遺傳算法為熱點的優(yōu)化算法和以壓縮感知為主的信號處理技術。云計算與云存儲、物聯(lián)網(wǎng)、密碼學、信息安全訪問控制的相關研究較多,同時,與計算與另一研究熱點主題,遺傳算法的關聯(lián)極為密切。此階段與遺傳算法共現(xiàn)次數(shù)較多的關鍵詞有粒子群優(yōu)化、粒子濾波、支持向量機、聚類、petri網(wǎng)和粗糙集。壓縮感知與無線傳感器網(wǎng)絡之間連線的強度較大,且無線傳感器網(wǎng)絡為2014年的研究熱點,壓縮感知在2015年受到的關注最多。分析可知,無線傳感器網(wǎng)絡提高了人們遠程交互的能力,成為研究的熱點,但是該項技術存在信號傳輸困難,傳感器節(jié)點單價高等問題,實際應用價值較低。但是,新興壓縮感知理論為數(shù)據(jù)采集理論帶來了革命性突破,在無線傳感網(wǎng)絡的應用使得無線傳感網(wǎng)絡中多數(shù)問題得以解決。因此,壓縮感知與無線傳感網(wǎng)絡的關聯(lián)性較強,且出現(xiàn)在無線傳感器網(wǎng)絡研究熱潮之后。
2016-2018年,研究熱點主要分為隱私保護為主的社會網(wǎng)絡研究和以深度學習為主的新興研究點,且隱私保護作為關鍵詞的平均出現(xiàn)年份在2016年,深度學習作為關鍵詞的平均出現(xiàn)年份在2018年。與隱私保護連線強度較大的關鍵詞有2014年的熱點關鍵詞云計算、遺傳算法、物聯(lián)網(wǎng),以及2014年的熱點關鍵詞無線傳感器網(wǎng)絡。隱私保護作為中心點,其聚類簇中包含區(qū)塊鏈、數(shù)據(jù)挖掘、差分隱私、推薦系統(tǒng)、大數(shù)據(jù)、邊緣計算等對象,且簇中對象出現(xiàn)的年份平均在2016-2017年。深度學習屬于機器學習的子類,靈感來源于人類大腦的工作方式,是利用深度神經(jīng)網(wǎng)絡來解決特征表達的一種學習過程。與深度學習連線強度大的關鍵詞有機器學習、神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡,且平均出現(xiàn)年份在2018年之前,與之同年份關聯(lián)度大的關鍵詞有遷移學習、卷積神經(jīng)網(wǎng)絡、深度神經(jīng)網(wǎng)絡和自然語言處理。
4結語
對電子信息科學領域的研究熱點和主題演化進行分析,可以為這一領域的學者提供一個全面的視角,為開展新的研究和選題都有一定的參考價值。本文選取了電子信息科學領域影響力較大的十種核心期刊,并以其2011-2020年刊載的所有論文作為數(shù)據(jù)源,主要采用文獻計量學、知識圖譜等方法對近十年電子信息科學領域的研究熱點及主題演化趨勢與內容特征進行分析。首先通過詞頻統(tǒng)計軟件對發(fā)文關鍵詞進行統(tǒng)計分析,然后利用VOSviewer繪制關鍵詞共現(xiàn)圖譜和疊加可視化圖譜,對研究熱點進行聚類分析,并逐年探究了電子信息科學領域的研究主題演化。結果顯示,電子信息科學領域的研究熱點包含無線傳感器網(wǎng)絡、云計算、深度學習、遺傳算法、壓縮感知等理論和技術。通過關鍵詞共現(xiàn)圖譜,可以將近十年的研究熱點聚類為六大簇,分別以無線傳感器網(wǎng)絡、云計算、遺傳算法、壓縮感知、隱私保護和深度學習為簇的中心點,每個簇中的對象關聯(lián)緊密,多為研究同一方向的技術和方法。疊加可視化視圖充分體現(xiàn)了研究主題的演化趨勢,2011-2013年的研究熱點是無線傳感器網(wǎng)絡、協(xié)助通信等方向,2014-2015年主要包括云計算、云存儲相關研究和遺傳算法、優(yōu)化相關研究兩個方面的研究熱點。2016-2018年主要分為隱私保護、深度學習兩個方面的研究熱點,根據(jù)發(fā)文趨勢預測,隱私保護、深度學習等將成為未來一段時間內的研究熱點。以數(shù)字化、網(wǎng)絡化、智能化為特征的信息化浪潮方興未艾,信息技術日新月異,與各行業(yè)的融合不斷加深,電子信息科學在信息化、網(wǎng)絡安全、網(wǎng)絡與通信等方面將有更為長遠的發(fā)展。
本研究僅根據(jù)國內的期刊論文對研究熱點和主題演化進行探析,未涉及國際電子信息科學領域的發(fā)展狀況。下一步可以通過擴大、更新數(shù)據(jù)源,進而對國內和國際的研究熱點進行對比分析,從而更清晰地掌握電子信息科學的發(fā)展脈絡。
參考文獻:
[1] 羅宇文.探究電子信息技術的應用特點和發(fā)展方向[J].通訊世界,2013(9):23-24.
[2] 張璇,蘇楠,楊紅崗,等.2000—2011年國際電子政務的知識圖譜研究——基于Citespace和VOSviewer的計量分析[J].情報雜志,2012,31(12):51-57.
[3]李躍艷,王昊,鄧三鴻,王偉.近十年信息檢索領域的研究熱點與演化趨勢研究——基于SIGIR會議論文的分析[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2020:14.
[4] 馬費成,張勤.國內外知識管理研究熱點——基于詞頻的統(tǒng)計分析[J].情報學報,2006,25(2):163-171.
[5] 鄭樹泉,王倩,武智霞.工業(yè)智能技術與應用[M].上海:上??茖W技術出版社,2019:250-251.
【通聯(lián)編輯:朱寶貴】