盛云夢,劉 倩
(上海工程技術(shù)大學(xué)管理學(xué)院,上海 201620)
shengym2562@163.com;lqsn1996@163.com
人工智能作為信息和計算機技術(shù)領(lǐng)域的一個重要分支,從前期計算機模擬人的認知研究發(fā)展為人與計算機網(wǎng)絡(luò)結(jié)合的混合群智能研究,其目標是以更快的速度和更高的準確性解決人類智能的問題。在國家戰(zhàn)略層面,美國、英國和德國等主要發(fā)達國家都將人工智能視為國家競爭、信息安全的關(guān)鍵技術(shù),紛紛加大研究與產(chǎn)業(yè)創(chuàng)新結(jié)構(gòu)升級。我國人工智能相關(guān)研究發(fā)展迅速,已步入全球領(lǐng)先水平。目前與人工智能相關(guān)的研究成果相對普遍,但研究內(nèi)容較分散,大多數(shù)聚焦于某一子領(lǐng)域,較少從全局視角對國際人工智能發(fā)展趨勢進行系統(tǒng)深入的研究,且人工智能是目前發(fā)展最快、影響最廣泛的學(xué)科之一,需結(jié)合多種科學(xué)計量方法對文獻數(shù)據(jù)進行深入的挖掘和分析。因此,本文運用文獻計量軟件,從總體角度對國際人工智能的研究熱點、演進過程、發(fā)展脈絡(luò)進行了梳理和分析,希望為該領(lǐng)域的發(fā)展探索提供新的研究視角和思考。
為探析近十年人工智能整體發(fā)展的動態(tài)與演進軌跡,本文對期刊文獻進行研究,主要從科研合作網(wǎng)絡(luò)和文獻、突顯詞、關(guān)鍵詞層面進行信息整合和數(shù)據(jù)挖掘,歸納國際人工智能研究的發(fā)展特征,深入了解領(lǐng)域內(nèi)的動態(tài)和焦點問題,對科研人員進行相關(guān)理論研究具有重要的借鑒意義。
本文研究的所有文獻數(shù)據(jù)來源于全球?qū)W術(shù)信息重要數(shù)據(jù)庫Web Of Science的核心數(shù)據(jù)庫。設(shè)定期刊時間跨度為2011-2021 年,檢索日期設(shè)置為2022年2月1日,檢索條件為:標題=“ARTIFICIAL INTELLIGENCE”,文獻類別=“ARTICLE”,利用Web of Science篩選剔除掉非期刊類別的文章,共計檢索到6,007 條紀錄。
首先以人工智能相關(guān)領(lǐng)域的期刊發(fā)文量和影響因子為標準篩選了1,886 篇期刊論文,然后借助“CiteSpace”軟件對具有國際影響力的人工智能學(xué)術(shù)刊物進行可視化的分析,采用文本信息提取法、定性與定量結(jié)合法,挖掘出當(dāng)前世界人工智能研究的熱點,并揭示其演化軌跡和發(fā)展趨勢。
對上述數(shù)據(jù)清洗后的6,007 篇國際人工智能研究期刊論文的年度產(chǎn)出情況進行描述性分析,詳見圖1。
圖1 國際AI相關(guān)論文年產(chǎn)量分布圖Fig.1 Annual output distribution map of international papers related to AI
從圖1可以看出,2011—2016 年人工智能研究領(lǐng)域相關(guān)文獻量總體呈現(xiàn)逐年增加趨勢,2017—2021 年,相關(guān)領(lǐng)域文獻呈兩倍急速上升趨勢。2011 年國際上關(guān)于人工智能的研究已經(jīng)興起,但研究成果較少,這主要受兩方面的影響,一方面是全球人工智能理論的基礎(chǔ)研究、認知理論模型尚待完善,另一方面是硬件、軟件、數(shù)據(jù)等技術(shù)工具的限制。2016 年谷歌旗下的AlphaGo以4:1打敗了世界圍棋高手,迎來了“人工智能60 周年”的發(fā)展拐點,使人工智能論文數(shù)目猛增。自此以后,人工智能的研究成果在數(shù)量和影響力上都有了明顯的提升,其關(guān)注度也在不斷飆升,到2020 年發(fā)文增長率為89.07%,上升到了一個新的高度。國際上關(guān)于人工智能研究且具有影響力的期刊有:、、等。結(jié)合Web of Science的期刊影響力因子,以及人工智能領(lǐng)域期刊的論文發(fā)文量,對6,007 條搜索結(jié)果進行了提煉和整理,最后得出1,886 條。
設(shè)置面板中的“Country”選項,其余為系統(tǒng)默認值,可獲得世界上高產(chǎn)人工智能研究國家的知識圖譜,詳見圖2。圖中每個節(jié)點表示國家,兩個節(jié)點的連線代表了兩國間的聯(lián)系,節(jié)點的大小則是發(fā)文的數(shù)目。為了更好地理解該領(lǐng)域的節(jié)點層次,進行深一步的數(shù)據(jù)挖掘,詳見表1。
圖2 人工智能研究高產(chǎn)國家可視化知識圖譜Fig.2 Visual knowledge map of high-yield countries for AI research
表1 按照文章數(shù)量和中心度分別排序的前10 位高產(chǎn)國家Tab.1 Top 10 high-yield countries ranked by the number and centrality of the paper
從論文產(chǎn)出的角度看,中、美、韓在人工智能領(lǐng)域發(fā)表的文章最多,其后的7 個國家論文產(chǎn)量差別較小。由圖2可知中國人工智能研究起步較晚,與英國、美國、澳大利亞、越南、西班牙相比在基礎(chǔ)研究、技術(shù)方面存在一定的差距,但已經(jīng)有了較大的發(fā)展,研究也較深入。其中英國和美國在人工智能方面的研究起步較早,且部分文獻是人工智能方向研究的關(guān)鍵轉(zhuǎn)折點,這或許是其人工智能行業(yè)發(fā)展較快的一個重要原因。另一方面,從中心度觀察,中心度值大于等于0.1的節(jié)點被視為關(guān)鍵性的節(jié)點,這些節(jié)點通常被視為導(dǎo)致研究領(lǐng)域發(fā)生變化的重要因素。從表1可以看出,英國、美國、澳大利亞、越南、西班牙、伊朗這六個國家的文獻中心度大于等于0.1,這六個國家具有很高的創(chuàng)新能力,在人工智能領(lǐng)域中發(fā)揮著巨大的作用。
運行該軟件選取“Institution”選項,可得高產(chǎn)機構(gòu)的分布圖(圖3)。圖譜中較大的圓對應(yīng)的連線未必多,表明有較多研究結(jié)果的組織和其他組織的關(guān)系也不是很密切。
圖3 高產(chǎn)機構(gòu)合作圖譜Fig.3 Cooperation map of high-yield institutions
高產(chǎn)機構(gòu)合作圖譜共有615 個節(jié)點、1,743 條連線,每個節(jié)點代表了該機構(gòu)的論文數(shù)量,連線表示組織間的相互協(xié)作,協(xié)作越多說明這個組織與其他組織的合作程度就越高。從圖3可觀察到各機構(gòu)間的合作較為緊密,能夠充分利用各高校、科研單位的文獻,從而激發(fā)出新的研究視野,更深入、迅速地做出有意義的研究。發(fā)文單位基本上為高等院?;蛘哐芯繖C構(gòu),高產(chǎn)研究機構(gòu)主要為Duy Tan Univ、Harvard Med Sch、Univ Tabriz等,其中美國機構(gòu)發(fā)文頻次前十名中占比40%,但美國高等院校及研究機構(gòu)與其他機構(gòu)合作不是特別密切,可見其主要利用內(nèi)部資源進行獨立的研究。
為了更好地反映人工智能領(lǐng)域的核心作者和關(guān)聯(lián)度,對1,886 篇論文進行了作者合作圖譜可視化分析(圖4)。
圖4 高產(chǎn)作者合作圖Fig.4 Cooperation map of high-yield authors
圖4中的節(jié)點尺寸代表作者所發(fā)表的論文數(shù)目,連線則代表相互的協(xié)作關(guān)系。根據(jù)普賴斯定律,假設(shè)某一領(lǐng)域中最有生產(chǎn)力的作者論文數(shù)量為,那么=0.749。在這一領(lǐng)域中,發(fā)表超過篇文章的作者被定義為本研究的主要作者。可知=13,≈3,即發(fā)表3 篇文章以上的為核心作者,統(tǒng)計得樣本文獻中核心作者共29 名,其排名靠前的作者為Salaheldin Elkatatny、Abdulazeez Abdulraheem、Md Mohaimenul Islam、Kang Ryoung Park??傮w而言,國際人工智能領(lǐng)域合作關(guān)系較為緊密,該領(lǐng)域的研究力量處于比較集中的狀態(tài),各個學(xué)者之間聯(lián)系密切,對該領(lǐng)域的深度探究具有重要意義。
運用軟件的“Detect Bursts”功能,在特定的年份里可以發(fā)現(xiàn)在短期內(nèi)急劇增加的專業(yè)詞匯,從而觀測更深層次的發(fā)展變化,圖5為樣本文獻生成的突顯詞圖譜。從突顯詞看出其熱點持續(xù)時間表現(xiàn)出從長到短的趨勢。
圖5 前22 個最強突顯詞Fig.5 Top 22 keywords with the strongest citation bursts
2011—2012 年突顯詞包括時間序列(time series)、人工神經(jīng)網(wǎng)絡(luò)(ann)、智能仿真(simulation)、機器學(xué)習(xí)模型中的定義參數(shù)(parameter)、行為(behavior),這些突顯詞持續(xù)時間長達7至9 年;2014—2017 年突顯詞包括遺傳算法(genetic algorithm)、增長智能(growth)等,這些關(guān)鍵詞平均持續(xù)時間長達4 年;2018 年至今突顯出支持向量機(support vector machine)、人工智能未來法案(future)、智能醫(yī)療(care)、特征學(xué)習(xí)(feature)等突顯詞。以上突顯詞體現(xiàn)了人工智能的發(fā)展脈絡(luò)和趨勢,其中,支持向量機、人工智能未來法案、智能醫(yī)療、特征學(xué)習(xí)等關(guān)鍵詞一直持續(xù)至今,反映出在未來一段時間相關(guān)研究仍是人工智能領(lǐng)域的關(guān)鍵趨勢。
關(guān)鍵詞反映了文獻所要表現(xiàn)的各個主題之間的相互關(guān)系,是文章中心的核心概括,分析關(guān)鍵詞有利于研究本領(lǐng)域的熱點。運行軟件得到圖6所示的人工智能關(guān)鍵詞共現(xiàn)圖譜。該圖譜每一個節(jié)點的尺寸代表了該詞出現(xiàn)的次數(shù),隨著出現(xiàn)次數(shù)的增加,這個圓圈也會越來越大。在出現(xiàn)頻率超過20的關(guān)鍵詞中,神經(jīng)網(wǎng)絡(luò)、系統(tǒng)、模型出現(xiàn)的次數(shù)最多,分別出現(xiàn)次數(shù)為187、141、141??偨Y(jié)國際人工智能領(lǐng)域?qū)W者們關(guān)注的熱點主體主要有10 個方向:診斷(diagnosis)、神經(jīng)網(wǎng)絡(luò)(neural network)、深度學(xué)習(xí)(deep learning)、風(fēng)險管理(risk management)、優(yōu)化(optimization)、預(yù)測(prediction)、分類(classification)、算法(algorithm)、智能仿真(simulation)、管理(management)等關(guān)鍵詞,高頻關(guān)鍵詞與中心排名靠前的關(guān)鍵詞基本保持一致,即頻次越高,中心越明顯,中心性一定程度上可以涵蓋熱點和關(guān)鍵轉(zhuǎn)折點。
圖6 關(guān)鍵詞聚類圖Fig.6 Keywords cluster map
結(jié)合文獻分析將關(guān)鍵詞結(jié)果歸納為兩大類。一是針對深度學(xué)習(xí)的相關(guān)算法研究,深度學(xué)習(xí)是研究計算機獲取新的知識技能,一方面在信息感知、數(shù)據(jù)預(yù)測和估計模型上直接使用,另一方面試圖模仿人腦在數(shù)據(jù)中尋找模式的方法,這種模式又被稱為“神經(jīng)網(wǎng)絡(luò)”,神經(jīng)網(wǎng)絡(luò)代表了人工智能在人類思維模仿技術(shù)方面的前沿。二是算法優(yōu)化和特征學(xué)習(xí),通過訓(xùn)練數(shù)據(jù)集進行預(yù)測以采取行動優(yōu)化某些系統(tǒng),當(dāng)前有多種算法可用于此優(yōu)化,包括基于模型的強化學(xué)習(xí)、基于遺傳算法的多目標尋優(yōu)策略、基于數(shù)據(jù)挖掘的數(shù)據(jù)算法、支持向量機的特征分析等。三是人工智能與跨門類的尖端學(xué)科,它的研究領(lǐng)域十分廣闊,“人工智能+X”的創(chuàng)新模式將會在技術(shù)與工業(yè)發(fā)展中逐漸走向成熟,研發(fā)聚集多方向結(jié)合的混合智能,在智能城市、智能農(nóng)業(yè)、智能制造等需求的牽引下需要更多交叉融合的新發(fā)展,從而改變生產(chǎn)力、產(chǎn)業(yè)結(jié)構(gòu),促進人類邁向“普惠型”的智能社會。
隨著信息環(huán)境、數(shù)據(jù)挖掘、跨媒體計算等方面表現(xiàn)出來的巨大變化,VR、AR、移動終端等穿戴設(shè)備的涌現(xiàn)及元宇宙概念的提出為新一代人工智能的突破提供了技術(shù)環(huán)境和概念延伸。人工智能技術(shù)實現(xiàn)了新的技術(shù)突破,使其跨越了科學(xué)與應(yīng)用之間的“技術(shù)鴻溝”,在理論與應(yīng)用之間,平臺支撐系統(tǒng)和平臺服務(wù)驅(qū)動人工智能也走向了新的發(fā)展階段。環(huán)境的日益復(fù)雜需要越來越多的基于人工智能的支持系統(tǒng)來制定解決方案,使各個方向的研究能夠以更快、更準確的方式進行調(diào)整。
就目前發(fā)展來看,人工智能的發(fā)展從信息感知、機器學(xué)習(xí)等“淺層智能”過渡到模仿自然大腦如何處理信息的“深層智能”。出現(xiàn)頻次高的關(guān)鍵詞包括神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、優(yōu)化模型、預(yù)測、風(fēng)險管理等,對其余方向的關(guān)注度相對平穩(wěn),且根據(jù)節(jié)點中心性,時間序列、人工神經(jīng)網(wǎng)絡(luò)、群智能仿真對人工智能領(lǐng)域具有重要的影響力,支持向量機、人工智能未來法案、智能醫(yī)療、特征學(xué)習(xí)等相關(guān)研究仍是未來一段時間內(nèi)人工智能領(lǐng)域的熱點。
本文以CiteSpace軟件為基礎(chǔ),通過定性和定量分析研究領(lǐng)域內(nèi)的國際期刊,得出如下結(jié)論。
從高產(chǎn)國家、機構(gòu)、作者分布統(tǒng)計可視化結(jié)果來看,國際人工智能高產(chǎn)國家集中在中國、英國、越南、西班牙、伊朗、美國;發(fā)文量排名前三的高產(chǎn)研究機構(gòu)為Duy Tan Univ、Harvard Med Sch、Univ Tabriz,產(chǎn)量排名靠前的作者為Salaheldin Elkatatny、Abdulazeez Abdulraheem、Md Mohaimenul Islam,且各機構(gòu)間、學(xué)者間的合作較為緊密。在高產(chǎn)國家、高產(chǎn)機構(gòu)、高產(chǎn)作者三方面的結(jié)果中,美國綜合排名靠前,可見其在人工智能領(lǐng)域?qū)W術(shù)研究上較為領(lǐng)先。
從研究熱點來看,目前國際人工智能領(lǐng)域重點關(guān)注的是深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)理論和技術(shù)領(lǐng)域的應(yīng)用。國際人工智能領(lǐng)域的關(guān)鍵詞之間強度較大,與其他多門商業(yè)、生物、醫(yī)療等傳統(tǒng)領(lǐng)域滲透和融合,關(guān)注面愈加廣泛。圍繞人工智能技術(shù)的深入應(yīng)用還有待挖掘,在深層智能的研究如思維、策略等方面仍有不足。鑒于對社會經(jīng)濟和發(fā)展的重要影響,這仍然是進一步研究的主要領(lǐng)域。
從研究的演進特點和發(fā)展歷程來看,2011 年至今國際人工智能經(jīng)歷了蓬勃發(fā)展期、穩(wěn)定期、新一輪爆發(fā)期三個時期。從早期理論向?qū)嶋H的轉(zhuǎn)化,到中期基于大數(shù)據(jù)、圖形處理等計算平臺的快速發(fā)展,再到后期結(jié)合金融、醫(yī)療機構(gòu)、教育、數(shù)據(jù)安全、管理等領(lǐng)域進行深度應(yīng)用,在社會和經(jīng)濟領(lǐng)域都引起了廣泛的關(guān)注。