王佳星,周武源,李甜甜
1(浙江工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,杭州 310023)
2(浙江省科技信息研究院,杭州 310006)
計(jì)算機(jī)科學(xué)與眾多學(xué)科有著廣泛的交互作用,其知識(shí)結(jié)構(gòu)跨越了應(yīng)用數(shù)學(xué)、決策科學(xué)、統(tǒng)計(jì)學(xué)、社會(huì)科學(xué)、材料學(xué)、生物化學(xué)、化學(xué)、遺傳學(xué)等眾多學(xué)科;建立在計(jì)算機(jī)科學(xué)和統(tǒng)計(jì)學(xué)基礎(chǔ)上的機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)通過(guò)向其他研究領(lǐng)域輸出知識(shí),正在成為推動(dòng)工業(yè)和科學(xué)創(chuàng)新的主要學(xué)科領(lǐng)域[1,2].人工智能(Artificial Intelligence,AI)作為應(yīng)用計(jì)算機(jī)科學(xué)的子領(lǐng)域,以機(jī)器為載體部分實(shí)現(xiàn)人類智能,表現(xiàn)出強(qiáng)大的學(xué)習(xí)、推理和規(guī)劃能力,為增強(qiáng)和替代人類任務(wù)和活動(dòng)提供了變革潛力,因而成為全球新一輪科技革命和產(chǎn)業(yè)變革的核心戰(zhàn)略產(chǎn)業(yè)與“強(qiáng)化國(guó)家戰(zhàn)略科技力量”的核心技術(shù)要素[3].AI在教育、醫(yī)療、交通、金融、制造、物流、化工等幾乎全部行業(yè)領(lǐng)域的關(guān)鍵決策中得到了廣泛的應(yīng)用,并已形成了知識(shí)流動(dòng)緊密的學(xué)科集群[4-10].交叉學(xué)科的意義在于通過(guò)整合多學(xué)科技能和觀點(diǎn)的研究來(lái)發(fā)展新的知識(shí)[11],AI與眾多學(xué)科的交叉融合將極大地促進(jìn)眾多學(xué)科的飛躍式發(fā)展[12].
發(fā)展AI對(duì)于我國(guó)高質(zhì)量可持續(xù)發(fā)展、應(yīng)對(duì)人口紅利下降、轉(zhuǎn)變經(jīng)濟(jì)增長(zhǎng)方式及國(guó)家治理現(xiàn)代化具有重大意義[13,14].我國(guó)AI的發(fā)展戰(zhàn)略是將現(xiàn)有的地方性AI舉措提升到國(guó)家層面,體現(xiàn)了自下而上的發(fā)展[15].同時(shí),我國(guó)寬松的創(chuàng)新制度體系極大地促進(jìn)了市場(chǎng)、企業(yè)家、數(shù)據(jù)和數(shù)字平臺(tái)的耦合,塑造了數(shù)據(jù)驅(qū)動(dòng)產(chǎn)業(yè)的形成[16].可以說(shuō),我國(guó)成為AI先進(jìn)國(guó)家是國(guó)家創(chuàng)新體系和企業(yè)共同演化的結(jié)果[17].但是,我國(guó)AI的發(fā)展雖然具備良好的基礎(chǔ),在基礎(chǔ)理論研究方面與國(guó)際先進(jìn)水平仍有一定差距[18].我國(guó)于2017年發(fā)布了《新一代人工智能發(fā)展戰(zhàn)略規(guī)劃》,指出AI是引領(lǐng)未來(lái)的戰(zhàn)略性技術(shù),必須放眼全球,把AI發(fā)展放在國(guó)家戰(zhàn)略層面系統(tǒng)布局、主動(dòng)謀劃,打造競(jìng)爭(zhēng)新優(yōu)勢(shì),開拓發(fā)展新空間,有效保障國(guó)家安全.這是涉及產(chǎn)業(yè)面的整體性戰(zhàn)略部署,但規(guī)劃中的建設(shè)重點(diǎn)還不夠突出[19].《2021年政府工作報(bào)告》提出,基礎(chǔ)科技發(fā)展的重點(diǎn)領(lǐng)域?qū)⒑w新一代AI等戰(zhàn)略性新興產(chǎn)業(yè).《中華人民共和國(guó)國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第14個(gè)5年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》進(jìn)一步指出,發(fā)展以AI為代表的新一代信息技術(shù)是強(qiáng)化國(guó)家戰(zhàn)略科技力量的重要舉措.
AI研究備受全球關(guān)注,但是人們對(duì)全球AI研究總體發(fā)展態(tài)勢(shì)的認(rèn)知仍然不夠清晰:誰(shuí)在關(guān)注AI?中、美、歐誰(shuí)更熱?AI的科研績(jī)效如何?主要研究方向有哪些?研究熱點(diǎn)前沿在哪里?本文結(jié)合Scopus和Web of Science(WOS)數(shù)據(jù)源開展2011~2020年全球AI領(lǐng)域的文獻(xiàn)計(jì)量學(xué)研究,從文獻(xiàn)發(fā)表的時(shí)間分布、地理分布、研究機(jī)構(gòu)和學(xué)者分布、高頻關(guān)鍵詞分布、研究主題分布等方面進(jìn)行了統(tǒng)計(jì)分析,嘗試對(duì)上述問(wèn)題進(jìn)行分析討論,展現(xiàn)近10年來(lái)全球AI的發(fā)展態(tài)勢(shì),以期為相關(guān)科研人員把握AI發(fā)展方向、加強(qiáng)戰(zhàn)略謀劃和系統(tǒng)布局提供參考.
AI領(lǐng)域海量的文獻(xiàn)對(duì)檢索、數(shù)據(jù)采集與處理及文獻(xiàn)計(jì)量構(gòu)成了重大挑戰(zhàn).可以從技術(shù)層(算法)、數(shù)據(jù)層、功能層與應(yīng)用層4個(gè)方面開展AI的檢索.本文在參考世界知識(shí)產(chǎn)權(quán)組織(WIPO)發(fā)布的《人工智能技術(shù)趨勢(shì):2019》等相關(guān)出版物的基礎(chǔ)上[20,21],提出以AI算法為人工智能研究的基本特征,所得檢索詞如表1所示,供AI文獻(xiàn)計(jì)量學(xué)研究之用.
表1 人工智能檢索詞Table 1 List of search keywords in terms of AI
選擇合適的數(shù)據(jù)庫(kù)與分析工具,精準(zhǔn)開展AI研究,可為我國(guó)科研管理決策工作提供文獻(xiàn)計(jì)量學(xué)的技術(shù)支撐.當(dāng)前許多研究在文獻(xiàn)檢索與數(shù)據(jù)庫(kù)選擇方面存在不足,特別是選擇WOS作為單一數(shù)據(jù)源,對(duì)后續(xù)研究結(jié)果的全面性與可信度造成了一定影響.許多學(xué)者早已認(rèn)識(shí)到數(shù)據(jù)庫(kù)及研究工具對(duì)文獻(xiàn)計(jì)量研究至關(guān)重要,而WOS數(shù)據(jù)庫(kù)由于未收錄許多重要的計(jì)算機(jī)會(huì)議論文,因而在計(jì)算機(jī)科學(xué)文獻(xiàn)中作為引文來(lái)源存在一定的不足[22].Scopus不僅在引文分析方面提供了比WOS多20%左右的覆蓋率,也顯著改變了許多學(xué)者的相對(duì)排名[23,24].因此,以Scopus數(shù)據(jù)庫(kù)為數(shù)據(jù)源開展計(jì)算機(jī)學(xué)科的文獻(xiàn)計(jì)量學(xué)研究是更好的選擇.
本文采用SciVal科研管理平臺(tái)開展文獻(xiàn)計(jì)量研究,以期為我國(guó)科研管理工作提供更科學(xué)、更便捷的決策支持.SciVal是基于Scopus數(shù)據(jù)庫(kù)開發(fā)的具有高級(jí)分析功能的科研分析平臺(tái),包含來(lái)自全球5000多家出版社出版的23,500余種同行評(píng)審期刊所刊登的超過(guò)5000萬(wàn)條數(shù)據(jù)記錄[25].SciVal有著30多種設(shè)計(jì)精良的計(jì)量指標(biāo),包括發(fā)文量、領(lǐng)域加權(quán)引文影響(FWCI)、高被引期刊百分比、高被引文獻(xiàn)百分比、學(xué)術(shù)出版物的專利引文、顯著性指數(shù)(Prominence percentile)等,已被廣泛用于科技評(píng)價(jià)與管理決策.
從Scopus獲得與AI相關(guān)的同行評(píng)審論文,檢索策略基于表1中的關(guān)鍵詞,檢索范圍限于1996~2021年10月27日,利用SciVal及其內(nèi)置的Elsevier AI Classifier分析了包含863,415篇文獻(xiàn)的數(shù)據(jù)集[26],其中2021年由167,116位作者發(fā)表了61,828篇文獻(xiàn)(這部分?jǐn)?shù)據(jù)在分析2018~2021年文獻(xiàn)的學(xué)科領(lǐng)域分布時(shí)用到).以此數(shù)據(jù)集為基礎(chǔ),采用SciVal評(píng)估全球AI研究的學(xué)術(shù)表現(xiàn),包括國(guó)家、機(jī)構(gòu)、學(xué)者、出版年份、發(fā)文量、引用、學(xué)科分布與綜合科研績(jī)效等,并通過(guò)文本聚類挖掘領(lǐng)先的關(guān)鍵詞與研究主題,揭示出技術(shù)發(fā)展趨勢(shì)和研究熱點(diǎn)前沿.
ESI高被引論文是各學(xué)科近10年內(nèi)發(fā)表的且被引次數(shù)排在相應(yīng)學(xué)科領(lǐng)域全球前1%以內(nèi)的論文,ESI熱點(diǎn)論文是近2年內(nèi)發(fā)表的且在近2個(gè)月內(nèi)被引次數(shù)排在相應(yīng)學(xué)科領(lǐng)域全球前1‰以內(nèi)的論文,是最具突破性和影響力的論文.上述檢索策略在Web of Science核心合集共檢出457,691篇文獻(xiàn)(1966~2021年),其中高被引論文4,042篇,熱點(diǎn)論文182篇,合計(jì)4,048篇,其時(shí)間跨度為2011-2021年.采用VOSviewer構(gòu)建和可視化文獻(xiàn)計(jì)量網(wǎng)絡(luò),該軟件采用文本挖掘技術(shù)構(gòu)建和可視化從科學(xué)文獻(xiàn)中提取的重要術(shù)語(yǔ)的共現(xiàn)網(wǎng)絡(luò),可揭示科學(xué)知識(shí)的結(jié)構(gòu)、研究熱點(diǎn)和發(fā)展趨勢(shì)[27],并與SciVal分析結(jié)果相互驗(yàn)證.
本章將從全球AI學(xué)術(shù)研究發(fā)展態(tài)勢(shì)、發(fā)表論文國(guó)家/區(qū)域分布、AI研究機(jī)構(gòu)分布以及AI學(xué)者分布這幾個(gè)方面來(lái)分析國(guó)內(nèi)外AI學(xué)術(shù)研究現(xiàn)狀.
2011~2020年10年間發(fā)表的AI論文累計(jì)560,231篇,如表2所示,可分為兩個(gè)發(fā)展階段:2011~2015年間全球AI研究已處于較為活躍的水平,年發(fā)文量徘徊在3萬(wàn)多篇.2016年可視為AI發(fā)展的分水嶺,標(biāo)志性事件為谷歌AlphaGo擊敗世界圍棋冠軍李世石,這一大事件引發(fā)了深度學(xué)習(xí)這種革命性機(jī)器學(xué)習(xí)技術(shù)的研究熱潮[28].此后,通過(guò)訓(xùn)練神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)這一機(jī)器學(xué)習(xí)的重要分支得到了長(zhǎng)足發(fā)展,出版物數(shù)量總體呈現(xiàn)爆發(fā)式增長(zhǎng).2015年之前,從事AI研究的學(xué)者不超過(guò)85686人,發(fā)文量不超過(guò)37902篇;2016年學(xué)者人數(shù)猛增至112891,到2020年已經(jīng)達(dá)到驚人的245072,發(fā)文量則在2016年一舉達(dá)到5萬(wàn)篇,并在2020年飆升至將近10萬(wàn)篇.預(yù)計(jì)AI論文發(fā)表數(shù)量在未來(lái)還將繼續(xù)迅速增長(zhǎng).可以認(rèn)為,深度學(xué)習(xí)推動(dòng)了AI從以專家系統(tǒng)為代表的第一代AI發(fā)展到了以統(tǒng)計(jì)機(jī)器學(xué)習(xí)為代表的第二代AI,并深刻影響了科學(xué)、工業(yè)和社會(huì)的發(fā)展[29,30].
表2 研究領(lǐng)域概述和全球AI學(xué)術(shù)表現(xiàn)的趨勢(shì)Table 2 Overview of research areas and global trends in AI academic performance
引文可用以表征研究成果的影響或質(zhì)量.AI的引文次數(shù)在2011~2018年均保持在47萬(wàn)次/年以上,且沒有發(fā)生明顯的隨時(shí)間遞減趨勢(shì),這在一定程度上說(shuō)明了該領(lǐng)域研究的活躍度.
Field Weight Citation Impact(FWCI)作為SciVal中最重要的指標(biāo)之一,可用于評(píng)價(jià)一個(gè)研究領(lǐng)域的活躍度與學(xué)術(shù)聲譽(yù).該指標(biāo)表示研究領(lǐng)域的出版物被引用的次數(shù)與Scopus中所有其他類似出版物被引用的平均次數(shù)的比較,并考慮了各學(xué)科研究行為的差異,可表征論文質(zhì)量,衡量引文影響力,其基值為1.00.2011~2020年AI領(lǐng)域的平均FWCI為1.07,僅比世界平均學(xué)術(shù)績(jī)效水平略高7%.
Field-Weighted Views Impact(FWVI)是一個(gè)使用影響力指標(biāo),表示一個(gè)實(shí)體的出版物與世界平均水平相比所獲得的瀏覽量,它提供了較早的學(xué)術(shù)讀者地位測(cè)度.AI研究的FWVI平均為1.06,年度瀏覽量在2015年以前在85萬(wàn)次以下,而2016年以后均達(dá)到了100萬(wàn)次以上(2020年略低).這說(shuō)明AI研究論文被持續(xù)高頻使用,領(lǐng)域內(nèi)的科學(xué)活動(dòng)非?;钴S.
科學(xué)研究的專利引用長(zhǎng)期被用于知識(shí)繼承和創(chuàng)新價(jià)值研究,科學(xué)研究的經(jīng)濟(jì)影響可用學(xué)術(shù)成果的專利引用指標(biāo)來(lái)量化,以表征學(xué)術(shù)成果被用于創(chuàng)造專利的數(shù)量.2011~2017年,該指標(biāo)均有500篇次/年以上,表明存在持續(xù)的基礎(chǔ)研究向工業(yè)應(yīng)用的知識(shí)流動(dòng).
如圖1所示,AI科學(xué)研究所屬學(xué)科領(lǐng)域包括計(jì)算機(jī)科學(xué)(45.5%)、工程學(xué)(18.6%)、數(shù)學(xué)(12.9%)、決策科學(xué)(6.6%)、社會(huì)科學(xué)(2.9%)、能源(2.8%)、物理和天文學(xué)(2.4%)和其他(8.3%).但2018年后,AI學(xué)科向決策科學(xué)、醫(yī)學(xué)、社會(huì)科學(xué)、能源、物理與天文學(xué)、數(shù)學(xué)的知識(shí)流動(dòng)極為顯著,這些交叉學(xué)科領(lǐng)域的發(fā)文量比例顯著提高,表明正在發(fā)生顯著的多學(xué)科交叉融合.
圖1 AI出版物學(xué)科領(lǐng)域分布Fig.1 Distribution of AI publications by subject area
如表3所示,國(guó)際合作占全部學(xué)術(shù)論文的17.6%,但篇均被引14.6次,FWCI達(dá)到1.66.而僅國(guó)家合作與僅機(jī)構(gòu)合作的篇均被引分別僅為8.1次和6.5次,FWCI僅為1.03和0.95;單一作者發(fā)文則更受冷落,FWCI只有0.66.由此可見,國(guó)際科研合作交流顯著提升了AI學(xué)術(shù)研究的科研績(jī)效.
統(tǒng)計(jì)結(jié)果顯示,當(dāng)前已有159個(gè)國(guó)家/地區(qū)開展了AI研究并有文獻(xiàn)發(fā)表.2011~2020年AI研究引文總量前20國(guó)家/地區(qū)分布如表4所示,中國(guó)在發(fā)文量和引用次數(shù)上已完成對(duì)美國(guó)的超越,位居第一,但FWCI代表的科研績(jī)效僅為1,美國(guó)則達(dá)到1.73.英國(guó)緊隨其后,總被引次數(shù)達(dá)到38萬(wàn)次.德國(guó)、印度、澳大利亞、法國(guó)、加拿大和西班牙處于相近的水平,總被引次數(shù)均在20萬(wàn)次以上.加拿大、法國(guó)、韓國(guó)、荷蘭和澳大利亞緊隨其后.
表4 引文總量前20國(guó)家/地區(qū)的科研績(jī)效Table 4 Research performance of the top 20 countries/regions in terms of total citations
從FWCI指數(shù)來(lái)看,美國(guó)、英國(guó)、歐盟國(guó)家、澳大利亞和加拿大均在1.22以上,瑞士和新加坡特別優(yōu)秀,達(dá)到2以上.相反,印度、日本、韓國(guó)和巴西低于1,這表明其學(xué)術(shù)成果未受到學(xué)術(shù)界的重視與引用.總之,美歐發(fā)達(dá)國(guó)家之外的國(guó)家和地區(qū)在發(fā)展高質(zhì)量AI科學(xué)方面存在較大差距.
此外,2011~2020年,全球AI出版物的國(guó)際合作平均水平為17.6%.美國(guó)是最大的AI研究發(fā)源地,其國(guó)際合作比例達(dá)到36.2%.中國(guó)的國(guó)際合作比例處于較低的20.7%,但絕對(duì)數(shù)量已超過(guò)美國(guó).同時(shí),英國(guó)、澳大利亞、法國(guó)、加拿大、新加坡、瑞士和荷蘭的國(guó)際合作程度較高,達(dá)到50%以上,可以說(shuō)它們更依賴與美中等AI大國(guó)的合作.國(guó)際合作比例在20%左右的國(guó)家/地區(qū)還有日本、韓國(guó)、伊朗、土耳其和巴西,而印度僅為9.8%.
校企合作可促進(jìn)AI研究的質(zhì)量,加速科研成果轉(zhuǎn)移轉(zhuǎn)化.美國(guó)、德國(guó)、瑞士的校企合作比例達(dá)到9%左右,英國(guó)、法國(guó)、日本、新加坡、荷蘭達(dá)到6%左右,歐盟國(guó)家普遍在4%以上,而我國(guó)僅為3.3%.
綜上所述,我國(guó)AI科研績(jī)效整體上處于世界平均水平,國(guó)際科研合作與校企合作比率偏低.基于“破五唯”的政策精神,應(yīng)通過(guò)加強(qiáng)國(guó)際科研合作與校企合作提升科研成果質(zhì)量,我國(guó)的AI研究仍有巨大的提升空間.
2011~2020年引文量前20名科研機(jī)構(gòu)如表5所示,美國(guó)5家,中國(guó)7家,新加坡2家,法國(guó)3家,瑞士、加拿大和中國(guó)香港各一家.按發(fā)文量排名,中國(guó)科學(xué)院達(dá)到8,233篇,顯著高于其他機(jī)構(gòu);法國(guó)國(guó)家科學(xué)研究中心也達(dá)到6,239篇.雖然中法兩國(guó)機(jī)構(gòu)的發(fā)文量普遍較高,但從FWCI體現(xiàn)出的科研績(jī)效較低,我國(guó)最高的中科院自動(dòng)化研究所為2.18,清華大學(xué)為1.61,法國(guó)最高的國(guó)家信息與自動(dòng)化研究所為1.78.新加坡兩所大學(xué)的FWCI均在2.0以上,麻省理工學(xué)院、卡內(nèi)基梅隆大學(xué)、斯坦福大學(xué)、加州大學(xué)伯克利分校等美國(guó)機(jī)構(gòu)普遍在3.0以上,美國(guó)微軟公司更是達(dá)到4.36.美國(guó)機(jī)構(gòu)普遍重視校企合作,比率普遍在10%以上,微軟公司更高達(dá)85.1%,而我國(guó)這一比例最高的為清華大學(xué)(9.4%).
在學(xué)術(shù)刊物上發(fā)表論文的主體為高校和研究所,企業(yè)發(fā)表學(xué)術(shù)論文的比例不高,在引文量前100的機(jī)構(gòu)中,企業(yè)除美國(guó)微軟公司外,僅IBM(發(fā)文1,957篇,被引32,676次,FWCI為1.97)和中國(guó)國(guó)家電網(wǎng)(發(fā)文1,352篇,被引10,963次,FWCI為0.44).
我國(guó)科研機(jī)構(gòu)的國(guó)際合作和校企合作比例與美國(guó)機(jī)構(gòu)相比偏低,這在一定程度上說(shuō)明我國(guó)研究機(jī)構(gòu)需要加強(qiáng)國(guó)際交流與合作,促進(jìn)AI領(lǐng)域內(nèi)科學(xué)知識(shí)在全球范圍內(nèi)的流動(dòng),并通過(guò)校企合作促進(jìn)科學(xué)知識(shí)向產(chǎn)業(yè)技術(shù)與應(yīng)用的轉(zhuǎn)化.
與機(jī)構(gòu)分布相比,引文量排名前20的學(xué)者的地理分布更為廣泛,來(lái)自12個(gè)國(guó)家/地區(qū),如表6所示.我國(guó)高被引作者達(dá)到7人,西班牙和新加坡各2人,澳大利亞、中國(guó)澳門、德國(guó)、韓國(guó)、加拿大、卡塔爾、美國(guó)、日本、瑞士各1人.從FWCI體現(xiàn)的科研績(jī)效看,延世大學(xué)的Seyedali Mirjalili、南洋理工大學(xué)的Erik Cambria突破了10,我國(guó)學(xué)者也都達(dá)到了3以上.這一情況說(shuō)明,我國(guó)在AI領(lǐng)域已經(jīng)培養(yǎng)了一批重量級(jí)的學(xué)者;同時(shí)美國(guó)以外的AI學(xué)者應(yīng)當(dāng)?shù)玫街匾?是加強(qiáng)國(guó)際科研合作的對(duì)象.
表6 引文總量前20學(xué)者的科研績(jī)效Table 6 Research performance of the top 20 scholars in terms of total citations
本章綜合應(yīng)用WOS熱點(diǎn)論文的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)、基于自然語(yǔ)言處理的文本挖掘、研究主題的增長(zhǎng)率、FWCI及顯著性指數(shù),深入挖掘AI領(lǐng)域的知識(shí)結(jié)構(gòu)、研究熱點(diǎn)與前沿.
本小節(jié)采用VOSviewer分析2011~2021年間4,048篇WOS高被引/熱點(diǎn)論文的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),以展現(xiàn)AI領(lǐng)域的知識(shí)結(jié)構(gòu),如圖2所示.
圖2 AI熱點(diǎn)文獻(xiàn)關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)Fig.2 AI hot literature keywords coexist on the web
AI研究可分為以下4個(gè)主要方向:
1)深度學(xué)習(xí).重要算法包括卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)[31]、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)[32]與長(zhǎng)短期記憶在內(nèi)的各種神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)[33],主要用于特征提取、圖像識(shí)別、物理檢測(cè)、遙感監(jiān)測(cè)、故障檢測(cè).在近兩年的COVID-19大流行中,利用數(shù)據(jù)和信息技術(shù)來(lái)幫助控制和緩解全球大流行病成為人們關(guān)注的焦點(diǎn),深度學(xué)習(xí)已被廣泛用于(遠(yuǎn)程)疾病診斷等用途[34,35],是一個(gè)非常顯著的研究熱點(diǎn).
2)AI與大數(shù)據(jù).當(dāng)前處于第4次工業(yè)革命,在工業(yè)領(lǐng)域的數(shù)字化轉(zhuǎn)型升級(jí)中,基于(工業(yè))物聯(lián)網(wǎng)在智能制造等典型場(chǎng)景中產(chǎn)生了海量數(shù)據(jù),迫切需要AI幫助分析與管理,同時(shí)也助推了AI自身的發(fā)展[36].數(shù)據(jù)和用于數(shù)據(jù)分析的算法的應(yīng)用[37]也可以提高公共部門的現(xiàn)代化,提高行業(yè)競(jìng)爭(zhēng)力[38].
3)模型、算法的設(shè)計(jì)、優(yōu)化與預(yù)測(cè)功能.大數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等與優(yōu)化問(wèn)題密不可分,算法的設(shè)計(jì)與優(yōu)化是發(fā)展先進(jìn)AI的重要引擎,預(yù)測(cè)[39]是AI最重要的功能之一.遺傳算法(genetic algorithm)[40]、粒子群優(yōu)化算法(particle swarm optimisation algorithm)[41]、進(jìn)化算法(evolutionary algorithm)[42]是相當(dāng)突出的關(guān)鍵詞.
4)人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)[43]、支持向量機(jī)(support vector machine)[44]、模糊邏輯(fuzzy logic)[45]、隨機(jī)森林(random forest)[46]等方法,主要用于地理信息系統(tǒng)與空間預(yù)測(cè)等.其中,神經(jīng)網(wǎng)絡(luò)居于共現(xiàn)網(wǎng)絡(luò)的中心,體現(xiàn)了算法的核心地位;而疾病診斷與工業(yè)互聯(lián)網(wǎng)是新興的研究方向.
基于SciVal內(nèi)置的文本挖掘功能確定AI研究中的熱門關(guān)鍵詞排名.該文本挖掘技術(shù)將多種自然語(yǔ)言處理技術(shù)應(yīng)用于文獻(xiàn)的標(biāo)題、摘要和作者關(guān)鍵詞,并通過(guò)加權(quán)算法克服僅僅通過(guò)詞頻來(lái)計(jì)算研究熱點(diǎn)的不足.由此確定的前50個(gè)關(guān)鍵詞云如圖3所示(基于2011~2020年間的560,231篇文獻(xiàn)).
圖3 2011~2020年AI研究前50個(gè)關(guān)鍵詞詞云Fig.3 Top 50 keyword word cloud for AI research 2011~2020
關(guān)鍵詞的發(fā)文量增長(zhǎng)率體現(xiàn)了學(xué)術(shù)研究的流變.分析2011~2020年關(guān)鍵詞的變化,如表7所示,可獲得如下趨勢(shì):
1)深度學(xué)習(xí)研究的增長(zhǎng)無(wú)疑最為驚人,相關(guān)的深度神經(jīng)網(wǎng)絡(luò)[47]、卷積神經(jīng)網(wǎng)絡(luò)[31]、遞歸神經(jīng)網(wǎng)絡(luò)[48]是科研人員產(chǎn)出最多的領(lǐng)域之一.機(jī)器學(xué)習(xí)[49]、支持向量機(jī)[50]、強(qiáng)化學(xué)習(xí)[51]也獲得了許多增長(zhǎng),而控制論、學(xué)習(xí)系統(tǒng)、模糊系統(tǒng)、本體論卻出現(xiàn)了下降,這體現(xiàn)了近10年學(xué)術(shù)研究的動(dòng)向.
2)物聯(lián)網(wǎng)[52]是研究熱點(diǎn),作為全球第4次工業(yè)革命(Industry 4.0,智能制造)的底層技術(shù),增長(zhǎng)率達(dá)到6,505%.物聯(lián)網(wǎng)的大規(guī)模部署與應(yīng)用產(chǎn)生了大數(shù)據(jù)及大數(shù)據(jù)分析的需求,其增長(zhǎng)率達(dá)到57,683%.與之相關(guān)的數(shù)據(jù)挖掘、云計(jì)算也獲得了增長(zhǎng).
3)AI最顯著的應(yīng)用對(duì)象無(wú)疑是機(jī)器人,這是它的內(nèi)在屬性.研究較多地集中于無(wú)人機(jī)[53]、面部識(shí)別[54]、圖像識(shí)別[55]、智能電網(wǎng)、人機(jī)互動(dòng)、計(jì)算機(jī)視覺等.
Scopus中的顯著性指數(shù)融合了引用(Citation Count)、瀏覽量(Scopus Views Count)與期刊影響力(Average CiteScore)3類參數(shù),權(quán)重采用基于STAR METRICS的美國(guó)科研資助數(shù)據(jù)進(jìn)行擬合優(yōu)化,并經(jīng)美國(guó)國(guó)家科學(xué)基金會(huì)(NSF)和美國(guó)國(guó)立衛(wèi)生研究院(NIH)資助數(shù)據(jù)驗(yàn)證,顯著性越高的研究主題獲得基金資助的程度越高[56].最新的顯著性指數(shù)是基于2019~2020年發(fā)表的論文計(jì)算的,通過(guò)顯著性指數(shù)可篩選AI領(lǐng)域的研究前沿,可幫助研究人員了解最新的研究趨勢(shì).綜合主題文獻(xiàn)占比增長(zhǎng)率為正、FWCI>1和顯著性指數(shù)>99%,篩選出2011~2020年AI研究中領(lǐng)先的30個(gè)主題,如表8所示,這些主題主要分布于信息系統(tǒng)、計(jì)算機(jī)視覺、人機(jī)交互、智能制造、自然語(yǔ)言處理、模式識(shí)別等領(lǐng)域,涉及對(duì)象檢測(cè)、動(dòng)作識(shí)別、醫(yī)學(xué)圖像處理、意見挖掘、推薦系統(tǒng)、人機(jī)互動(dòng)、腦機(jī)接口、軌跡跟蹤、自動(dòng)駕駛、物聯(lián)網(wǎng)、工業(yè)4.0、故障檢測(cè)、網(wǎng)絡(luò)安全、區(qū)塊鏈、交通流預(yù)測(cè)、機(jī)器翻譯等重要的研究方向.
本文旨在對(duì)近10年AI的發(fā)展?fàn)顩r進(jìn)行全面深入的分析.為此,本文采用計(jì)量學(xué)方法分析了國(guó)家、機(jī)構(gòu)和作者在AI研究方面的貢獻(xiàn),以及AI的知識(shí)結(jié)構(gòu)、研究熱點(diǎn)和技術(shù)趨勢(shì).通過(guò)分析可以得出:1)深度學(xué)習(xí)引領(lǐng)的第二代AI研究熱潮自2016年興起并還將持續(xù)下去,將深刻影響科學(xué)、工業(yè)和社會(huì)的發(fā)展.AI學(xué)科向決策科學(xué)、醫(yī)學(xué)、社會(huì)科學(xué)、能源、物理與天文學(xué)等學(xué)科的知識(shí)流動(dòng)極為顯著,正在發(fā)生顯著的多學(xué)科交叉融合,促進(jìn)了這些學(xué)科的飛躍式發(fā)展;2)AI學(xué)術(shù)力量主要分布于中國(guó)、美國(guó)、歐盟、英國(guó)、印度、澳大利亞、加拿大、日本與新加坡等,國(guó)際科研合作交流顯著提升了AI學(xué)術(shù)研究的科研績(jī)效.我國(guó)AI發(fā)文量已居世界第一,并培養(yǎng)了一批一流學(xué)者,但科研績(jī)效整體上還處于世界平均水平;3)AI領(lǐng)域的知識(shí)結(jié)構(gòu)大致可分為4個(gè)方向:深度學(xué)習(xí)、大數(shù)據(jù)與物聯(lián)網(wǎng)、模型算法設(shè)計(jì)優(yōu)化、用于空間技術(shù)的人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、模糊邏輯、隨機(jī)森林;4)與人工智能相關(guān)的研究熱點(diǎn)前沿包括圖像識(shí)別、工業(yè)4.0、意見挖掘、推薦系統(tǒng)、人機(jī)互動(dòng)、腦機(jī)接口、軌跡跟蹤、自動(dòng)駕駛、故障檢測(cè)、網(wǎng)絡(luò)安全、交通流預(yù)測(cè)、機(jī)器翻譯等.
AI引導(dǎo)的數(shù)字革命將深刻改變?nèi)祟惿鐣?huì)的可持續(xù)發(fā)展模式.為應(yīng)對(duì)氣候危機(jī)與人類社會(huì)可持續(xù)發(fā)展的挑戰(zhàn),應(yīng)繼續(xù)深入探索與發(fā)展AI科技,重視基礎(chǔ)學(xué)科前沿.同時(shí),也要開展更為廣泛的跨學(xué)科合作,從腦科學(xué)與人類智能機(jī)理等交叉學(xué)科角度繼續(xù)探索下一代AI技術(shù).
目前,中美之間在AI領(lǐng)域的競(jìng)爭(zhēng)正趨于白熱化,美國(guó)于2021年通過(guò)了《美國(guó)創(chuàng)新與競(jìng)爭(zhēng)法案》,有可能對(duì)中美科研合作交流產(chǎn)生重大影響.由于美歐發(fā)達(dá)國(guó)家之外的國(guó)家和地區(qū)在發(fā)展AI科學(xué)方面存在較大差距,我國(guó)應(yīng)重視AI人才的教育、培養(yǎng)與引進(jìn),促進(jìn)校企合作,進(jìn)一步推動(dòng)科學(xué)開放與國(guó)際合作.在探索繼續(xù)與美國(guó)深化合作交流的可能性的同時(shí),也要加強(qiáng)與歐盟國(guó)家、英國(guó)、澳大利亞、加拿大、新加坡等的合作交流,同時(shí)通過(guò)幫扶AI研究弱勢(shì)國(guó)家樹立有擔(dān)當(dāng)?shù)拇髧?guó)形象.
還有許多問(wèn)題嚴(yán)重制約著AI的發(fā)展:1)數(shù)據(jù)和機(jī)器學(xué)習(xí)算法驅(qū)動(dòng)的AI在技術(shù)上的局限日益凸顯,其發(fā)展與治理面臨著算法層面、數(shù)據(jù)層面與應(yīng)用層面的不足,如過(guò)于依賴大規(guī)模訓(xùn)練數(shù)據(jù)、場(chǎng)景適用范圍窄、模型欠缺可解釋性、穩(wěn)定性和公平性;在數(shù)據(jù)傳播、采集和使用中產(chǎn)生了巨大的商業(yè)、法律和道德風(fēng)險(xiǎn),存在模型可解釋性與泛化能力差、安全性低等技術(shù)問(wèn)題,數(shù)據(jù)挖掘欠公平、隱私泄漏、數(shù)據(jù)確權(quán)、技術(shù)濫用等科技倫理問(wèn)題[87],給社會(huì)公共治理與產(chǎn)業(yè)智能化轉(zhuǎn)型帶來(lái)嚴(yán)峻挑戰(zhàn),對(duì)未來(lái)人類社會(huì)結(jié)構(gòu)產(chǎn)生不良影響.因此,需要發(fā)展安全、可信、可靠、可擴(kuò)展和負(fù)責(zé)任的下一代AI技術(shù)[88,89];2)我國(guó)AI的發(fā)展雖然具備良好的基礎(chǔ),產(chǎn)業(yè)發(fā)展取得顯著成績(jī),但在基礎(chǔ)理論研究及科研績(jī)效方面與國(guó)際先進(jìn)水平仍有一定差距,AI與其他學(xué)科的交叉融合不夠緊密.《人工智能標(biāo)準(zhǔn)化白皮書(2021版)》指出,我國(guó)AI底層技術(shù)存在較大欠缺,能夠?qū)崿F(xiàn)商業(yè)價(jià)值的應(yīng)用較少,與實(shí)體經(jīng)濟(jì)的融合存在較高門檻,需要加快推動(dòng)基礎(chǔ)研究向產(chǎn)業(yè)技術(shù)與應(yīng)用的轉(zhuǎn)化,解決AI技術(shù)規(guī)?;茝V和市場(chǎng)化普及等應(yīng)用性難題,使社會(huì)更易接觸和使用AI以創(chuàng)造商業(yè)價(jià)值.
綜上所述,本研究綜合多數(shù)據(jù)源和計(jì)量工具,對(duì)全球AI研究態(tài)勢(shì)開展文獻(xiàn)計(jì)量與可視化分析,為AI研究提供了一個(gè)全景式的視角,所揭示的AI發(fā)展趨勢(shì)與研究熱點(diǎn),可為AI學(xué)術(shù)發(fā)展提供思路,為科學(xué)進(jìn)步和人類社會(huì)可持續(xù)發(fā)展作出貢獻(xiàn).但本文研究中也存在不足之處,例如,在AI文獻(xiàn)的檢索上有可能還不夠全面,同時(shí)AI研究文獻(xiàn)的海量特征,對(duì)數(shù)據(jù)采集與分析構(gòu)成了重大挑戰(zhàn).在未來(lái)研究中,將努力探索更為科學(xué)合理的海量文獻(xiàn)數(shù)據(jù)的采集與分析方法,以期為相關(guān)科研管理提供更清晰的情報(bào)支撐.AI研究中的問(wèn)題遠(yuǎn)不止本文提及和討論的部分,文章內(nèi)容難免有不當(dāng)之處,懇請(qǐng)國(guó)內(nèi)外專家和同行批評(píng)指正.