張 昊
(中國科學(xué)技術(shù)信息研究所,北京 100038)
人工智能(AI)的概念誕生于1956年達特茅斯會議,經(jīng)過幾十年的發(fā)展,人工智能跨越了運算智能,在感知智能技術(shù)上逐漸成熟,并迎來了向認(rèn)知智能不斷邁進的新階段。伴隨著新一輪科技革命的興起,人工智能日益成長為具有引領(lǐng)性的技術(shù),并對經(jīng)濟發(fā)展、科技創(chuàng)新、社會生活等方面產(chǎn)生重大影響。2020年,新冠肺炎疫情肆虐全球,人工智能技術(shù)在抗疫期間發(fā)揮了重要作用。美國高度重視人工智能的發(fā)展,占據(jù)人工智能的領(lǐng)先地位,在不同領(lǐng)域有重要突破。
美國對人工智能基礎(chǔ)研究十分重視,研發(fā)投入持續(xù)提高。自第二次世界大戰(zhàn)以來,作為美國經(jīng)濟和軍事力量支柱的技術(shù)優(yōu)勢已經(jīng)受到威脅。根據(jù)美國人工智能國家安全委員會(the National Security Commission on Artificial Intelligence, NSCAI)的報告,美國將盡其所能保持其創(chuàng)新領(lǐng)導(dǎo)地位和全球地位,并通過協(xié)調(diào)和調(diào)整美國的優(yōu)勢來贏得人工智能領(lǐng)域的競爭[1]。委員會得出結(jié)論:美國必須采取行動部署人工智能系統(tǒng),并在人工智能創(chuàng)新上投入更多資源,以保護其安全、促進其繁榮。就自身來講,美國對于資金的吸引力強勁,根據(jù)英國Tech Nation機構(gòu)發(fā)布的新興技術(shù)投資排行榜,2015年到2019年間,美國吸引人工智能投資920億美元,占全球總數(shù)的一半以上。高昂的研發(fā)投入和優(yōu)渥的待遇,進一步吸引了更多優(yōu)秀人才前往美國發(fā)展,使美國的科研產(chǎn)出也居于世界領(lǐng)先地位。
美國在人工智能的研發(fā)投入上持續(xù)加碼。2020財年,美國聯(lián)邦政府機構(gòu)的研究與開發(fā)(R&D)預(yù)算約為1 341億美元,人工智能預(yù)算申請額高達9.27億美元[2],網(wǎng)絡(luò)和信息技術(shù)研發(fā)計劃(Networking and Information Technology Research and Development,NITRD)進行了歷史上首次預(yù)算補編,政府機構(gòu)、科技計劃和項目的投資總額為9.735億美元,同時新設(shè)立一個項目組成領(lǐng)域——人工智能研發(fā)[3],各類人工智能研發(fā)投資保持較高水平。2021財年,特朗普政府大幅增加非國防人工智能資金預(yù)算,呼吁該部分資金在兩年內(nèi)翻一番。美國國家科學(xué)基金會(National Science Foundation,NSF)的人工智能基金超過8.5億美元,與2020財年的預(yù)算相比,增加幅度在70%以上。特朗普政府還為能源部科學(xué)辦公室增加了5 400萬美元研究經(jīng)費,用于關(guān)鍵人工智能技術(shù)的研究,為美國國立衛(wèi)生研究院追加了5 000萬美元,用于人工智能治療慢性病的研究。此外,美國多位議員聯(lián)合推出了《無盡前沿法案》(Endless Frontier Act)[4],該法案提出十大關(guān)鍵技術(shù),倡議美國政府在未來5年內(nèi)投入1 000億美元進行研發(fā),其中將人工智能列為重點發(fā)展領(lǐng)域。
從2018—2020年美國軍方對人工智能研發(fā)經(jīng)費的投入來看,如圖1所示,總體研究經(jīng)費呈逐年增長趨勢,美國國防部高級研究計劃局(Defense Advanced Research Projects Agency,DARPA)和美國國防部長辦公廳(Office of the Secretary of Defense,OSD)的人工智能經(jīng)費有顯著提升,其中美國國防部長辦公廳預(yù)算申請最多,主要是由于聯(lián)合人工智能中心和Maven計劃均在美國國防部長辦公廳下進行。海陸空三軍增長比例較為平緩,陸軍占比最大,進一步體現(xiàn)了美軍對人工智能賦能作用的重視,以及美國根深蒂固的技術(shù)致勝的思維。
圖1 2018—2020年美國人工智能研發(fā)經(jīng)費變化
美國的科研產(chǎn)出占據(jù)世界榜首。根據(jù)北京智源人工智能研究院的《人工智能下一個十年》,2009年到2020年間,美國被人工智能領(lǐng)域45個頂級會議和期刊錄取論文的學(xué)者數(shù)量為49 116人,錄取論文量為69 764篇,人均產(chǎn)出為1.4篇,錄取論文量比中國多出44 346篇[5]。
細分領(lǐng)域上,美國優(yōu)勢依然明顯。根據(jù)2020年國際計算語言學(xué)協(xié)會年會(ACL)數(shù)據(jù),美國被接收論文數(shù)量為305 篇,超過中國(185篇)、英國(50篇)、德國(44篇)和日本(24篇)被接受論文數(shù)量之和,可見美國在自然語言處理技術(shù)上實力雄厚。如圖2所示,2020年國際神經(jīng)信息處理系統(tǒng)會議(NeurIPS 2020)上,谷歌以被接收169篇論文排名全球高校和研究機構(gòu)榜首,斯坦福和麻省理工學(xué)院分列二、三位,微軟排名第四。在接收論文中,有238篇論文至少有一個谷歌或DeepMind合著者,有296篇論文至少有一家斯坦福分支機構(gòu)。從投稿人的地區(qū)分布來看,有1 178篇論文來自美國,數(shù)量上占據(jù)絕對優(yōu)勢。中國和英國以259篇和195篇分列二、三名,如圖3所示。
圖2 不同機構(gòu)NeurIPS 2020論文接收量
圖3 不同國家NeurIPS 2020論文接收量
依據(jù)上述數(shù)據(jù),美國在自然語言處理領(lǐng)域和神經(jīng)信息處理領(lǐng)域處于領(lǐng)先地位,實力強大的科研機構(gòu)和高校為美國的技術(shù)創(chuàng)新提供源源不斷的內(nèi)生動力,以良性循環(huán)推動美國科技實力的進步。
專利方面,目前美國科技專利數(shù)量和人工智能專利數(shù)量均居世界第二,專利技術(shù)價值居全球首位。從全領(lǐng)域看,2019年,美國的全球國際專利申請排名首次落后于中國,位列世界第二。根據(jù)世界知識產(chǎn)權(quán)組織(WIPO)數(shù)據(jù),2020年專利合作條約(PCT)框架下專利申請量增長了4%,達到27.59萬件申請,是有史以來的最高數(shù)量。全球國際專利申請排名前五的國家中,中國申請量為68 720件,同比增長16.1%;美國申請量59 230件,同比增長3%;日本同比減少4.1%;韓國同比增長5.2%;德國同比減少3.7%[6],如圖4所示。
圖4 2019—2020年世界各國科技專利數(shù)量變化
美國專利商標(biāo)局(USPTO)發(fā)布的報告《人工智能發(fā)明:追蹤美國的人工智能專利傳播》顯示,美國專利商標(biāo)局收到的人工智能專利申請數(shù)量從2002年的3萬件增長到2018年的6萬多件[7]。同時,從PCT專利申請量上看,美國人工智能領(lǐng)域的PCT專利申請量占其申請總量的41%[8],在專利的技術(shù)價值上獨步全球。
根據(jù)世界知識產(chǎn)權(quán)組織的跟蹤記錄,1960年到2018年之間,人工智能領(lǐng)域PCT專利申請數(shù)量上,美國為1 863件,高于中國(1 085件)和歐洲(1 074件),美國每百萬人占有人工智能PCT專利數(shù)量為11.3件,遠高于歐洲(4.3件)和中國(1.4件),高水平人工智能專利數(shù)量和人均擁有量位居世界首位,如圖5所示。?
圖5 不同地區(qū)人工智能PCT專利數(shù)量及人均占有量
2020年,美國在人工智能不同技術(shù)領(lǐng)域都獲得了突破,并對技術(shù)發(fā)展趨勢起到重要的引領(lǐng)作用。自然語言處理領(lǐng)域涌現(xiàn)出眾多大規(guī)模模型。計算機視覺技術(shù)的研究核心從平面向三維轉(zhuǎn)移,生成對抗網(wǎng)絡(luò)(GAN)研究持續(xù)火熱,目標(biāo)檢測、語義分割等任務(wù)能力不斷深化,人工智能科研應(yīng)用更加多樣。
在自然語言處理技術(shù)上,美國引領(lǐng)了該領(lǐng)域的創(chuàng)新。尤其是谷歌,從Transformer模型的提出到2018年BERT模型的誕生,谷歌在自然語言處理領(lǐng)域提出了諸多引領(lǐng)性的模型。
谷歌推出了多語言模型mT5,最大可運行130億參數(shù),涵蓋101種語言,在資源不足的情況下也能進行分析與理解[9]。谷歌人工智能發(fā)布的預(yù)訓(xùn)練模型ELECTRA實現(xiàn)了小樣本下的高性能表現(xiàn),只需先前模型1/4的計算量,就能在GLUE排行榜上達到同等性能,并且在單個GPU上的訓(xùn)練時間縮短到了4天,效率高于BERT模型[10]。OpenAI發(fā)布的GPT-3模型,含有1 750億參數(shù)量,是先前最大模型Turing-NLG的10倍以上,該模型解決了以往過分依賴標(biāo)簽數(shù)據(jù)和領(lǐng)域數(shù)據(jù)過擬合的問題,能夠?qū)崿F(xiàn)自動編寫應(yīng)用程序、制作可視化圖表等一系列功能。然而GPT-3模型仍存在諸多短板,例如訓(xùn)練成本過高,其單次訓(xùn)練成本高達數(shù)百萬美元;存在隱私侵犯風(fēng)險;缺乏常識,無法進行因果推理和常識判斷等。
智能自主系統(tǒng)成果主要包括自動駕駛汽車、智能機器人和無人機等,美軍在該領(lǐng)域的發(fā)展起到了重要的推動作用。
在美國國防部高級研究計劃局資助的“阿爾法狗斗”模擬人機空戰(zhàn)中,人工智能系統(tǒng)以5比0的戰(zhàn)績完勝人類,是通過人機協(xié)作實現(xiàn)空戰(zhàn)自動化的重要突破。美國軍方XQ-58A“女武神”隱身無人機實現(xiàn)了與海軍和空軍的戰(zhàn)斗機半自主編隊飛行,實現(xiàn)雙向數(shù)據(jù)共享,解決了F-22和F-35戰(zhàn)斗機無法直接通信的難題,使美軍朝著實現(xiàn)軍事物聯(lián)網(wǎng)的方向又邁進一步。此外,“收割者”無人機基于機器學(xué)習(xí)算法,加快了人類決策者發(fā)現(xiàn)和確定目標(biāo)的過程。美國陸軍資助的RE2機器人公司,開發(fā)了移動機器人操縱系統(tǒng),通過雙臂操縱系統(tǒng)和無人車,使戰(zhàn)斗醫(yī)生能夠遠程評估并將戰(zhàn)場上受傷的士兵帶回治療。
群體智能方面以無人機群蜂飛行試驗為主。2020年9月,美國國防部高級研究計劃局主導(dǎo)的“進攻性蜂群使能戰(zhàn)術(shù)”(OFFSET)項目完成第四輪外場試驗,能夠保衛(wèi)多個目標(biāo)。同年10月,美國國防部高級研究計劃局實施了“小精靈”項目的第三次飛行試驗,成功驗證了自主編隊飛行和保障飛行安全方面的技術(shù)。商用方面,波士頓動力是智能機器人的典范,其量產(chǎn)的四足機器狗Spot已被用來監(jiān)控建筑工地的進度等,大幅提升人類工作效率,雙足機器人Atlas能夠完成復(fù)雜的人類體操動作,在物料搬運等方面有極大潛力。
美國在腦機接口領(lǐng)域處于世界第一梯隊,并持續(xù)取得具有引領(lǐng)性的突破。早在2014年,腦機接口先驅(qū)米格爾·尼科萊利斯就通過該技術(shù),使一位下身癱瘓的少年依靠大腦控制機械骨骼運動,在巴西圣保羅世界杯開幕式上開出第一球。
2020年4月,美國 Battelle 研究所和俄亥俄州立大學(xué)的研究團隊,利用腦機接口系統(tǒng)恢復(fù)了嚴(yán)重脊髓損傷患者的手部觸覺,為通過意念控制智能終端開辟了新的道路,實現(xiàn)了該領(lǐng)域的重要突破。8月,馬斯克Neuralink公司在活體豬身上實踐了侵入式的腦機接口,并獲得人體實驗許可。此外,匹茲堡大學(xué)和卡耐基·梅隆大學(xué)團隊開發(fā)了能夠從不穩(wěn)定性中自動恢復(fù)的腦機接口技術(shù),而不需要人工干預(yù)調(diào)整,該自校準(zhǔn)過程實現(xiàn)了神經(jīng)修復(fù)學(xué)領(lǐng)域的重要目標(biāo)[11]。
美國在自動駕駛、智慧醫(yī)療、智慧農(nóng)業(yè)等方面領(lǐng)先世界,但在語音識別、計算機視覺等技術(shù)的產(chǎn)業(yè)應(yīng)用上不及中國。新冠疫情期間,人工智能技術(shù)也得到了廣泛應(yīng)用,例如,人工智能算法縮短了研發(fā)新冠疫苗的時間,計算機視覺技術(shù)能幫助醫(yī)生提高診斷效率等。
智能交通系統(tǒng)(ITS)方面,目前其在美國國內(nèi)的應(yīng)用范圍已達80%以上。美國智能交通系統(tǒng)應(yīng)用在車輛安全系統(tǒng)(占51%)、電子收費(占37%)、公路及車輛管理系統(tǒng)(占28%)、導(dǎo)航定位系統(tǒng)(占20%)、商業(yè)車輛管理系統(tǒng)(占14%)方面發(fā)展較快。
自動駕駛汽車是智能交通的重要一環(huán),美國是該領(lǐng)域的領(lǐng)軍國家。Waymo是目前全球估值最高的自動駕駛公司,已有62 000輛克萊斯勒Pacifica的自動駕駛出租車隊運營。2020年,特斯拉Model 3累計銷量36萬輛,連續(xù)三年登頂全球電動車銷量榜首,其自動駕駛技術(shù)也不斷成熟。除了特斯拉、Waymo等大型自動駕駛企業(yè),還有諸如Cruise、 Nuro、Aurora等初創(chuàng)公司,企業(yè)創(chuàng)新活躍度較高。根據(jù)加州交通管理局(DMV)發(fā)布的2020年全年自動駕駛數(shù)據(jù),排名前三的分別是美國的Waymo、Cruise與中國的AutoX,其中兩次人工干預(yù)之間的平均行駛里程數(shù)(MPI)均在2萬英里到3萬英里區(qū)間(約3萬公里到5萬公里),分別為29 945英里、28 520英里和20 367英里。從數(shù)據(jù)可看出,雖然中國公司進入前三,但實際成績與美國還有差距,在自動駕駛領(lǐng)域美國仍占據(jù)優(yōu)勢。由于自動駕駛潛力巨大,未來智慧交通在創(chuàng)造智慧城市、提升社會智能水平方面將發(fā)揮更大作用。
美國在智慧農(nóng)業(yè)的應(yīng)用上領(lǐng)先世界。當(dāng)前,美國農(nóng)業(yè)部門采用多種人工智能解決方案,能夠提高作物產(chǎn)量、降低勞動成本、發(fā)現(xiàn)作物和牲畜疾病、提高產(chǎn)品質(zhì)量等。
以種植業(yè)為例,Blue River Technologies公司的機器視覺技術(shù)能夠獲取農(nóng)作物的生長狀況,判斷雜草位置,進行精準(zhǔn)灌溉、施肥和除草,將農(nóng)藥和化肥的使用量減少90%,并且該公司建立了覆蓋全美的農(nóng)業(yè)數(shù)據(jù)庫,幫助農(nóng)民更好地掌握農(nóng)場情況。Descartes Labs公司通過分析衛(wèi)星圖像,能夠?qū)r(nóng)作物的產(chǎn)量做出精準(zhǔn)預(yù)測,以玉米為例,該技術(shù)的預(yù)測數(shù)據(jù)比往年準(zhǔn)確99%以上。Infosys公司利用基于機器視覺的無人機和各類傳感器,采集植物高度、空氣濕度、土壤肥力等18種數(shù)據(jù),并上傳到Infosys信息平臺進行大數(shù)據(jù)分析,用于指導(dǎo)企業(yè)進行生產(chǎn)和育種。
當(dāng)前,美國正在建立農(nóng)民商業(yè)網(wǎng)絡(luò)(FBN),將通過聚合的農(nóng)場數(shù)據(jù)為單個農(nóng)民成員提供提高產(chǎn)量的解決方案。根據(jù)美國高盛公司預(yù)測,智慧農(nóng)業(yè)2025年將達到200億美元的潛在市場總額,僅在美國境內(nèi),通過機器學(xué)習(xí)等降低成本和提高效率,每年就能節(jié)約近30億美元的勞動力成本。
在智慧醫(yī)療技術(shù)領(lǐng)域,美國將大量的人工智能技術(shù)應(yīng)用于遺傳綜合癥、肺癌、乳腺瘤、創(chuàng)傷后應(yīng)激障礙等多種疾病的治療和診斷,同時,還利用其進行蛋白質(zhì)折疊體結(jié)構(gòu)的研究、抗菌耐藥性基因的檢測和識別以及新藥的開發(fā)。尤其是新冠疫情爆發(fā)以來,智能醫(yī)療的應(yīng)用開啟了新的時代。
根據(jù)弗若斯特沙利文咨詢公司估計,到2021年,智能醫(yī)療的收入將從2014年的6億美元升至60億美元,年均復(fù)合增長率達到40%。在美國,智能醫(yī)療商用化最成功的是IBM的沃森系統(tǒng),可以提供系統(tǒng)性的醫(yī)療解決方案。此外,初創(chuàng)公司大批出現(xiàn),2013年以來美國就有至少100家初創(chuàng)企業(yè)取得明顯成果。其中醫(yī)療影像與診斷是增長最快的領(lǐng)域,例如斯坦福大學(xué)投資的Butterfly Network公司,其制造的便攜式醫(yī)學(xué)成像裝置,能夠使超聲波核磁共振檢查的速度更快,精準(zhǔn)度更高。
具體應(yīng)用方面,吳恩達的斯坦福團隊開發(fā)了一種深度神經(jīng)網(wǎng)絡(luò),可基于心電圖信號分類10種心率不齊以及竇性心律和噪音,準(zhǔn)確度高達83.7%,超過了人類心臟病醫(yī)生78.0%的準(zhǔn)確度,該研究發(fā)表在Nature Medicine上。2020年10月,李飛飛入選美國國家醫(yī)學(xué)科學(xué)院(National Academy of Medicine)成為正式成員,其設(shè)計的人工智能醫(yī)療系統(tǒng)可以減少醫(yī)院里的交叉感染、提高重癥監(jiān)護室(ICU)的效率和質(zhì)量、幫助照顧老人。此外,李飛飛利用人工智能傳感器和算法幫助改善患者和臨床醫(yī)生醫(yī)療服務(wù)[12]。同月,美國羅格斯大學(xué)的研究團隊發(fā)明了智能藥物遞送系統(tǒng),可以減少受損神經(jīng)組織的炎癥,有助于治療脊髓損傷和其他導(dǎo)致神經(jīng)紊亂的疾病。
從人工智能技術(shù)整體發(fā)展趨勢上看,數(shù)據(jù)智能是發(fā)展核心,依托大數(shù)據(jù)的機器學(xué)習(xí)是提升智能水平的關(guān)鍵路徑。自然語言處理、智能自主系統(tǒng)等關(guān)鍵技術(shù)逐漸成熟,應(yīng)用落地不斷加速。而腦機接口等類腦智能處于研發(fā)攻關(guān)早期,仍需進一步探索和完善。此外,人工智能多學(xué)科融合的趨勢愈發(fā)明顯,與自然科學(xué)的結(jié)合更加緊密。加強創(chuàng)新理論研究,促進技術(shù)應(yīng)用落地,是推動人工智能發(fā)展的基石。人工智能與自然科學(xué)日益交融,進一步促進了智能水平的提高。在未來,人工智能將由當(dāng)前語音識別與生成、計算機視覺等單模態(tài)技術(shù)向融合性強的多模態(tài)技術(shù)發(fā)展,并不斷向兼具可解釋性和魯棒性的新一代人工智能進軍。
從美國角度看,美國在關(guān)鍵技術(shù)上占據(jù)明顯優(yōu)勢,產(chǎn)業(yè)應(yīng)用上處于世界前列,但中國加快趕超,美國的優(yōu)勢逐漸縮小。根據(jù)斯坦?!度斯ぶ悄苤笖?shù)報告》,在過去的 10 年間,美國的人工智能會議論文引用量一直高于中國,然而2020年,中國人工智能期刊的論文全球引用量首次超過美國。就業(yè)崗位方面,從 2019 年到 2020 年,美國的人工智能崗位發(fā)布總數(shù)下降了8.2%,是6年以來首次下降,而81.8%的國際畢業(yè)生會留在美國工作,人工智能人才就業(yè)形勢趨于嚴(yán)峻。綜合當(dāng)前復(fù)雜國際形勢看,美國雖然擁有十分深厚的基礎(chǔ),但維持其科技領(lǐng)先的難度增大;根據(jù)政府報告,其依然會持續(xù)加強在基礎(chǔ)研究方面的投入,加快關(guān)鍵技術(shù)攻關(guān),盡其所能保障“霸主”地位。
從我國角度來看,隨著計算機系統(tǒng)解決問題和執(zhí)行任務(wù)的能力不斷提高,人工智能技術(shù)在民用、軍事方面的應(yīng)用將更加廣泛,對經(jīng)濟社會發(fā)展、國防等方面的影響將持續(xù)增強,我國應(yīng)更加重視人工智能的發(fā)展。我國發(fā)展人工智能有良好的基礎(chǔ)和優(yōu)勢,近年來我國在人工智能領(lǐng)域?qū)崿F(xiàn)了眾多突破,人工智能專利數(shù)量也趕超美國,發(fā)展勢頭強勁。然而,面對當(dāng)前基礎(chǔ)研究薄弱、重大系統(tǒng)和平臺缺失的問題,要在基礎(chǔ)研究、關(guān)鍵技術(shù)、生態(tài)環(huán)境、產(chǎn)業(yè)應(yīng)用等方面進行系統(tǒng)布局,實現(xiàn)產(chǎn)學(xué)研共同推進,及時把握人工智能技術(shù)躍遷的重大窗口。在中長期階段持續(xù)加強科研攻關(guān),在理論上盡快補齊短板,技術(shù)上實現(xiàn)自主可控,提高國產(chǎn)率。持續(xù)加強開源開放,充分發(fā)揮企業(yè)創(chuàng)新主體作用,推動校企聯(lián)合,深化國際合作,不斷推動人工智能技術(shù)的大規(guī)模應(yīng)用,建立人工智能發(fā)展的良好環(huán)境。