李 理
(北京理工大學計算機學院,北京100081)
邊緣計算是指在數(shù)據(jù)源處或附近進行的計算,這與依靠眾多數(shù)據(jù)中心的云計算來完成所有工作的模式有著顯著不同[1],被認為是“人工智能的最后一公里”。邊緣計算的特點是低延遲、隱私安全性和靈活性。近年來,邊緣計算的飛速發(fā)展在不斷推動邊緣人工智能物聯(lián)網(wǎng)的發(fā)展[2]。當前社會發(fā)展正在經(jīng)歷萬物智能互聯(lián)的時代,人工智能與物聯(lián)網(wǎng)正在改變世界各地的產(chǎn)業(yè)面貌與布局,隨之而來的是視覺/視頻應用與連網(wǎng)量的激增。根據(jù)IHS Markit 的數(shù)據(jù),到2019年,全球僅監(jiān)控攝像頭每天產(chǎn)生的數(shù)據(jù)量就達到2500PB。根據(jù)麥姆斯咨詢(MEMS Consulting)的數(shù)據(jù),全球計算機視覺市場規(guī)模預計到2023年將增長至173.8億美元,激增的視覺應用正在推動人工智能向邊緣普及。根據(jù)華為《全球產(chǎn)業(yè)展望GIV2025:打開智能世界的產(chǎn)業(yè)版圖》白皮書,到2025年,全球物聯(lián)數(shù)量達1000 億量級,全球智能終端將達400 億。以英特爾公司為例,2019年在無人機、相機、機器人和自動駕駛汽車等設(shè)備的邊緣計算收入同比增長了約20%,預計這一數(shù)字會逐年增長。“從數(shù)據(jù)中心走到邊緣”已成為業(yè)界的趨勢。根據(jù)互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)的數(shù)據(jù),到2019年底,45%的數(shù)據(jù)將在邊緣進行存儲;到2023年,在邊緣設(shè)備上發(fā)生人工智能任務的比例為43%,具有邊緣人工智能功能的設(shè)備將增長15 倍;到2025年,全球累計的數(shù)據(jù)量將從2018年的33 ZB增長到175 ZB,這些數(shù)據(jù)很大部分將來自用于安全和商業(yè)智能目的的IP監(jiān)控攝像機。
圖1 邊緣計算被認為是“人工智能的最后一公里”Fig.1 Edge computing is regarded as the last kilo-meter of artificial intelligence(AI)
英特爾公司的邊緣計算人工智能產(chǎn)品體系以Intel Movidius MyriadTM X 視覺加速芯片、可擴展的人工智能加速解決方案、OpenVINOTM 深度學習部署工具套件為支柱。2019年10月,英特爾公司宣布了“高性能計算”“邊緣賦能”“視覺(視頻)推理”三大物聯(lián)網(wǎng)戰(zhàn)略,積極推動物聯(lián)網(wǎng)生態(tài)系統(tǒng)的發(fā)展進化。與此同時,英特爾公司推出最新版本的OpenVINO 工具包(2019 R3),推出邊緣人工智能生態(tài)智庫,旨在以領(lǐng)先的開發(fā)者工具和生態(tài)系統(tǒng)方案,幫助行業(yè)快速規(guī)模部署人工智能物聯(lián)網(wǎng)?;贗ntel Movidius 和邊緣計算技術(shù),英特爾云圖睿視邊緣計算平臺內(nèi)嵌視覺算法,支持各類傳感器接入和各類算法運行,是全球首款開放式人工智能邊緣計算平臺。
2019年3月,谷歌公司發(fā)布了TensorFlow 2.0的Alpha 版和智能硬件平臺Coral。Coral 平臺采用專為邊緣計算設(shè)計的Edge TPU,可為低功耗設(shè)備提供高性能機器學習推理能力,此舉被業(yè)界認為是在邊緣計算布局相較于其他國際科技巨頭起步較晚的谷歌公司走出了邊緣計算硬件化的重要一步。2019年11月,谷歌公司與意大利電信公司就邊緣計算服務的發(fā)展建立主要戰(zhàn)略聯(lián)盟?;萜展竞臀④浌痉謩e計劃在未來四年內(nèi)向物聯(lián)網(wǎng)和邊緣計算領(lǐng)域投資40億美元和50億美元。
2019年7月,歐盟TEMPO 項目啟動,由瑞士神經(jīng)擬態(tài)處理器研發(fā)公司aiCTX牽頭,共15家單位參與,旨在探索支持新興存儲技術(shù)及新型硬件架構(gòu)來實現(xiàn)超低功耗神經(jīng)擬態(tài)運算,以滿足智能終端設(shè)備對復雜深度學習算法的應用需求,為人工智能邊緣運算市場的到來做好準備。aiCTX已在2019年4月發(fā)布全球首款基于事件驅(qū)動的人工智能處理器DynapCNN,用于拓展視覺物聯(lián)網(wǎng)傳感器等諸多應用場景的超低功耗邊緣計算。
2019年5月,英偉達公司發(fā)布首款面向邊緣設(shè)備的人工智能平臺Nvidia EGX,旨在將人工智能引入網(wǎng)絡(luò)邊緣。該平臺具備高性能和可擴展性,能夠?qū)崟r感知、理解和處理數(shù)據(jù),能夠從基于Jetson Nano 處理器的輕型服務器(每秒完成0.5 萬億次操作)擴展到基于邊緣服務器NVIDIA T4 機架的微型數(shù)據(jù)中心(每秒完成10000 萬億次操作)。2019年10月,英偉達公司發(fā)布用于構(gòu)建依賴GPU 內(nèi)存運行的5G 無線接入網(wǎng)絡(luò)的開發(fā)工具包Aerial,以提升在5G 和邊緣計算領(lǐng)域部署其人工智能系統(tǒng)的效率。同期,美國開源解決方案提供商紅帽公司宣布其Openshift 平臺將與英偉達公司展開合作,用以構(gòu)建集成英偉達EGX 邊緣計算平臺的云本地電信基礎(chǔ)設(shè)施,助力電信公司采用能夠支持邊緣工作負載的5G 網(wǎng)絡(luò)。2019年11月,英偉達公司宣布推出世界上最小的邊緣人工智能超級計算機——Jetson Xavier NX,且它與Jetson Nano 具有引腳兼容性,能夠輕松優(yōu)化深度學習網(wǎng)絡(luò)以進行邊緣推理,使開發(fā)人員可以在邊緣運行融合了人工智能的復雜應用程序。2019年10月,機器學習和數(shù)據(jù)科學咨詢公司Tryolabs 發(fā)布基準評測報告,測試比較了英偉達Jetson Nano、谷歌Coral 開發(fā)板(內(nèi)置Edge TPU)、英特爾計算棒這三款針對人工智能設(shè)計的邊緣計算設(shè)備以及與不同人工智能算法模型的組合,結(jié)果表明:英偉達Jetson Nano 無論在推理時間還是推理準確率方面均體現(xiàn)出優(yōu)勢。
應用于邊緣計算場景下的硬件和芯片的節(jié)能功能對于邊緣計算來說非常重要[3],因為傳統(tǒng)的硬件運行此類任務時耗電量非常巨大。
2019年4月,瑞士aiCTX 公司發(fā)布了世界首款完全基于事件觸發(fā)運算的動態(tài)視覺人工智能處理器DynapCNN。其純異步、高可配置性、可拓展性等為開發(fā)和落地一系列邊緣端人工智能模型與應用提供了可能性。其基于動態(tài)視覺的事件觸發(fā)運算機制使得DynapCNN 芯片能夠?qū)⒐β式档偷絹唌W級別。此外,該芯片使用稀疏計算處理場景中的目標移動,在保障對移動目標實時識別可實現(xiàn)低于5ms 的超低延遲的同時,顯著降低了芯片的動態(tài)功耗。經(jīng)測,相較于已有的深度學習實時視覺處理方案,DynapCNN 所提供的超低延時動態(tài)視覺解決方案對比DL 加速器技術(shù),將識別響應延時縮短了90%以上,同時功耗降低99%以上。
2019年7月,英特爾公司發(fā)布了搭載64 顆Loihi 芯片的神經(jīng)擬態(tài)硬件原型系統(tǒng)Pohoiki-Beach。該原型系統(tǒng)功耗比傳統(tǒng)CPU 功耗降低99.08%以上,比特制的物聯(lián)網(wǎng)推理硬件功耗降低80%以上。從另一個角度測試結(jié)果顯示,當網(wǎng)絡(luò)規(guī)模擴大50 倍后,該系統(tǒng)依然能夠維持實時性能,功耗僅增加30%。反觀特制的物聯(lián)網(wǎng)推理硬件,其功耗會增加超過5 倍并失去實時性。因此,該原型系統(tǒng)對于獨立的自動駕駛技術(shù)來說至關(guān)重要。
而超低功耗的實時信息處理,是類腦芯片最顯著的標簽,因此,類腦芯片成為對物聯(lián)網(wǎng)前端傳感器信息進行本地實時低功耗處理的重要選擇之一。大腦的神奇之處在于實時處理復雜信息的同時只消耗極少的能量,而類腦芯片工程的目標不是模仿大腦,而是理解大腦如此高效的工作機制,并把這些機制用到芯片中。通常而言,在類腦芯片的脈沖神經(jīng)網(wǎng)絡(luò)中,在達到由變量(或者函數(shù))所描述的特定閾值時,神經(jīng)元才發(fā)出脈沖信號[4]。正是由于這種特性,只有當神經(jīng)元脈沖觀察到域的變化時,神經(jīng)形態(tài)系統(tǒng)才需要能量,所以類腦芯片相比經(jīng)典馮諾依曼計算架構(gòu)有顯著的功耗優(yōu)勢以及更強的自適應學習能力[5]。上述優(yōu)勢對邊緣計算在能效提升和實時性提升方面起到了至關(guān)重要的作用,尤其是在邊緣設(shè)備需要實時本地處理動態(tài)數(shù)據(jù)的情況下,例如自動駕駛汽車或者自助機器人等。
邊緣計算技術(shù)和應用仍處于開發(fā)的早期階段,亞馬遜公司、谷歌公司、微軟公司、英偉達公司等傳統(tǒng)云計算和硬件巨頭是該領(lǐng)域的領(lǐng)導者。目前,世界科技巨頭及廠商通常會將網(wǎng)關(guān)(歷史數(shù)據(jù)或設(shè)備交換數(shù)據(jù))和企業(yè)內(nèi)部部署服務器(在私有云中,但物理位置靠近AI 數(shù)據(jù)生成的地方)的數(shù)據(jù)置于邊緣側(cè)訓練。其中,專為企業(yè)內(nèi)部部署服務器的訓練任務所開發(fā)定制的芯片包括英偉達公司的DGX,以及針對來自Cerebras System、Graphcore 和Habana Labs等內(nèi)部部署數(shù)據(jù)中心的系統(tǒng)級產(chǎn)品。目前,邊緣側(cè)人工智能訓練市場較小,因為人工智能訓練任務更傾向于在云端執(zhí)行,目前英偉達公司在云端人工智能訓練領(lǐng)域處于主導地位。
根據(jù)ABI Research 統(tǒng)計分析,2019年至2024年期間邊緣人工智能市場將實現(xiàn)31%復合年增長率。邊緣人工智能市場近期著力點歸納如下:首先,WAN 網(wǎng)的傳感器中嵌入超低功耗人工智能芯片,因此這個領(lǐng)域主要由FPGA廠商、RISC-V設(shè)計廠商和ASIC 廠商主導。其次,機器人通常依賴異構(gòu)計算架構(gòu),例如:用于導航的SLAM(同時定位和映射)、用于人機界面交互的會話人工智能、用于對象檢測的機器視覺等,所有這些都會在不同程度上使用CPU、GPU和ASIC。目前,英偉達公司、英特爾公司和高通公司正在這個領(lǐng)域進行激烈的競爭。最后,涉及制造業(yè)、智能建筑、石油和天然氣等領(lǐng)域的智能工業(yè)應用,F(xiàn)PGA 廠商依托兼具靈活性和適應性的FPGA架構(gòu)而在該領(lǐng)域市場表現(xiàn)出眾。
當前,邊緣計算產(chǎn)業(yè)生態(tài)架構(gòu)已初步形成,世界科技巨頭在該生態(tài)中的定位主要包括三類:首先,從算法切入,提供面向邊緣側(cè)智能的計算機視覺算法和自然語言處理算法等。其次,從硬件切入,提供手機、筆記本電腦等(移動)終端硬件等。最后,從算力切入,提供面向邊緣計算的人工智能芯片等[6]。此外,在邊緣計算的發(fā)展中,還有一個值得注意的概念——霧計算。霧計算強調(diào)設(shè)備網(wǎng)關(guān)中的數(shù)據(jù)處理,數(shù)據(jù)通過霧計算收集到設(shè)備的網(wǎng)關(guān),然后在需要數(shù)據(jù)的設(shè)備中進行處理、存儲和應用[7]。邊緣計算強調(diào)邊緣側(cè),即更靠近數(shù)據(jù)生成的設(shè)備端(數(shù)據(jù)源),所以霧計算介于傳統(tǒng)云計算和邊緣計算之間。
目前,邊緣計算已經(jīng)在自動駕駛、智能安防、消費電子等領(lǐng)域產(chǎn)生爆發(fā)式應用。以自動駕駛為例,在高速行駛的情況下,確保安全的首要前提是實時性。然而,由于網(wǎng)絡(luò)終端的延遲以及無法預知的網(wǎng)絡(luò)帶寬堵塞,云計算不能保證實時性,因此面向邊緣計算的車載終端計算平臺成為自動駕駛計算發(fā)展的必然趨勢[8]。此外,伴隨著電氣化的發(fā)展趨勢,低功耗對于汽車工業(yè)變得越來越重要,因此滿足實時性和低功耗需求的ASIC 芯片將成為車載計算平臺的未來發(fā)展趨勢。以智能安防為例,與傳統(tǒng)的視頻監(jiān)控相比,人工智能加持的視頻監(jiān)控最重要的變革是將被動監(jiān)控變?yōu)橹鲃臃治龊皖A警,因此有效降低了手動處理大量監(jiān)視數(shù)據(jù)帶來的巨大人力成本和應激反應時延;另一方面,隨著圖像識別和硬件技術(shù)的發(fā)展,依托邊緣計算的終端智能安防的條件越來越成熟[9]。在工業(yè)領(lǐng)域,邊緣計算也發(fā)揮著越來越重要的作用,因為從工業(yè)發(fā)展的方向來看,數(shù)據(jù)將成為驅(qū)動生產(chǎn)和制造的重要生產(chǎn)手段,因此如何處理這些海量的實時數(shù)據(jù)已成為企業(yè)快速發(fā)展的重要問題。
隨著人工智能在邊緣計算平臺中的應用,以及對邊緣計算和物聯(lián)網(wǎng)“端-云”的日益增長的推動,邊緣智能已成為邊緣計算的一種新形式,打通物聯(lián)網(wǎng)應用的“最后一公里”[2]。目前,邊緣計算的研發(fā)面臨以下挑戰(zhàn):
圖2 邊緣計算面臨的挑戰(zhàn)分析Fig.2 Analysis of the challenges faced by edge computing
(1)電源與功耗。邊緣計算設(shè)備往往處于圈層感知網(wǎng)絡(luò)的末端,部署量非常巨大,如何在這些“末梢位置”為邊緣計算設(shè)備提供充足的電源供給,是邊緣計算技術(shù)與設(shè)備大面積落地應用所要面臨的關(guān)鍵問題。在這種情況下,通過電源架供電并進行電力智能分配策略,已成為一種越來越常見的機制[3],然而如何降低邊緣計算設(shè)備功耗應該是解決該問題的主要突破口之一[10]。
(2)人工智能與人工智能芯片。高效的邊緣計算技術(shù)與設(shè)備離不開高效的人工智能芯片。它不僅能夠提高算力,而且可以有效降低功耗。特別是人工智能芯片所搭載的人工智能算法模型,能夠在提供額定數(shù)據(jù)實時邊緣處理能力基礎(chǔ)上有效甄別數(shù)據(jù)重要程度,從而完成數(shù)據(jù)清洗,進而降低邊緣計算設(shè)備損耗以及對邊緣計算設(shè)備進行管理檢修和異常檢測感知[11]。
(3)安全與隱私。與其他技術(shù)一樣,邊緣計算技術(shù)在安全性方面并非萬無一失,它需要提供一套與傳統(tǒng)集中式計算和存儲不同的數(shù)據(jù)安全與隱私保護策略[12]。因此,邊緣端的安全措施需要進行大規(guī)模的升級改造以支撐邊緣計算安全運行。
(4)5G。作為未來網(wǎng)絡(luò)的5G與邊緣計算的融合和銜接成為研究重點,二者互補性強,已成為彼此大規(guī)模應用的必要保障。5G 網(wǎng)絡(luò)所能提供的更快速度,能夠有效保障邊緣計算與物聯(lián)網(wǎng)進行低延遲的高效通信[12-14],為云端計算預留更多的數(shù)據(jù)處理能力和網(wǎng)絡(luò)連接能力。
當今社會和科技發(fā)展正在邁向以數(shù)據(jù)為中心的嶄新世界,“萬物智能互聯(lián)”是最具代表性的趨勢之一。邊緣計算技術(shù)能夠應用于自動駕駛、物聯(lián)網(wǎng)、機器人、醫(yī)養(yǎng)等諸多行業(yè),同時也成為5G 衍生概念,在當下世界各國進入5G“攻堅戰(zhàn)”的關(guān)鍵時期,得到了更多的關(guān)注。數(shù)據(jù)爆發(fā)式、指數(shù)級增長的趨勢已經(jīng)不可阻擋,并將繼續(xù)呈指數(shù)級增長。首先在數(shù)據(jù)中心處理大量數(shù)據(jù)、然后在云中處理這些數(shù)據(jù)的傳統(tǒng)方式已不適用于具有大量數(shù)據(jù)的高需求任務,網(wǎng)絡(luò)的性能和速度繼續(xù)擴展著新的性能極限,隨之而來的是對新解決方案的需求,現(xiàn)在是邊緣計算和邊緣設(shè)備時代的開始。邊緣計算將數(shù)據(jù)處理任務放置在網(wǎng)絡(luò)邊緣(靠近數(shù)據(jù)源)的設(shè)備上,這種計算方法可以非??焖俚貙崿F(xiàn)實時數(shù)據(jù)處理,對于具有機器學習能力和人工智能能力的許多復雜的物聯(lián)網(wǎng)解決方案來說是必需的。