池衛(wèi)紅 韓曉樂 / 中國人民解放軍95894部隊,北京市 昌平區(qū) 100085
為應(yīng)對海量偵察數(shù)據(jù),美國積極推進人工智能技術(shù)在偵察影像識別判讀領(lǐng)域的開發(fā)。本文以識別衛(wèi)星影像為例介紹了美國正在開發(fā)的人工智能輔助判讀技術(shù)以及為推進該技術(shù)所需解決的問題。
美軍偵察平臺多,收集能力強,衛(wèi)星、無人機和其他偵察監(jiān)視平臺收集的數(shù)據(jù)遠(yuǎn)超出人類可以分析的能力。以美軍無人機為例,美軍現(xiàn)有11000多架,每年收集數(shù)十萬小時的視頻數(shù)據(jù)。情報部門每天用一個傳感器在一個戰(zhàn)區(qū)內(nèi)捕捉到的數(shù)據(jù)超過美國國家橄欖球三個賽季的高清圖像數(shù)據(jù)。例如,一個廣域運動圖像傳感器,它可以觀察整座城市,但是20多位分析人員夜以繼日地工作也只能分析其中的6%~12%。為應(yīng)對海量數(shù)據(jù),減輕影像判讀人員的工作量,美國積極推進人工智能技術(shù)在影像識別判讀領(lǐng)域的開發(fā)。
美國情報預(yù)研局從2017年7月到2018年2月啟動了“世界功能地圖挑戰(zhàn)賽”,旨在通過利用人工智能技術(shù),對衛(wèi)星影像自動化分析方面實現(xiàn)突破。美國情報預(yù)研局成立于2006年,參照國防預(yù)研局設(shè)立,受美國家情報局長領(lǐng)導(dǎo)。它共有500個合作機構(gòu),為美國政府17個情報機構(gòu)服務(wù)。
“世界功能地圖挑戰(zhàn)賽”邀請了工業(yè)界和學(xué)術(shù)界研發(fā)人員開發(fā)能夠掃描和識別衛(wèi)星圖像中不同類別物體的深度學(xué)習(xí)算法。情報預(yù)研局提供了100萬張做好標(biāo)注的高分辨率衛(wèi)星圖像,供參研人員和機構(gòu)使用自動算法和大量圖像訓(xùn)練算法,使其將對象分為63類,如機場、學(xué)校、油井、造船廠或港口。
研究人員通過將稱為卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks)的大型神經(jīng)網(wǎng)絡(luò)和具有大量處理能力的計算機結(jié)合起來,為深層學(xué)習(xí)算法提供動力。在提供給大量訓(xùn)練數(shù)據(jù)后,可以學(xué)習(xí)識別和分類衛(wèi)星圖像上不同的物體。通過將一些這樣的網(wǎng)絡(luò)組合成整體,該算法可以判斷每個卷積神經(jīng)網(wǎng)絡(luò)的結(jié)果,最終產(chǎn)生一個比單個卷積神經(jīng)網(wǎng)絡(luò)更強更優(yōu)的結(jié)果。上述是美洛克希德·馬丁小組的設(shè)計方案,該小組使用機器學(xué)習(xí)軟件和從在線開源軟件庫(如Tensor Flow)獲取的框架開發(fā)了其卷積神經(jīng)網(wǎng)絡(luò)。該算法在識別速度上獲得了前五名,算法總精度達到83%,并能夠?qū)崿F(xiàn)每秒對100個對象進行分類,如果使用完全有效的算法,該軟件可將人類1h完成的圖像識別任務(wù),縮減至到幾秒鐘。該小組的算法擅長識別具有鮮明特征的物體,以高于95%的精度成功識別了核電站、隧道口、跑道和風(fēng)力發(fā)電場等,但是識別特征相似的物體存在困難,如船廠、港口、醫(yī)院、辦公樓和警察局等。開發(fā)人員指出,從衛(wèi)星圖像來看,這些物體根本沒有任何區(qū)別性特征。
若要這些新類型算法產(chǎn)生作用,所需添加的最重要成分是數(shù)據(jù)集,因為這些算法需要大量的數(shù)據(jù)進行訓(xùn)練,這是一種類似于人類童年時期學(xué)習(xí)如何識別事物的方式。需要“這些物體是什么”的大量例子,然后開始概括,逐漸做出自己的判斷。但是,即使有大量正確標(biāo)記的訓(xùn)練數(shù)據(jù),今天的深度學(xué)習(xí)技術(shù)可能也不能達到更高層次的智力水平,識別細(xì)微差別。例如,洛克希德·馬丁公司小組的算法將船廠和港口混淆的次數(shù)達56%。小組開發(fā)人員稱,人類看到一個圖像時,通常觀察事物的細(xì)微處,如干船塢內(nèi)是否有船只,是否存在某種類型的起重機,從而可以區(qū)分出港口或造船廠,而人工智能算法目前還做不到。開發(fā)小組正在尋找圖像中這些深度學(xué)習(xí)算法目前無法計算的更高層次或更復(fù)雜的細(xì)節(jié)。目前,情報預(yù)研局人員正在更新和維護數(shù)據(jù)集,以確保算法可以獲得最新的數(shù)據(jù)信息進行訓(xùn)練,最終使基于卷積神經(jīng)網(wǎng)絡(luò)的算法更受信任。例如,某一區(qū)域中細(xì)小的變化將使系統(tǒng)大腦混亂,系統(tǒng)會給出完全錯誤的答案,因此,情報預(yù)研局人員計劃不斷地研究這個地區(qū),確保其正在開發(fā)和為政府重新評估的算法繼續(xù)得到測試和使用,最終在應(yīng)用中變得更加強壯。
美國大學(xué)也正在開展算法研究工作。波士頓大學(xué)的一個研究小組正在使用“世界功能地圖”數(shù)據(jù)集和經(jīng)過測試的算法創(chuàng)建熱圖(heat maps),這些熱圖可以顯示出算法所使用的那部分圖像。他們發(fā)現(xiàn),有時不是物體本身,而是圍繞在物體周圍的線索在分類識別中提供了最多的幫助。例如,風(fēng)車顯示的陰影可以很好的幫助識別出風(fēng)車這一物體。陰影為識別物體提供了更好的視圖。波士頓大學(xué)熱映射算法實際上指出了陰影的重要性,它是識別出風(fēng)車的關(guān)鍵特征。這一算法利用了影像判讀識別特征之一—陰影。
美軍和地方技術(shù)工業(yè)部門指出,實現(xiàn)人工智能技術(shù)輔助解譯判讀面臨數(shù)個挑戰(zhàn),需要解決好一些問題。
利用某一地區(qū)數(shù)據(jù)訓(xùn)練的算法應(yīng)用到另一個新地區(qū),最初可能會出現(xiàn)一些低級錯誤。為解決這一問題,研究人員目前在用戶界面中加入了一個名為“訓(xùn)練AI”的按鈕。如果發(fā)現(xiàn)算法誤將棕櫚樹識別為人或出現(xiàn)類似錯誤時,分析員可點擊“訓(xùn)練AI”按鈕對算法進行訓(xùn)練,將該幀視頻從戰(zhàn)區(qū)環(huán)境中分離出,單獨進行數(shù)據(jù)標(biāo)記,并迅速發(fā)送給算法開發(fā)人員,由開發(fā)人員對算法重新訓(xùn)練并進行優(yōu)化。
為構(gòu)建算法,需要大量的訓(xùn)練數(shù)據(jù)和標(biāo)記數(shù)據(jù)。對于計算機視覺,需要為成千上萬的圖像貼上標(biāo)簽,即常說的結(jié)構(gòu)化數(shù)據(jù),而不是原始數(shù)據(jù)或非結(jié)構(gòu)化數(shù)據(jù),這樣系統(tǒng)才能識別出它們所看到的東西。若不經(jīng)過標(biāo)記,算法很難完成其工作。目前美軍正在構(gòu)建一個國防部數(shù)據(jù)標(biāo)簽體系。政府、學(xué)術(shù)界和工業(yè)界正在尋找更好的方法,促成機器能夠理解新的數(shù)據(jù),并利用大量的未標(biāo)記數(shù)據(jù)。約翰·霍普金斯大學(xué)應(yīng)用物理實驗室致力于將遷移學(xué)習(xí)技術(shù)應(yīng)用于圖像分類、檢測和分割。通過使用卷積神經(jīng)網(wǎng)絡(luò),機器學(xué)習(xí)可以從先前面向一個問題的數(shù)據(jù)集應(yīng)用到面向另一個問題的數(shù)據(jù)集。利用遷移學(xué)習(xí)和無監(jiān)督機器學(xué)習(xí)可以提高算法。
圖1 利用人工智能識別標(biāo)注出的三個機場,三個機場位于美國佛羅里達州中部。
圖2 北京首都機場局部衛(wèi)星影像圖
為算法操作人員和分析人員提供的用戶界面必須是可定制和自適應(yīng)的。用戶界面應(yīng)該使操作人員能夠根據(jù)正在執(zhí)行的任務(wù)選擇相應(yīng)的算法,為某個區(qū)域定制的算法并不會完全適合另一個區(qū)域。用戶界面還應(yīng)提供可調(diào)節(jié)置信度的工具。部分操作人員可能希望算法識別置信度達到80%及以上,另一些操作人員可能會將置信度降至20%,這有可能識別人類通常無法發(fā)現(xiàn)的結(jié)果。
計算能力是算法開發(fā)的一個重要依賴。如果沒有云計算,算法戰(zhàn)是達不到效果的,但是今天的云計算技術(shù)并不是針對人工智能和機器學(xué)習(xí)優(yōu)化的,需要進一步的開發(fā)。未來的量子計算和量子計算機將是這一方面最具有發(fā)展希望的解決方案。
需要指出的是,這些算法并不能在不久將來替代圖像判讀分析人員,人工智能不會奪走判讀人員的工作并取代人類,重要的判斷和高層次思考仍舊需要人類,人類需要做的是找出如何有效使用人工智能技術(shù),了解人工智能的優(yōu)勢和弱勢,使其充分發(fā)揮效能?!?/p>