美國積極研發(fā)人工智能影像判讀算法

2019-07-30 07:11:42池衛(wèi)紅韓曉樂中國人民解放軍95894部隊北京市昌平區(qū)100085

無人機 2019年6期

池衛(wèi)紅韓曉樂 / 中國人民解放軍95894部隊，北京市昌平區(qū) 100085

為應(yīng)對海量偵察數(shù)據(jù)，美國積極推進人工智能技術(shù)在偵察影像識別判讀領(lǐng)域的開發(fā)。本文以識別衛(wèi)星影像為例介紹了美國正在開發(fā)的人工智能輔助判讀技術(shù)以及為推進該技術(shù)所需解決的問題。

美軍偵察平臺多，收集能力強，衛(wèi)星、無人機和其他偵察監(jiān)視平臺收集的數(shù)據(jù)遠(yuǎn)超出人類可以分析的能力。以美軍無人機為例，美軍現(xiàn)有11000多架，每年收集數(shù)十萬小時的視頻數(shù)據(jù)。情報部門每天用一個傳感器在一個戰(zhàn)區(qū)內(nèi)捕捉到的數(shù)據(jù)超過美國國家橄欖球三個賽季的高清圖像數(shù)據(jù)。例如，一個廣域運動圖像傳感器，它可以觀察整座城市，但是20多位分析人員夜以繼日地工作也只能分析其中的6%～12%。為應(yīng)對海量數(shù)據(jù)，減輕影像判讀人員的工作量，美國積極推進人工智能技術(shù)在影像識別判讀領(lǐng)域的開發(fā)。

算法開發(fā)

美國情報預(yù)研局從2017年7月到2018年2月啟動了“世界功能地圖挑戰(zhàn)賽”，旨在通過利用人工智能技術(shù)，對衛(wèi)星影像自動化分析方面實現(xiàn)突破。美國情報預(yù)研局成立于2006年,參照國防預(yù)研局設(shè)立,受美國家情報局長領(lǐng)導(dǎo)。它共有500個合作機構(gòu),為美國政府17個情報機構(gòu)服務(wù)。

“世界功能地圖挑戰(zhàn)賽”邀請了工業(yè)界和學(xué)術(shù)界研發(fā)人員開發(fā)能夠掃描和識別衛(wèi)星圖像中不同類別物體的深度學(xué)習(xí)算法。情報預(yù)研局提供了100萬張做好標(biāo)注的高分辨率衛(wèi)星圖像，供參研人員和機構(gòu)使用自動算法和大量圖像訓(xùn)練算法，使其將對象分為63類，如機場、學(xué)校、油井、造船廠或港口。

研究人員通過將稱為卷積神經(jīng)網(wǎng)絡(luò)（convolutional neural networks）的大型神經(jīng)網(wǎng)絡(luò)和具有大量處理能力的計算機結(jié)合起來，為深層學(xué)習(xí)算法提供動力。在提供給大量訓(xùn)練數(shù)據(jù)后，可以學(xué)習(xí)識別和分類衛(wèi)星圖像上不同的物體。通過將一些這樣的網(wǎng)絡(luò)組合成整體，該算法可以判斷每個卷積神經(jīng)網(wǎng)絡(luò)的結(jié)果，最終產(chǎn)生一個比單個卷積神經(jīng)網(wǎng)絡(luò)更強更優(yōu)的結(jié)果。上述是美洛克希德·馬丁小組的設(shè)計方案，該小組使用機器學(xué)習(xí)軟件和從在線開源軟件庫（如Tensor Flow）獲取的框架開發(fā)了其卷積神經(jīng)網(wǎng)絡(luò)。該算法在識別速度上獲得了前五名，算法總精度達到83%，并能夠?qū)崿F(xiàn)每秒對100個對象進行分類，如果使用完全有效的算法，該軟件可將人類1h完成的圖像識別任務(wù)，縮減至到幾秒鐘。該小組的算法擅長識別具有鮮明特征的物體，以高于95%的精度成功識別了核電站、隧道口、跑道和風(fēng)力發(fā)電場等，但是識別特征相似的物體存在困難，如船廠、港口、醫(yī)院、辦公樓和警察局等。開發(fā)人員指出，從衛(wèi)星圖像來看，這些物體根本沒有任何區(qū)別性特征。

若要這些新類型算法產(chǎn)生作用，所需添加的最重要成分是數(shù)據(jù)集，因為這些算法需要大量的數(shù)據(jù)進行訓(xùn)練，這是一種類似于人類童年時期學(xué)習(xí)如何識別事物的方式。需要“這些物體是什么”的大量例子，然后開始概括，逐漸做出自己的判斷。但是，即使有大量正確標(biāo)記的訓(xùn)練數(shù)據(jù)，今天的深度學(xué)習(xí)技術(shù)可能也不能達到更高層次的智力水平，識別細(xì)微差別。例如，洛克希德·馬丁公司小組的算法將船廠和港口混淆的次數(shù)達56%。小組開發(fā)人員稱，人類看到一個圖像時，通常觀察事物的細(xì)微處，如干船塢內(nèi)是否有船只，是否存在某種類型的起重機，從而可以區(qū)分出港口或造船廠，而人工智能算法目前還做不到。開發(fā)小組正在尋找圖像中這些深度學(xué)習(xí)算法目前無法計算的更高層次或更復(fù)雜的細(xì)節(jié)。目前，情報預(yù)研局人員正在更新和維護數(shù)據(jù)集，以確保算法可以獲得最新的數(shù)據(jù)信息進行訓(xùn)練，最終使基于卷積神經(jīng)網(wǎng)絡(luò)的算法更受信任。例如，某一區(qū)域中細(xì)小的變化將使系統(tǒng)大腦混亂，系統(tǒng)會給出完全錯誤的答案，因此，情報預(yù)研局人員計劃不斷地研究這個地區(qū)，確保其正在開發(fā)和為政府重新評估的算法繼續(xù)得到測試和使用，最終在應(yīng)用中變得更加強壯。

美國大學(xué)也正在開展算法研究工作。波士頓大學(xué)的一個研究小組正在使用“世界功能地圖”數(shù)據(jù)集和經(jīng)過測試的算法創(chuàng)建熱圖（heat maps），這些熱圖可以顯示出算法所使用的那部分圖像。他們發(fā)現(xiàn)，有時不是物體本身，而是圍繞在物體周圍的線索在分類識別中提供了最多的幫助。例如，風(fēng)車顯示的陰影可以很好的幫助識別出風(fēng)車這一物體。陰影為識別物體提供了更好的視圖。波士頓大學(xué)熱映射算法實際上指出了陰影的重要性，它是識別出風(fēng)車的關(guān)鍵特征。這一算法利用了影像判讀識別特征之一—陰影。

需要解決的問題

美軍和地方技術(shù)工業(yè)部門指出，實現(xiàn)人工智能技術(shù)輔助解譯判讀面臨數(shù)個挑戰(zhàn)，需要解決好一些問題。

需要對算法進行再訓(xùn)練

利用某一地區(qū)數(shù)據(jù)訓(xùn)練的算法應(yīng)用到另一個新地區(qū),最初可能會出現(xiàn)一些低級錯誤。為解決這一問題，研究人員目前在用戶界面中加入了一個名為“訓(xùn)練AI”的按鈕。如果發(fā)現(xiàn)算法誤將棕櫚樹識別為人或出現(xiàn)類似錯誤時，分析員可點擊“訓(xùn)練AI”按鈕對算法進行訓(xùn)練，將該幀視頻從戰(zhàn)區(qū)環(huán)境中分離出，單獨進行數(shù)據(jù)標(biāo)記，并迅速發(fā)送給算法開發(fā)人員，由開發(fā)人員對算法重新訓(xùn)練并進行優(yōu)化。

需要大量的結(jié)構(gòu)化數(shù)據(jù)

為構(gòu)建算法，需要大量的訓(xùn)練數(shù)據(jù)和標(biāo)記數(shù)據(jù)。對于計算機視覺，需要為成千上萬的圖像貼上標(biāo)簽，即常說的結(jié)構(gòu)化數(shù)據(jù)，而不是原始數(shù)據(jù)或非結(jié)構(gòu)化數(shù)據(jù)，這樣系統(tǒng)才能識別出它們所看到的東西。若不經(jīng)過標(biāo)記，算法很難完成其工作。目前美軍正在構(gòu)建一個國防部數(shù)據(jù)標(biāo)簽體系。政府、學(xué)術(shù)界和工業(yè)界正在尋找更好的方法，促成機器能夠理解新的數(shù)據(jù)，并利用大量的未標(biāo)記數(shù)據(jù)。約翰·霍普金斯大學(xué)應(yīng)用物理實驗室致力于將遷移學(xué)習(xí)技術(shù)應(yīng)用于圖像分類、檢測和分割。通過使用卷積神經(jīng)網(wǎng)絡(luò)，機器學(xué)習(xí)可以從先前面向一個問題的數(shù)據(jù)集應(yīng)用到面向另一個問題的數(shù)據(jù)集。利用遷移學(xué)習(xí)和無監(jiān)督機器學(xué)習(xí)可以提高算法。

圖1 利用人工智能識別標(biāo)注出的三個機場，三個機場位于美國佛羅里達州中部。

圖2 北京首都機場局部衛(wèi)星影像圖

需要提供自適應(yīng)的用戶界面

為算法操作人員和分析人員提供的用戶界面必須是可定制和自適應(yīng)的。用戶界面應(yīng)該使操作人員能夠根據(jù)正在執(zhí)行的任務(wù)選擇相應(yīng)的算法，為某個區(qū)域定制的算法并不會完全適合另一個區(qū)域。用戶界面還應(yīng)提供可調(diào)節(jié)置信度的工具。部分操作人員可能希望算法識別置信度達到80%及以上，另一些操作人員可能會將置信度降至20%，這有可能識別人類通常無法發(fā)現(xiàn)的結(jié)果。

需要具備強大的計算能力

計算能力是算法開發(fā)的一個重要依賴。如果沒有云計算，算法戰(zhàn)是達不到效果的，但是今天的云計算技術(shù)并不是針對人工智能和機器學(xué)習(xí)優(yōu)化的，需要進一步的開發(fā)。未來的量子計算和量子計算機將是這一方面最具有發(fā)展希望的解決方案。

需要指出的是，這些算法并不能在不久將來替代圖像判讀分析人員，人工智能不會奪走判讀人員的工作并取代人類，重要的判斷和高層次思考仍舊需要人類，人類需要做的是找出如何有效使用人工智能技術(shù)，了解人工智能的優(yōu)勢和弱勢，使其充分發(fā)揮效能?！?/p>