技術(shù)宅
GAN是Generative AdversarialNetworks的縮寫,譯為生成式對抗網(wǎng)絡,它是一種深度學習模型。大家知道要讓機器擁有人工智能,大量的學習是必不可少的,現(xiàn)在Al大多使用的是大數(shù)據(jù)+深度學習的模式,而要讓機器深度學習,模型是必不可少的要素。GAN主要由N、A、G組成(圖1)。
N即Networks,深度神經(jīng)網(wǎng)絡,Al通過神經(jīng)網(wǎng)絡可以學習和自我學習,從而掌握很多高深的技術(shù)。
A即Adversarial:對抗,Al通過深度學習后成為“高手”,在模型系統(tǒng)中這個“高手”會和自己對弈,從而在互相對弈中提高技能。
G即Generative(Model):生成模型,通過神經(jīng)網(wǎng)絡學習以及自我對弈,這樣即可生成模型,最終通過不斷完善模型和算法,讓Al擁有超凡的人工智能。
通過上面的描述我們簡單了解了GAN的組成,那么在Al的實際運行中,GAN又是怎樣實現(xiàn)深度學習,讓Al擁有高超的人工智能的呢?
如上所述,GAN是由神經(jīng)網(wǎng)絡、對抗和模型組成的,其中核心則是對抗。對抗模型也稱為GAN框架,這個框架主要由生成模型G和判別模型D組成。在開始訓練的時候,系統(tǒng)會把真實樣本數(shù)據(jù)(X)隨機傳送一份給判別模型D,D的目標是盡可能正確識別出真實樣本(如果正確則輸出為“真”或者“1”)。同時用于識別的噪聲數(shù)據(jù)樣本(Z)也會隨機傳輸一份給生成模型G,G會將處理的數(shù)據(jù)也傳輸給D進行判別。這樣D既要判斷真實的數(shù)據(jù)(并盡可能識別為真),也要對噪聲數(shù)據(jù)進行識別(盡可能正確地揪出生成的樣本,也就是假樣本輸出為“假”或者0)。在訓練過程中雙方都不斷優(yōu)化自己,直到達到平衡,即假樣本與真樣本完全不可區(qū)分(圖2)。
當然技術(shù)術(shù)語的解釋總是很晦澀,我們可以用足球運動來進行比喻。在GAN框架中,這里我們將生成模型G比喻為球員的“假摔”,他們的目標是使用各種手段迷惑裁判,使得自己進攻或者防守戰(zhàn)術(shù)動作是合規(guī)的。比如球門前的假摔看上去像真的對方犯規(guī)一樣,判別模型則相當于裁判,他們的目標是將球員各種混雜在合規(guī)戰(zhàn)術(shù)里的違規(guī)動作找出來。在球員和裁判的不斷對抗中,球員的“假摔”水平越來越高,裁判識別“假摔”的水平也越來越高。隨著兩方水平的不斷提高,最終誰都無法區(qū)分出哪個動作是真正的“假摔”,也就是Al的水平已經(jīng)實現(xiàn)以假亂真(圖3)。
當然在實際的應用中,Al不是用來制作興奮劑,而是指其強大的自我糾錯和學習能力。借助GAN框架,Al可以擁有人類無法想象的超級能力。比如上一期介紹的自畫像,Al可以描繪出入類無法表達的畫面。在類似的場景中還有很多有趣的應用,比如在很多廣告創(chuàng)意中,藝術(shù)家會投入很多時間設計在視覺上與其他元素的形狀和紋理相兼容的字形,但是這樣手工設計的字形是和當前場景緊密集成在一起的,即使是同一幅畫面,如果要制作出同樣效果的字形,藝術(shù)家也不得不重復勞動,因為根據(jù)目前的技術(shù)很難將它遷移到其他類似的項目中。
現(xiàn)在借助GAN的學習,Al可以很輕松地學會并領(lǐng)會藝術(shù)家的意圖,它會先對畫面環(huán)境、光線、場景等進行學習,然后對字體在這畫面的各種情形進行讀取,并將字體的每個元素拆分學習,如對字體的形態(tài)、顏色、手法等進行精密學習,從而精準復制出和海報場景非常契合的字形,并將這些原來很難遷移的字形進行任意的移植(圖4)。
通過上述介紹可以看到,借助GAN框架學習,Al可以掌握甚至超過很多人類掌握的技能。Al的這些技術(shù)可以給我們的生活帶來很多的便利。
比如GAN對字體超高的學習能力,它可以被用來學習生成各種各樣的字體,同樣可以用它來進行個人字體、字跡的辨別。這樣以后如果哪個老賴簽字卻否認是他簽名的文字,我們可能不要借助專業(yè)的鑒別機構(gòu)就可以輕松地進行鑒別了(圖5)。
當然GAN還有很多應用,比如基于Age-cGAN開發(fā)的應用OLDIFY,可以合成你任意年齡之后或者之前的形態(tài),只要有一張年輕時候的照片,你就可以提前知道自己幾十年之后,或者回憶十幾年之前的樣子,這是不是很有趣(圖6)?
當然GAN框架在很多領(lǐng)域還有非常實用的應用,比如在醫(yī)學領(lǐng)域,GAN可以通過對復雜疾病的診斷學習,幫助醫(yī)生在以后的病例中快速對病人做出全面、科學的診斷。警察可以借助GAN從監(jiān)控視頻中將分割圖還原成真實照片,將黑白圖變成彩色圖,對犯罪嫌疑人進行精準的識別,讓犯罪嫌疑人無處遁形,我們期待GAN給我們帶來更多的應用!