技術(shù)宅
我們只要打開瀏覽器登錄https://thispersondoesnotexist.com,成功加載網(wǎng)頁(yè)后就會(huì)看到一幅人物畫像,可以看到這些人像非常的真實(shí),而且每刷新一次會(huì)出現(xiàn)新的畫像,他們就像是我們生活中的各個(gè)普通人物(圖1)。
那么這些人像是怎么生成的呢?該網(wǎng)站明確表示,是基于GAN的StyleGAN算法生成的。GAN是Generative AdversarialNetworks(生成式對(duì)抗網(wǎng)絡(luò))的簡(jiǎn)稱,它是一種深度學(xué)習(xí)模型,這種模型一般包括兩個(gè)模塊:生成模型G(Generative Model)和判別模型D(Discriminative Model),通過(guò)兩個(gè)模型的互相博弈學(xué)習(xí)產(chǎn)生完美的輸出。博弈的結(jié)果是讓G可以生成足以“以假亂真”的圖片G(z)。
因?yàn)椴┺挠?xùn)練需要大量的運(yùn)算,隨著GPU運(yùn)算能力的提升,2018年英偉達(dá)開發(fā)了基于GAN的人工智能算法——StyleGAN,它可以合成足以騙過(guò)人類的各種假人臉。StyleGAN的算法生成器和普通的GAN不一樣,它是借助風(fēng)格遷移的思路重新發(fā)明的。在實(shí)際訓(xùn)練中,科學(xué)家們向AI輸入兩張圖,比如圖A決定人物的年齡、性別、頭發(fā)長(zhǎng)度和姿勢(shì);圖B決定一切其他因素,如膚色、發(fā)色、衣服顏色等等。這樣通過(guò)博弈訓(xùn)練后,圖B的畫風(fēng)就自然遷移給A,從而生成一個(gè)A、B融合的新圖片(圖2)。
顯然StyleGAN的核心是融合,將多張不同風(fēng)格的目標(biāo)任務(wù)融合在一個(gè)輸出目標(biāo)上。為了讓生成的人像更為逼真、多變和自然。StyleGAN先通過(guò)學(xué)習(xí)在低分辨率下出現(xiàn)的基本特征來(lái)創(chuàng)建基礎(chǔ)圖像,然后通過(guò)更高分辨率的圖片訓(xùn)練來(lái)識(shí)別更多的細(xì)節(jié),這樣通過(guò)漸進(jìn)式訓(xùn)練,最終融合輸出的照片就顯得非常自然、逼真(圖3)。
StyleGAN通過(guò)從粗糙、中等、精細(xì)三種R度上調(diào)節(jié)圖像的生成。其中粗糙是指規(guī)模最大的調(diào)整,它的分辨率在42-82之間,比如人臉的朝向、臉型和發(fā)型,都在這里調(diào)整。通過(guò)粗糙調(diào)整,讓AI畫出幾乎風(fēng)格、外形完全不同的人物畫像(圖4)。中等則是只調(diào)整部分特征,比如對(duì)臉部特征、發(fā)色發(fā)量、鼻子大小等局部的特征進(jìn)行調(diào)整,這樣生成的圖像看上去似曾相識(shí),但是仔細(xì)觀察卻可以看到臉部特征是不同的。精細(xì)改變的是圖像的配色,幾乎不會(huì)給人物變臉。
當(dāng)然這三種調(diào)整不是獨(dú)立的,而是相輔相成的,StyleGAN通過(guò)特定的算法將它們組合在一起,最終實(shí)現(xiàn)完美的輸出,即通過(guò)簡(jiǎn)單的輸入,如選擇一種自己喜歡的臉型、發(fā)型或膚色,StyleGAN在后臺(tái)就可以通過(guò)預(yù)置的算法生成你需要的人像(圖5)。
回到文章前面介紹的網(wǎng)站,這是一位來(lái)自Uber的軟件工程師Philip Wang創(chuàng)建的,他利用的正是英偉達(dá)創(chuàng)建的StyleGAN算法,創(chuàng)作了源源不斷的假人像。當(dāng)訪問(wèn)者每次刷新這個(gè)網(wǎng)站,網(wǎng)站后臺(tái)服務(wù)器就會(huì)使用StyleGAN算法結(jié)合上述介紹的三種調(diào)整來(lái)重新生成一張以假亂真的人物圖像(圖6)。
通過(guò)上面的介紹我們見(jiàn)識(shí)到了基于StyleGAN算法的AI畫像的超能力。AI畫像的模仿能力可以讓我們有意想不到的驚喜,比如去年的“天價(jià)”AI畫作事件,佳士得拍賣行以43.25萬(wàn)美元(約為300萬(wàn)人民幣)的高價(jià)拍出一件人工智能藝術(shù)品(圖7)。
雖然目前模型是被訓(xùn)練用來(lái)生成人臉圖像的,但理論上來(lái)說(shuō)它可以模仿任何來(lái)源的圖像。比如我們可以利用這個(gè)模型來(lái)生成新的字體,這樣設(shè)計(jì)師們?cè)僖膊挥每嗨稼は?,利用現(xiàn)成的海報(bào)字體就可以“模仿”出各種漂亮的字體了(圖8)。
當(dāng)然隱憂也是顯而易見(jiàn)的,比如可能有不懷好意的人利用它來(lái)生成一個(gè)不存在的人,然后利用臆想的文字編造假新聞,這種有圖有真相的假新聞可能會(huì)造成各種不良的影響。類似的,用GAN模仿字跡寫欠條、換臉開門禁,這類看似不可能完成的任務(wù),在以后的生活中可能一一出現(xiàn)。任何一項(xiàng)新技術(shù)的出現(xiàn),其好壞兩面的評(píng)估都值得科學(xué)家認(rèn)真、審慎地去對(duì)待!