此人不存在

2019-10-30 03:44:24技術(shù)宅

電腦愛(ài)好者 2019年7期

技術(shù)宅

AI畫像——“真實(shí)”的不存在

我們只要打開瀏覽器登錄https：//thispersondoesnotexist.com，成功加載網(wǎng)頁(yè)后就會(huì)看到一幅人物畫像，可以看到這些人像非常的真實(shí)，而且每刷新一次會(huì)出現(xiàn)新的畫像，他們就像是我們生活中的各個(gè)普通人物（圖1）。

AI畫像背后——認(rèn)識(shí)StyleGAN算法

那么這些人像是怎么生成的呢？該網(wǎng)站明確表示，是基于GAN的StyleGAN算法生成的。GAN是Generative AdversarialNetworks（生成式對(duì)抗網(wǎng)絡(luò)）的簡(jiǎn)稱，它是一種深度學(xué)習(xí)模型，這種模型一般包括兩個(gè)模塊：生成模型G（Generative Model）和判別模型D（Discriminative Model），通過(guò)兩個(gè)模型的互相博弈學(xué)習(xí)產(chǎn)生完美的輸出。博弈的結(jié)果是讓G可以生成足以“以假亂真”的圖片G（z）。

因?yàn)椴┺挠?xùn)練需要大量的運(yùn)算，隨著GPU運(yùn)算能力的提升，2018年英偉達(dá)開發(fā)了基于GAN的人工智能算法——StyleGAN，它可以合成足以騙過(guò)人類的各種假人臉。StyleGAN的算法生成器和普通的GAN不一樣，它是借助風(fēng)格遷移的思路重新發(fā)明的。在實(shí)際訓(xùn)練中，科學(xué)家們向AI輸入兩張圖，比如圖A決定人物的年齡、性別、頭發(fā)長(zhǎng)度和姿勢(shì);圖B決定一切其他因素，如膚色、發(fā)色、衣服顏色等等。這樣通過(guò)博弈訓(xùn)練后，圖B的畫風(fēng)就自然遷移給A，從而生成一個(gè)A、B融合的新圖片（圖2）。

顯然StyleGAN的核心是融合，將多張不同風(fēng)格的目標(biāo)任務(wù)融合在一個(gè)輸出目標(biāo)上。為了讓生成的人像更為逼真、多變和自然。StyleGAN先通過(guò)學(xué)習(xí)在低分辨率下出現(xiàn)的基本特征來(lái)創(chuàng)建基礎(chǔ)圖像，然后通過(guò)更高分辨率的圖片訓(xùn)練來(lái)識(shí)別更多的細(xì)節(jié)，這樣通過(guò)漸進(jìn)式訓(xùn)練，最終融合輸出的照片就顯得非常自然、逼真（圖3）。

StyleGAN通過(guò)從粗糙、中等、精細(xì)三種R度上調(diào)節(jié)圖像的生成。其中粗糙是指規(guī)模最大的調(diào)整，它的分辨率在4²-8²之間，比如人臉的朝向、臉型和發(fā)型，都在這里調(diào)整。通過(guò)粗糙調(diào)整，讓AI畫出幾乎風(fēng)格、外形完全不同的人物畫像（圖4）。中等則是只調(diào)整部分特征，比如對(duì)臉部特征、發(fā)色發(fā)量、鼻子大小等局部的特征進(jìn)行調(diào)整，這樣生成的圖像看上去似曾相識(shí)，但是仔細(xì)觀察卻可以看到臉部特征是不同的。精細(xì)改變的是圖像的配色，幾乎不會(huì)給人物變臉。

當(dāng)然這三種調(diào)整不是獨(dú)立的，而是相輔相成的，StyleGAN通過(guò)特定的算法將它們組合在一起，最終實(shí)現(xiàn)完美的輸出，即通過(guò)簡(jiǎn)單的輸入，如選擇一種自己喜歡的臉型、發(fā)型或膚色，StyleGAN在后臺(tái)就可以通過(guò)預(yù)置的算法生成你需要的人像（圖5）。

回到文章前面介紹的網(wǎng)站，這是一位來(lái)自Uber的軟件工程師Philip Wang創(chuàng)建的，他利用的正是英偉達(dá)創(chuàng)建的StyleGAN算法，創(chuàng)作了源源不斷的假人像。當(dāng)訪問(wèn)者每次刷新這個(gè)網(wǎng)站，網(wǎng)站后臺(tái)服務(wù)器就會(huì)使用StyleGAN算法結(jié)合上述介紹的三種調(diào)整來(lái)重新生成一張以假亂真的人物圖像（圖6）。

AI造假——讓人歡喜讓人憂

通過(guò)上面的介紹我們見(jiàn)識(shí)到了基于StyleGAN算法的AI畫像的超能力。AI畫像的模仿能力可以讓我們有意想不到的驚喜，比如去年的“天價(jià)”AI畫作事件，佳士得拍賣行以43.25萬(wàn)美元（約為300萬(wàn)人民幣）的高價(jià)拍出一件人工智能藝術(shù)品（圖7）。

雖然目前模型是被訓(xùn)練用來(lái)生成人臉圖像的，但理論上來(lái)說(shuō)它可以模仿任何來(lái)源的圖像。比如我們可以利用這個(gè)模型來(lái)生成新的字體，這樣設(shè)計(jì)師們?cè)僖膊挥每嗨稼は?，利用現(xiàn)成的海報(bào)字體就可以“模仿”出各種漂亮的字體了（圖8）。

當(dāng)然隱憂也是顯而易見(jiàn)的，比如可能有不懷好意的人利用它來(lái)生成一個(gè)不存在的人，然后利用臆想的文字編造假新聞，這種有圖有真相的假新聞可能會(huì)造成各種不良的影響。類似的，用GAN模仿字跡寫欠條、換臉開門禁，這類看似不可能完成的任務(wù)，在以后的生活中可能一一出現(xiàn)。任何一項(xiàng)新技術(shù)的出現(xiàn)，其好壞兩面的評(píng)估都值得科學(xué)家認(rèn)真、審慎地去對(duì)待！