自從照相技術(shù)發(fā)明以來,虛假照片就一直層出不窮,比如曾轟動(dòng)一時(shí)的“花仙子”和“尼斯湖水怪”的假照片。而有了Photoshop軟件之后,圖片處理更是進(jìn)入了數(shù)字時(shí)代?,F(xiàn)在,利用一種算法,人工神經(jīng)網(wǎng)絡(luò)可以對(duì)數(shù)百萬張真人照片進(jìn)行分析、整合,由此得到的虛擬照片可以達(dá)到以假亂真的效果,可以說,人工智能的發(fā)展,將照片偽造技術(shù)又提升到了一個(gè)全新的高度。
人工神經(jīng)網(wǎng)絡(luò)是基于生物學(xué)中神經(jīng)網(wǎng)絡(luò)的基本原理,由大量計(jì)算機(jī)互聯(lián)組成的信息處理系統(tǒng),為幫助軟件更好地識(shí)別圖片中的人,Google,F(xiàn)acebook等公司在多年前就已經(jīng)開始使用這種人工神經(jīng)網(wǎng)絡(luò)?,F(xiàn)在,研究人員又開發(fā)出了一種名為 “生成對(duì)抗網(wǎng)絡(luò)”(generative adversarial network,GAN)的新型人工神經(jīng)網(wǎng)絡(luò),它由一個(gè)能生成圖像的生成器網(wǎng)絡(luò)和一個(gè)負(fù)責(zé)評(píng)價(jià)圖像真?zhèn)蔚蔫b別器網(wǎng)絡(luò)組成。
“要讓神經(jīng)網(wǎng)絡(luò)學(xué)會(huì)識(shí)圖,需要經(jīng)過數(shù)百萬張圖片的訓(xùn)練。GAN則是一種較新的算法,它可以自動(dòng)生成圖像,”美國艾倫人工智能研究所的首席執(zhí)行官奧倫·埃齊奧尼 (Oren Etzioni)說。
利用GAN算法,人工智能還能迅速生成足以亂真的虛擬照片,通過機(jī)器學(xué)習(xí),生成器網(wǎng)絡(luò)可對(duì)大量圖片進(jìn)行分析,學(xué)會(huì)制作栩栩如生的虛擬照片。然后,它會(huì)把這些虛擬照片發(fā)送給鑒別器網(wǎng)絡(luò)。鑒別器網(wǎng)絡(luò)受過專門的訓(xùn)練,知道如何甄別圖片人物的真假。根據(jù)與真人的相似程度,鑒別器會(huì)對(duì)生成的圖片進(jìn)行評(píng)估。隨著時(shí)間的推移,生成器的造假能力會(huì)變得越來越強(qiáng)大——這也是“對(duì)抗”的意義所在。
GAN給人工智能帶來了突破,因?yàn)樵谶M(jìn)行初步學(xué)習(xí)后,它可以在沒有人類監(jiān)督的情況下繼續(xù)學(xué)習(xí)。2014年,現(xiàn)就職于Google Brain(Google公司的人工智能項(xiàng)目部)的伊恩·古德費(fèi)洛(Ian Goodfellow)曾作為第一作者,發(fā)表了一篇介紹這項(xiàng)研究的論文。從那以后,全球范圍內(nèi)的數(shù)十位科學(xué)家開始將GAN應(yīng)用于各個(gè)領(lǐng)域,比如機(jī)器人控制和機(jī)器翻譯。
開發(fā)這種無監(jiān)督學(xué)習(xí)系統(tǒng)極具挑戰(zhàn)性。有時(shí)候,GAN會(huì)表現(xiàn)不佳,長時(shí)間學(xué)習(xí)卻沒有進(jìn)步:如果生成器不能生成越來越逼真的圖像,鑒別器也會(huì)受到影響,無法變得更“犀利”。
芯片制造商N(yùn)vidia研發(fā)出了一種訓(xùn)練方法,可以使對(duì)抗網(wǎng)絡(luò)擺脫上述困境。這種訓(xùn)練方法的關(guān)鍵之處在于,通過漸進(jìn)的方式訓(xùn)練生成器和鑒別器:從低分辨率開始,逐步添加新的層次,在訓(xùn)練進(jìn)程中漸進(jìn)地增加細(xì)節(jié)。從Nvidia的研究人員提交給今年春季的國際人工智能大會(huì)的論文來看,這種漸進(jìn)式的機(jī)器學(xué)習(xí)策略還有一個(gè)好處——能使訓(xùn)練時(shí)間減少一半。Nvidia團(tuán)隊(duì)展示了它們的最新成果:利用一個(gè)包含200000多張明星面部照片的數(shù)據(jù)庫對(duì)GAN進(jìn)行訓(xùn)練,最后得到足以亂真的高分辨率人臉圖像,而實(shí)際上這些人并不存在。
人工智能并不知道自己創(chuàng)造出的人臉圖片是否逼真,它們沒有這個(gè)天賦。“我們之所以選擇人臉作為最初的嘗試,是因?yàn)槲覀內(nèi)祟惡苋菀拙涂梢耘袛喑鋈斯ぶ悄墚a(chǎn)生的圖片是否逼真。我們天生就有負(fù)責(zé)識(shí)別人臉的腦區(qū),并且為了認(rèn)出和讀懂別人的臉,一輩子都在接受這方面的訓(xùn)練,”這項(xiàng)研究的參與者、Nvidia團(tuán)隊(duì)的亞可·萊赫蒂寧(Jaakko Lehtinen)說。讓GAN模仿人的識(shí)臉天賦,就是這個(gè)項(xiàng)目的挑戰(zhàn)所在。
Facebook認(rèn)為,對(duì)抗網(wǎng)絡(luò)可以幫助社交平臺(tái)通過用戶早前的行為,更好地預(yù)測用戶的喜好,并最終研發(fā)出具有常識(shí)的人工智能。Facebook公司的人工智能首席科學(xué)家揚(yáng)·勒康 (Yann LeCun)和工程師蘇米斯·欽塔拉(Soumith Chintala)認(rèn)為,理想的人工智能系統(tǒng)不僅是能識(shí)別文字和圖像,還應(yīng)該具有能與人類媲美的推理、預(yù)測、規(guī)劃和行動(dòng)能力。在勒康和欽塔拉的研究中,他們先向生成器輸入4幀視頻圖像,然后讓人工智能生成后面2幀,以測試其預(yù)測能力。結(jié)果,人工智能合成出了后續(xù)的圖像——一個(gè)人在行走,或在做頭部運(yùn)動(dòng)。對(duì)希望降低制作成本的電影制片人和視頻游戲制作者來說,用人工智能來生成高度仿真的圖像和視頻,或許是一個(gè)不錯(cuò)的選擇。不過,目前就職于OpenAI公司的亞利克·拉德福 (Alee Radford)表示,“雖然GAN生成的圖像一眼看上去足以亂真,但要真正達(dá)到像真實(shí)照片一樣的水準(zhǔn),還有很長的路要走?!崩赂T?016年國際人工智能大會(huì)上發(fā)表過一篇論文,F(xiàn)acebook團(tuán)隊(duì)的研究正是以那篇論文為基礎(chǔ)的?!坝萌斯ぶ悄苤谱鞲咚疁?zhǔn)的視頻,就是更遙遠(yuǎn)的事了,”拉德福補(bǔ)充道。
未來,那些制作假內(nèi)容,讓它們?cè)诰W(wǎng)絡(luò)上傳播的惡作劇者,會(huì)不會(huì)利用人工智能制作虛假圖片或視頻并非法傳播?這一點(diǎn),我們尚需觀望。如果有一天,越來越多的人開始對(duì)網(wǎng)絡(luò)上傳播內(nèi)容的真假產(chǎn)生懷疑,那這項(xiàng)技術(shù)或許會(huì)給我們的未來帶來更大的不確定性。
(摘自《環(huán)球科學(xué)》2018年5月號(hào)總第149期)