這個(gè)黑科技讓你不再是你

2016-12-06 09:18:54毒少

華聲 2016年21期

關(guān)鍵詞：口型臉部錄音

毒少

如果我們把voco和face2face這兩個(gè)技術(shù)合起來的話……

近日，那個(gè)開發(fā)p圖應(yīng)用photoshop的adobe公司，更新了一波新品。

還發(fā)布了首個(gè)基于深度學(xué)習(xí)的平臺(tái)——「Adobe Sensei」

簡(jiǎn)單來說，這就是ai，sensei 利用了 adobe 長(zhǎng)期積累的大量數(shù)據(jù)和內(nèi)容，從圖片到影像，能夠幫助我們解決很多問題，將重復(fù)勞動(dòng)變得自動(dòng)化。

這樣你就可以在幾分鐘內(nèi)調(diào)好一個(gè)表情：Sensei 可以進(jìn)行臉部自動(dòng)編輯。

它可以在照片里自動(dòng)查找到人臉以及人臉的各個(gè)部分，包括眉毛、嘴唇和眼睛，并且學(xué)習(xí)這些部位的位置，來讓設(shè)計(jì)師們調(diào)整照片上人的表情，而不會(huì)看起來不自然或者怪異。

的確很強(qiáng)大！

不過，這次真正能把我們點(diǎn)燃的黑科技，是它——Project VOCO。

它的厲害之處——可以根據(jù)一個(gè)人說話的錄音，合成幾乎以假亂真的任意錄音。

首先，讓voco學(xué)會(huì)你的話，你丟一段大概20分鐘的音頻讓它學(xué)。

比如這句：And ur I kissed my dogs and my wife.

你在這句中，不管調(diào)換詞的位置、添加新詞，音效完全聽不出來有任何差異，幾乎接近于完美模仿原發(fā)音者。

這簡(jiǎn)直就是音頻編輯領(lǐng)域里的“Photoshop”。

那么這樣一來，真的就實(shí)現(xiàn)了“把話強(qiáng)加到別人身上了”……

看來柯南的變聲器差不多可以出貨了。

音頻技術(shù)能如此，那么，視頻可以無中生有么？

早在半年前，其實(shí)就已經(jīng)實(shí)現(xiàn)了。而且效果達(dá)到了可怕的真人秀級(jí)別，可以這么說——這軟件一出，視頻即將淪陷。

注意！下面你看到的——都是假的！

這是一項(xiàng)叫「Face2Face」的技術(shù)——能實(shí)現(xiàn)實(shí)時(shí)面部重演（Real-time Facial Reenactment）。

它可以實(shí)時(shí)捕捉使用者的表情，然后替換已有視頻中人物的表情。把一個(gè)人的臉部RGB影像，通過算法，進(jìn)行采集。

然后與另一個(gè)人的RGB數(shù)值進(jìn)行比對(duì)，測(cè)算臉部五官結(jié)構(gòu)。

最后就可以將主角的表情和口型無縫替換。這樣就能讓他做從未做過的表情。

而你，只需要一個(gè)普通攝像頭就能實(shí)現(xiàn)，甚至——可以在家?guī)蛫W巴馬在白宮開個(gè)告別演說。

還是那句話——你的思想有多遠(yuǎn)，你就可以有多變態(tài)！

你們有沒有察覺這里面有個(gè)特別不對(duì)勁的地方——如果我們把voco和face2face這兩個(gè)技術(shù)合起來的話……

你還是你嗎？

摘編自微信公眾號(hào)“放毒”