毒少
如果我們把voco和face2face這兩個(gè)技術(shù)合起來的話……
近日,那個(gè)開發(fā)p圖應(yīng)用photoshop的adobe公司,更新了一波新品。
還發(fā)布了首個(gè)基于深度學(xué)習(xí)的平臺(tái)——「Adobe Sensei」
簡(jiǎn)單來說,這就是ai,sensei 利用了 adobe 長(zhǎng)期積累的大量數(shù)據(jù)和內(nèi)容,從圖片到影像,能夠幫助我們解決很多問題,將重復(fù)勞動(dòng)變得自動(dòng)化。
這樣你就可以在幾分鐘內(nèi)調(diào)好一個(gè)表情:Sensei 可以進(jìn)行臉部自動(dòng)編輯。
它可以在照片里自動(dòng)查找到人臉以及人臉的各個(gè)部分,包括眉毛、嘴唇和眼睛,并且學(xué)習(xí)這些部位的位置,來讓設(shè)計(jì)師們調(diào)整照片上人的表情,而不會(huì)看起來不自然或者怪異。
的確很強(qiáng)大!
不過,這次真正能把我們點(diǎn)燃的黑科技,是它——Project VOCO。
它的厲害之處——可以根據(jù)一個(gè)人說話的錄音,合成幾乎以假亂真的任意錄音。
首先,讓voco學(xué)會(huì)你的話,你丟一段大概20分鐘的音頻讓它學(xué)。
比如這句:And ur I kissed my dogs and my wife.
你在這句中,不管調(diào)換詞的位置、添加新詞,音效完全聽不出來有任何差異,幾乎接近于完美模仿原發(fā)音者。
這簡(jiǎn)直就是音頻編輯領(lǐng)域里的“Photoshop”。
那么這樣一來,真的就實(shí)現(xiàn)了“把話強(qiáng)加到別人身上了”……
看來柯南的變聲器差不多可以出貨了。
音頻技術(shù)能如此,那么,視頻可以無中生有么?
早在半年前,其實(shí)就已經(jīng)實(shí)現(xiàn)了。而且效果達(dá)到了可怕的真人秀級(jí)別,可以這么說——這軟件一出,視頻即將淪陷。
注意!下面你看到的——都是假的!
這是一項(xiàng)叫「Face2Face」的技術(shù)——能實(shí)現(xiàn)實(shí)時(shí)面部重演(Real-time Facial Reenactment)。
它可以實(shí)時(shí)捕捉使用者的表情,然后替換已有視頻中人物的表情。把一個(gè)人的臉部RGB影像,通過算法,進(jìn)行采集。
然后與另一個(gè)人的RGB數(shù)值進(jìn)行比對(duì),測(cè)算臉部五官結(jié)構(gòu)。
最后就可以將主角的表情和口型無縫替換。這樣就能讓他做從未做過的表情。
而你,只需要一個(gè)普通攝像頭就能實(shí)現(xiàn),甚至——可以在家?guī)蛫W巴馬在白宮開個(gè)告別演說。
還是那句話——你的思想有多遠(yuǎn),你就可以有多變態(tài)!
你們有沒有察覺這里面有個(gè)特別不對(duì)勁的地方——如果我們把voco和face2face這兩個(gè)技術(shù)合起來的話……
你還是你嗎?
摘編自微信公眾號(hào)“放毒”