凌晨4點(diǎn),如果你在淘寶上觀看直播,你會(huì)發(fā)現(xiàn)那里是個(gè)繁忙的不眠夜。雖然大多數(shù)人都睡得很熟,但仍有許多勤奮的“主播”在凌晨對(duì)著攝像機(jī)展示產(chǎn)品并賣力地宣傳折扣。
但如果你仔細(xì)觀察,你可能會(huì)注意到這些主播似乎是機(jī)器人。他們嘴唇的動(dòng)作在很大程度上與他們所說(shuō)的一致,但總有一些時(shí)候看起來(lái)不自然。
它們確實(shí)不是真人,而是人工智能生成的真實(shí)主播的復(fù)制體。隨著創(chuàng)造逼真化身、聲音和動(dòng)作的技術(shù)變得越來(lái)越復(fù)雜和廉價(jià),這些“深度偽造主播”在中國(guó)電子商務(wù)直播平臺(tái)上愈發(fā)受歡迎。
如今,直播已成為中國(guó)傳統(tǒng)品牌和數(shù)字品牌的主要營(yíng)銷渠道。淘寶、抖音和快手等直播平臺(tái)上的網(wǎng)紅可以在幾個(gè)小時(shí)內(nèi)完成夸張的交易額。頂級(jí)網(wǎng)紅可以在一個(gè)晚上賣出價(jià)值超過(guò)10億美元的商品,并獲得巨額傭金。
但與此同時(shí),培訓(xùn)主播并留住他們,以及了解直播的技術(shù)細(xì)節(jié),對(duì)較小的品牌來(lái)說(shuō)是不可忽視的巨大成本。將這些工作自動(dòng)化要便宜得多。
自2022年以來(lái),一批中國(guó)初創(chuàng)公司和大型科技公司一直在為電子商務(wù)直播提供創(chuàng)建虛擬主播的服務(wù)。只需幾分鐘的視頻片段和8000元左右的成本,品牌就可以以一個(gè)真人為藍(lán)本制作一個(gè)能24小時(shí)直播的克隆體。
自2010年代末以來(lái),合成媒體一直是頭條新聞,尤其是當(dāng)一位名為“deepfake”的Reddit用戶將色情作品中的人臉置換成別人時(shí)。從那時(shí)起,這項(xiàng)技術(shù)開(kāi)始不斷發(fā)展,但核心想法是一樣的:通過(guò)一些技術(shù)工具,可以生成或篡改人臉,使其看起來(lái)像某個(gè)真人,并做出真人從未做過(guò)的事情。
這項(xiàng)技術(shù)主要以其在報(bào)復(fù)性色情活動(dòng)、身份欺詐和政治誤導(dǎo)信息中使用而臭名昭著。雖然有人試圖以更無(wú)害的方式將其商業(yè)化,但它一直是一種新奇事物?,F(xiàn)在,一些人工智能公司發(fā)現(xiàn)了一個(gè)新的用例,似乎進(jìn)展順利。
總部位于南京的初創(chuàng)公司硅基智能成立于2017年,專門從事自然語(yǔ)言處理,尤其是機(jī)器人撥號(hào)工具等文本到語(yǔ)音技術(shù)。但其創(chuàng)始人兼首席執(zhí)行官司馬華鵬表示,他的公司在2020年開(kāi)始看到了人工智能作為直播工具的潛力。
當(dāng)時(shí),硅基智能公司需要30分鐘的訓(xùn)練視頻來(lái)生成一個(gè)可以像人類一樣說(shuō)話和行動(dòng)的數(shù)字克隆。次年是10分鐘的視頻,然后是3分鐘,現(xiàn)在只需要一分鐘的視頻。
隨著技術(shù)的進(jìn)步,這項(xiàng)服務(wù)也變得越來(lái)越便宜?,F(xiàn)在,生成一個(gè)普通版人工智能克隆的成本約為8000元人民幣。如果客戶想創(chuàng)建一個(gè)更復(fù)雜、功能更強(qiáng)大的克隆,價(jià)格可能高達(dá)數(shù)萬(wàn)元。除了生成虛擬主播,這筆費(fèi)用還包括一年的維護(hù)費(fèi)。
一旦虛擬化身生成,它的嘴和身體就會(huì)隨著腳本音頻一起活動(dòng)。這些腳本曾經(jīng)是由人類預(yù)先編寫(xiě)好的,但公司現(xiàn)在也在使用大型語(yǔ)言模型來(lái)生成它們。
現(xiàn)在,人類所要做的就是輸入基本信息,如銷售產(chǎn)品的名稱和價(jià)格,校對(duì)生成的腳本,并觀看數(shù)字主播的直播。
更高級(jí)的虛擬主播(軟件)可以瀏覽實(shí)時(shí)評(píng)論,并在其數(shù)據(jù)庫(kù)中找到匹配的答案來(lái)實(shí)時(shí)回答,因此看起來(lái)人工智能主播似乎在積極與觀眾交流和互動(dòng)。它甚至可以根據(jù)觀眾數(shù)量調(diào)整營(yíng)銷策略。
中國(guó)人工智能公司小冰的虛擬網(wǎng)紅直播業(yè)務(wù)主管黃偉(音)表示,這些直播人工智能克隆是根據(jù)電子商務(wù)視頻中常見(jiàn)的腳本和手勢(shì)進(jìn)行訓(xùn)練的。該公司的數(shù)據(jù)庫(kù)中有近百個(gè)預(yù)先設(shè)計(jì)好的動(dòng)作。
黃偉(音)說(shuō):“例如,當(dāng)人類主播說(shuō)‘歡迎來(lái)到我的直播間,大家動(dòng)動(dòng)手指,點(diǎn)點(diǎn)關(guān)注’時(shí),他們經(jīng)常會(huì)向上指,因?yàn)榇蠖鄶?shù)直播應(yīng)用程序的屏幕上方都有‘關(guān)注’按鈕?!?/p>
同樣,當(dāng)主播介紹一款新產(chǎn)品時(shí),他們會(huì)指向購(gòu)物車,觀眾可以在那里找到所有產(chǎn)品。小冰的人工智能虛擬主播復(fù)制了所有這些常見(jiàn)的技巧。黃偉(音)說(shuō):“我們想確保說(shuō)出來(lái)的話和肢體語(yǔ)言相匹配。你不希望它邊拍手邊說(shuō)‘點(diǎn)點(diǎn)關(guān)注’,這看起來(lái)很奇怪?!?/p>
小冰于2020年從微軟亞洲軟件技術(shù)中心孵化而來(lái),一直致力于創(chuàng)造更人性化的人工智能,尤其是能夠顯示情感的虛擬化身。
“對(duì)大多數(shù)顧客來(lái)說(shuō),傳統(tǒng)的電子商務(wù)網(wǎng)站就像一個(gè)貨架,冷冰冰的。在直播中,主持人和觀眾之間有更多的情感聯(lián)系,他們可以更好地介紹產(chǎn)品。” 黃偉(音)說(shuō)。
在2022年與一些客戶進(jìn)行試點(diǎn)后,小冰在2023年正式推出了數(shù)字克隆生成服務(wù)。和硅基智能公司一樣,小冰只需要人類主播提供一分鐘的視頻。
和競(jìng)爭(zhēng)對(duì)手一樣,小冰的客戶可以花更多的錢來(lái)微調(diào)細(xì)節(jié)。例如,中國(guó)體育播音員劉建宏在2022年國(guó)際足聯(lián)世界杯期間制作了一個(gè)精致的數(shù)字孿生人,在抖音上宣讀比賽結(jié)果和其他相關(guān)新聞。
黃偉(音)說(shuō),這些人工智能生成的主播無(wú)法擊敗頂級(jí)主播,但它們足以取代中端人類主播。人類創(chuàng)作者,包括那些用視頻訓(xùn)練人工智能克隆人的人,在某種程度上已經(jīng)感受到了來(lái)自數(shù)字競(jìng)爭(zhēng)對(duì)手的擠壓。
根據(jù)分析公司iiMedia Research的數(shù)據(jù),電商主播的工作在2023 年更難找了,與2022年相比,中國(guó)電商主播的平均工資下降了20%。
與此同時(shí),在觀看人數(shù)較少的時(shí)間段,公司還可以通過(guò)虛擬主播來(lái)持續(xù)直播。這意味著,對(duì)于公司而言,很難證明雇傭真人主播的成本是合理的。
這種情況已經(jīng)發(fā)生了。午夜過(guò)后,淘寶和京東等熱門電子商務(wù)平臺(tái)上的許多直播間都會(huì)由這些人工智能生成的主播主持。
之前的例子表明,深度偽造技術(shù)不需要做到十全十美就能欺騙觀眾。2020年,一名騙子借助粗糙的換臉工具冒充中國(guó)著名演員,從粉絲那里騙了數(shù)千打賞。
量子行星智能公司是一家包裝小冰等技術(shù)并將其銷售給企業(yè)客戶的公司,量子行星的首席執(zhí)行官陳丹表示:“如果一家公司雇傭10名主播,他們的技能水平會(huì)有所不同。也許水平最高的兩、三名主播會(huì)帶來(lái)總銷售額的70%~80%。一個(gè)虛擬主播可以取代其余的六到七個(gè)貢獻(xiàn)較小、投資回報(bào)率較低的主播,而且成本會(huì)大幅下降?!?/p>
陳丹現(xiàn)在有100多個(gè)客戶使用小冰的服務(wù),這些虛擬主播已經(jīng)促成了數(shù)千萬(wàn)元的銷售額。一個(gè)小冰主播曾在短短一小時(shí)內(nèi)帶來(lái)了超過(guò)10000元人民幣的銷售額。
不過(guò)這項(xiàng)技術(shù)仍然存在不足。例如,他的許多客戶都是家具品牌,盡管人工智能足夠聰明,可以說(shuō)話和使用手勢(shì),但它不能真正坐在沙發(fā)上或躺在床上,因此這些缺乏測(cè)試的產(chǎn)品難以吸引用戶。
除了硅基智能公司和小冰等規(guī)模較小的初創(chuàng)公司外,主要科技公司也在測(cè)試人工智能生成的主播。阿里巴巴、騰訊、百度和京東今年都推出了一些類似的服務(wù),允許品牌在其平臺(tái)上生成自己的人工智能主播。
雇傭大量人力主播的營(yíng)銷公司也注意到了這一趨勢(shì)。頂級(jí)直播營(yíng)銷機(jī)構(gòu)之一的佛山遙望科技公司宣布與小冰進(jìn)行戰(zhàn)略合作;硅基智能公司也開(kāi)展了類似的合作。
人工智能生成的直播越來(lái)越受歡迎,也引起了抖音等視頻平臺(tái)的注意,但它采取了與其他科技巨頭不同的態(tài)度。
抖音似乎更關(guān)心透明度,并在2023年5月份的一份文件中表示,人工智能生成的所有視頻都應(yīng)該在平臺(tái)上明確標(biāo)注,虛擬主播需要由真人操作。
該平臺(tái)一直禁止將錄制的視頻用作直播。人工智能生成的直播,沒(méi)有錄制的鏡頭,也幾乎沒(méi)有實(shí)時(shí)的人工操作,跨越了這條規(guī)則。
對(duì)于硅基智能公司來(lái)說(shuō),下一步是在人工智能主播上添加“情商”,司馬華鵬說(shuō):“如果有辱罵性的評(píng)論,它將是悲傷的;如果產(chǎn)品賣得好,那它將是快樂(lè)的。”該公司還致力于讓人工智能主播互動(dòng)并相互學(xué)習(xí)。
該公司從一開(kāi)始就有一個(gè)野心勃勃的目標(biāo):到2025年,它希望創(chuàng)造“1億個(gè)虛擬主播”。司馬華鵬說(shuō),目前,該公司已經(jīng)產(chǎn)生了40萬(wàn)個(gè),還有很長(zhǎng)的路要走。