顏媛媛
大家好,我是數(shù)字人大亨,很榮幸能夠與大家探討一個(gè)備受關(guān)注的話題:AIGC(AIGC 即AIGeneratedContent,是指利用人工智能技術(shù)來(lái)生成內(nèi)容)是否能代替人類進(jìn)行創(chuàng)作?歷史證明,人類的創(chuàng)造力和創(chuàng)作風(fēng)格是隨著時(shí)代和技術(shù)革新不斷演進(jìn)的。在內(nèi)容創(chuàng)作,尤其是創(chuàng)作優(yōu)質(zhì)個(gè)性化內(nèi)容方面,AIGC 和人類的協(xié)同是非常必要的一環(huán)。
3月30日,在2023新榜大會(huì)上,騰訊內(nèi)容平臺(tái)部副總經(jīng)理姚天恒通過(guò)他的數(shù)字人“大亨”做了這樣的開場(chǎng)演講(如圖1)。令人關(guān)注的是,這個(gè)數(shù)字人不僅在形象上高度逼真,而且在語(yǔ)音、語(yǔ)調(diào)、唇動(dòng)等方面也非常真實(shí),甚至連姚天恒慣常的表情和動(dòng)作都毫不馬虎地模擬了出來(lái)。
數(shù)字人“大亨”是以姚天恒真人為原型打造,采用騰訊智影最新人工智能技術(shù),通過(guò)深度學(xué)習(xí)他本人少量的真實(shí)音頻、視頻數(shù)據(jù)生成的分身模型。借此機(jī)會(huì),騰訊也正式對(duì)外發(fā)布了全新的AI智能創(chuàng)作助手“騰訊智影”,通過(guò)為內(nèi)容創(chuàng)作者提供一系列的智能創(chuàng)作工具,幫助創(chuàng)作者在內(nèi)容創(chuàng)作時(shí)提質(zhì)增效。
騰訊在AI 領(lǐng)域的動(dòng)作很快,距離騰訊在2022全年業(yè)績(jī)財(cái)報(bào)電話會(huì)上坦言AI“非常令人興奮”,并表態(tài)未來(lái)可能將AI 納入微信和QQ,剛剛過(guò)去一周時(shí)間,騰訊就分別在博鰲亞洲論壇2023 年年會(huì)“下一代互聯(lián)網(wǎng)”
論壇上透露正在研發(fā)類ChatGPT 聊天機(jī)器人,并且集成到QQ、微信,以及騰訊云的版本“都會(huì)有”,以及正式在“2023 新榜大會(huì)”上發(fā)布“騰訊智影”。
然而,很多人都沒(méi)想到“騰訊智影”發(fā)布的第一時(shí)間,人們就可以在微信小程序中找到并體驗(yàn),與此同時(shí),用戶還可以使用PC 瀏覽器登錄zenvideo.qq.com 開啟“騰訊智影”平臺(tái),以獲得更便利的操控體驗(yàn)。
在官方主頁(yè)可以看到,騰訊智影主要提供“人”“聲”“影”三個(gè)方面的能力。其中在“人”的方面,“智影數(shù)字人”是騰訊智影最核心的功能。用戶輸入文本或音頻內(nèi)容,即可生成數(shù)字人播報(bào)視頻。根據(jù)用戶差異化的應(yīng)用需求和場(chǎng)景,“騰訊智影”又細(xì)分為視頻剪輯、文本配音、數(shù)字人播報(bào)、視頻審閱等多個(gè)功能(如圖2)。
在“聲”的方面,騰訊智影則提供了文本配音、音色定制、智能變聲等功能。在“影”的方面,通過(guò)騰訊智影文章轉(zhuǎn)視頻能力,創(chuàng)作者可以直接將自己撰寫的文字轉(zhuǎn)化為視頻內(nèi)容,無(wú)須進(jìn)行繁瑣的素材收集和處理。此外,騰訊智影分段式的素材呈現(xiàn)方式,讓創(chuàng)作者可以快速處理分鏡,添加卡點(diǎn)、濾鏡、特效等,從而大大縮短視頻制作的周期和成本。
如此強(qiáng)大的功能,再憑借騰訊微信小程序的覆蓋面,自然在第一時(shí)間成為市場(chǎng)關(guān)注的焦點(diǎn)。
在“騰訊智影”主界面點(diǎn)擊“數(shù)字人播報(bào)”后即可打造屬于自己的數(shù)字人主播。用戶首先需要選擇相應(yīng)的數(shù)字人形象(提供2D和3D兩個(gè)類別可供選擇),即可進(jìn)入數(shù)字人創(chuàng)作界面(如圖3)。
這里要提醒大家的是,“騰訊智影”需要在Chrome瀏覽器進(jìn)行訪問(wèn),即便是騰訊QQ瀏覽器也會(huì)提示PC 用戶更換瀏覽器進(jìn)行工作。在3D主播生成界面可以看到,左側(cè)主要是工具欄界面,數(shù)字人、背景、配樂(lè)等細(xì)節(jié)都可以單獨(dú)編輯,以“數(shù)字人編輯”為例,用戶可以對(duì)3D主播的形象及動(dòng)作、畫面、字幕等細(xì)節(jié)進(jìn)行個(gè)性化打造。
從服裝樣式、服裝顏色、人物姿勢(shì)到動(dòng)作,“騰訊智影”都提供了預(yù)設(shè)模式給用戶選擇,用戶只需要根據(jù)個(gè)人偏好進(jìn)行點(diǎn)選即可,上手非??欤ㄈ鐖D4)。
追求易用性的同時(shí),“騰訊智影”在細(xì)節(jié)上并沒(méi)有完全“放權(quán)”。用戶可以選擇3D數(shù)字人各種動(dòng)作表達(dá),配合文字內(nèi)容形成自然、連貫的播報(bào),但數(shù)字人具體發(fā)型、面部表情其實(shí)是沒(méi)辦法做個(gè)性化定制的,不過(guò)在“高級(jí)編輯”中,用戶還是可以上傳自己的視頻、音頻和圖片資料,進(jìn)而強(qiáng)化數(shù)字人主播內(nèi)容的差異化。
不過(guò)目前“騰訊智影”只對(duì)免費(fèi)用戶開放了部分體驗(yàn)功能,其余大部分需要用戶付費(fèi)使用。如免費(fèi)版,可以獲得每個(gè)月5分鐘的免費(fèi)數(shù)字人生成視頻時(shí)長(zhǎng),每天3 次的智能工具使用等;398元一年的高級(jí)會(huì)員是每個(gè)月10分鐘的數(shù)字人生成視頻時(shí)長(zhǎng)或高級(jí)+ 專業(yè)音色的文本配音服務(wù)二選一,以及每天50次的智能工具等。而在數(shù)字人定制上,目前照片定制數(shù)字人形象的價(jià)格為首年3999元,視頻定制數(shù)字人形象的價(jià)格為首年7999元(如圖5)。
值得一提的是“騰訊智影”內(nèi)部已經(jīng)嵌入了金幣體系,部分服務(wù)需要使用“金幣”付費(fèi),而金幣除了注冊(cè)時(shí)贈(zèng)送的1000金幣外,還可通過(guò)簽到等活躍行為獲得。
拋開數(shù)字人的打造,“騰訊智影”本身是一款影音剪輯工具,對(duì)于不少“小白”用戶而言,其在文本配音、視頻剪輯等方面的工具屬性更具實(shí)用性。
在“騰訊智影”主界面中點(diǎn)擊“文本配音”后進(jìn)入相應(yīng)編輯界面,在頂部菜單欄找到“導(dǎo)入文本”的選項(xiàng),平臺(tái)支持doc、docx、txt 等格式的文本,默認(rèn)文本上限 8000 個(gè)字,足以滿足半小時(shí)左右的配音需求了。不同于其他視頻剪輯軟件,用戶能對(duì)配音的節(jié)奏(整體速度、局部速度)、發(fā)音等等進(jìn)行調(diào)校,最為強(qiáng)大的地方是智影“文本配音”支持不同句、不同字添加不同配音,比如旁白、開場(chǎng)都可以選用不同的人聲(如圖6)。
除配音功能非常人性化外,“文本配音”本身預(yù)置了數(shù)十款配音素材可選,用戶可以根據(jù)視頻配音、文章播報(bào)、新聞播報(bào)、有聲小說(shuō)、語(yǔ)音助手等分類快速選擇最適合自己的配音模板,而且頂部還有語(yǔ)氣和情緒的分類,再加上“百變”標(biāo)簽人物下的方言選項(xiàng),足以為用戶帶來(lái)靈活多變的文本配音。
而對(duì)于高階玩家,“文本配音”還提供了“定制專屬音色”服務(wù),系統(tǒng)可根據(jù)用戶上傳音色進(jìn)行“聲音復(fù)刻”,從而打造獨(dú)一無(wú)二的配音(如圖7)。
除了極其強(qiáng)悍的配音功能外,視頻剪輯也是“騰訊智影”的基礎(chǔ)功能。從素材到音軌,從轉(zhuǎn)場(chǎng)到特效,“騰訊智影”的視頻剪輯功能可以說(shuō)是相當(dāng)強(qiáng)大,無(wú)論是初學(xué)者還是專業(yè)剪輯師都能快速上手。
素材和快捷鍵可
以說(shuō)是“騰訊智影”剪輯功能的一大特色,在軌道區(qū)進(jìn)行創(chuàng)作,免不了對(duì)素材進(jìn)行雕琢,智影目前已具備十余種素材調(diào)整操作功能,而且右上角的快捷鍵欄也上線30 余個(gè)預(yù)設(shè)快捷鍵,極大提升了剪輯效率。
相對(duì)功能強(qiáng)悍的PC版,微信“騰訊智影”小程序同樣能夠?qū)崿F(xiàn)數(shù)字人、智能配音等熱門功能,但受限于手機(jī)操作空間,視頻剪輯等功能并非其主打,而是引入了當(dāng)下最熱門的“AI繪畫”。
進(jìn)入AI繪畫頁(yè)面后,發(fā)現(xiàn)“騰訊智影”在繪圖方面支持文本生圖和圖生圖兩種生成方式,其中圖生圖只能生成動(dòng)漫風(fēng)格一種風(fēng)格,但可以額外添加文字修飾,以更加準(zhǔn)確地生成自己想要的效果(如圖8)。
而文本生圖支持的風(fēng)格則比較多元,有2D動(dòng)漫、2.5D動(dòng)漫、國(guó)風(fēng)、彩漫、素描、線稿、人像特寫、油畫、印象派共9 種,比較遺憾的是暫時(shí)只支持生成人像。從最終生成效果來(lái)看,“AI繪畫”最終成像效果還是比較讓人滿意了。
總體而言,“騰訊智影”本身并非全新產(chǎn)品,本次在AI 上的升級(jí),讓其不僅兼顧了市場(chǎng)上已有的功能,而且更是從一個(gè)視頻創(chuàng)作工具升級(jí)為“智慧”的創(chuàng)作助手,無(wú)疑能進(jìn)一步解放短視頻創(chuàng)作者生產(chǎn)力,更讓入門級(jí)用戶也能通過(guò)數(shù)字人踐行自己的想法,極大地推動(dòng)了AIGC內(nèi)容產(chǎn)業(yè)落地。