能克隆的AI 智能創(chuàng)作助手！騰訊智影體驗(yàn)

2023-04-18 19:09:31顏媛媛

電腦報(bào) 2023年14期

顏媛媛

AI智能創(chuàng)作助手 “騰訊智影”來(lái)了

大家好，我是數(shù)字人大亨，很榮幸能夠與大家探討一個(gè)備受關(guān)注的話題：AIGC（AIGC 即AIGeneratedContent，是指利用人工智能技術(shù)來(lái)生成內(nèi)容）是否能代替人類進(jìn)行創(chuàng)作？歷史證明，人類的創(chuàng)造力和創(chuàng)作風(fēng)格是隨著時(shí)代和技術(shù)革新不斷演進(jìn)的。在內(nèi)容創(chuàng)作，尤其是創(chuàng)作優(yōu)質(zhì)個(gè)性化內(nèi)容方面，AIGC 和人類的協(xié)同是非常必要的一環(huán)。

3月30日，在2023新榜大會(huì)上，騰訊內(nèi)容平臺(tái)部副總經(jīng)理姚天恒通過(guò)他的數(shù)字人“大亨”做了這樣的開場(chǎng)演講（如圖1）。令人關(guān)注的是，這個(gè)數(shù)字人不僅在形象上高度逼真，而且在語(yǔ)音、語(yǔ)調(diào)、唇動(dòng)等方面也非常真實(shí)，甚至連姚天恒慣常的表情和動(dòng)作都毫不馬虎地模擬了出來(lái)。

數(shù)字人“大亨”是以姚天恒真人為原型打造，采用騰訊智影最新人工智能技術(shù)，通過(guò)深度學(xué)習(xí)他本人少量的真實(shí)音頻、視頻數(shù)據(jù)生成的分身模型。借此機(jī)會(huì)，騰訊也正式對(duì)外發(fā)布了全新的AI智能創(chuàng)作助手“騰訊智影”，通過(guò)為內(nèi)容創(chuàng)作者提供一系列的智能創(chuàng)作工具，幫助創(chuàng)作者在內(nèi)容創(chuàng)作時(shí)提質(zhì)增效。

藏在微信里的AIGC工具

騰訊在AI 領(lǐng)域的動(dòng)作很快，距離騰訊在2022全年業(yè)績(jī)財(cái)報(bào)電話會(huì)上坦言AI“非常令人興奮”，并表態(tài)未來(lái)可能將AI 納入微信和QQ，剛剛過(guò)去一周時(shí)間，騰訊就分別在博鰲亞洲論壇2023 年年會(huì)“下一代互聯(lián)網(wǎng)”

論壇上透露正在研發(fā)類ChatGPT 聊天機(jī)器人，并且集成到QQ、微信，以及騰訊云的版本“都會(huì)有”，以及正式在“2023 新榜大會(huì)”上發(fā)布“騰訊智影”。

然而，很多人都沒(méi)想到“騰訊智影”發(fā)布的第一時(shí)間，人們就可以在微信小程序中找到并體驗(yàn)，與此同時(shí)，用戶還可以使用PC 瀏覽器登錄zenvideo.qq.com 開啟“騰訊智影”平臺(tái)，以獲得更便利的操控體驗(yàn)。

在官方主頁(yè)可以看到，騰訊智影主要提供“人”“聲”“影”三個(gè)方面的能力。其中在“人”的方面，“智影數(shù)字人”是騰訊智影最核心的功能。用戶輸入文本或音頻內(nèi)容，即可生成數(shù)字人播報(bào)視頻。根據(jù)用戶差異化的應(yīng)用需求和場(chǎng)景，“騰訊智影”又細(xì)分為視頻剪輯、文本配音、數(shù)字人播報(bào)、視頻審閱等多個(gè)功能（如圖2）。

在“聲”的方面，騰訊智影則提供了文本配音、音色定制、智能變聲等功能。在“影”的方面，通過(guò)騰訊智影文章轉(zhuǎn)視頻能力，創(chuàng)作者可以直接將自己撰寫的文字轉(zhuǎn)化為視頻內(nèi)容，無(wú)須進(jìn)行繁瑣的素材收集和處理。此外，騰訊智影分段式的素材呈現(xiàn)方式，讓創(chuàng)作者可以快速處理分鏡，添加卡點(diǎn)、濾鏡、特效等，從而大大縮短視頻制作的周期和成本。

如此強(qiáng)大的功能，再憑借騰訊微信小程序的覆蓋面，自然在第一時(shí)間成為市場(chǎng)關(guān)注的焦點(diǎn)。

讓人人都能實(shí)現(xiàn)數(shù)字人自由

在“騰訊智影”主界面點(diǎn)擊“數(shù)字人播報(bào)”后即可打造屬于自己的數(shù)字人主播。用戶首先需要選擇相應(yīng)的數(shù)字人形象（提供2D和3D兩個(gè)類別可供選擇），即可進(jìn)入數(shù)字人創(chuàng)作界面（如圖3）。

這里要提醒大家的是，“騰訊智影”需要在Chrome瀏覽器進(jìn)行訪問(wèn)，即便是騰訊QQ瀏覽器也會(huì)提示PC 用戶更換瀏覽器進(jìn)行工作。在3D主播生成界面可以看到，左側(cè)主要是工具欄界面，數(shù)字人、背景、配樂(lè)等細(xì)節(jié)都可以單獨(dú)編輯，以“數(shù)字人編輯”為例，用戶可以對(duì)3D主播的形象及動(dòng)作、畫面、字幕等細(xì)節(jié)進(jìn)行個(gè)性化打造。

從服裝樣式、服裝顏色、人物姿勢(shì)到動(dòng)作，“騰訊智影”都提供了預(yù)設(shè)模式給用戶選擇，用戶只需要根據(jù)個(gè)人偏好進(jìn)行點(diǎn)選即可，上手非?？欤ㄈ鐖D4）。

追求易用性的同時(shí)，“騰訊智影”在細(xì)節(jié)上并沒(méi)有完全“放權(quán)”。用戶可以選擇3D數(shù)字人各種動(dòng)作表達(dá)，配合文字內(nèi)容形成自然、連貫的播報(bào)，但數(shù)字人具體發(fā)型、面部表情其實(shí)是沒(méi)辦法做個(gè)性化定制的，不過(guò)在“高級(jí)編輯”中，用戶還是可以上傳自己的視頻、音頻和圖片資料，進(jìn)而強(qiáng)化數(shù)字人主播內(nèi)容的差異化。

不過(guò)目前“騰訊智影”只對(duì)免費(fèi)用戶開放了部分體驗(yàn)功能，其余大部分需要用戶付費(fèi)使用。如免費(fèi)版，可以獲得每個(gè)月5分鐘的免費(fèi)數(shù)字人生成視頻時(shí)長(zhǎng)，每天3 次的智能工具使用等；398元一年的高級(jí)會(huì)員是每個(gè)月10分鐘的數(shù)字人生成視頻時(shí)長(zhǎng)或高級(jí)+ 專業(yè)音色的文本配音服務(wù)二選一，以及每天50次的智能工具等。而在數(shù)字人定制上，目前照片定制數(shù)字人形象的價(jià)格為首年3999元，視頻定制數(shù)字人形象的價(jià)格為首年7999元（如圖5）。

值得一提的是“騰訊智影”內(nèi)部已經(jīng)嵌入了金幣體系，部分服務(wù)需要使用“金幣”付費(fèi)，而金幣除了注冊(cè)時(shí)贈(zèng)送的1000金幣外，還可通過(guò)簽到等活躍行為獲得。

強(qiáng)悍的工具屬性

拋開數(shù)字人的打造，“騰訊智影”本身是一款影音剪輯工具，對(duì)于不少“小白”用戶而言，其在文本配音、視頻剪輯等方面的工具屬性更具實(shí)用性。

在“騰訊智影”主界面中點(diǎn)擊“文本配音”后進(jìn)入相應(yīng)編輯界面，在頂部菜單欄找到“導(dǎo)入文本”的選項(xiàng)，平臺(tái)支持doc、docx、txt 等格式的文本，默認(rèn)文本上限 8000 個(gè)字，足以滿足半小時(shí)左右的配音需求了。不同于其他視頻剪輯軟件，用戶能對(duì)配音的節(jié)奏（整體速度、局部速度）、發(fā)音等等進(jìn)行調(diào)校，最為強(qiáng)大的地方是智影“文本配音”支持不同句、不同字添加不同配音，比如旁白、開場(chǎng)都可以選用不同的人聲（如圖6）。

除配音功能非常人性化外，“文本配音”本身預(yù)置了數(shù)十款配音素材可選，用戶可以根據(jù)視頻配音、文章播報(bào)、新聞播報(bào)、有聲小說(shuō)、語(yǔ)音助手等分類快速選擇最適合自己的配音模板，而且頂部還有語(yǔ)氣和情緒的分類，再加上“百變”標(biāo)簽人物下的方言選項(xiàng)，足以為用戶帶來(lái)靈活多變的文本配音。

而對(duì)于高階玩家，“文本配音”還提供了“定制專屬音色”服務(wù)，系統(tǒng)可根據(jù)用戶上傳音色進(jìn)行“聲音復(fù)刻”，從而打造獨(dú)一無(wú)二的配音（如圖7）。

除了極其強(qiáng)悍的配音功能外，視頻剪輯也是“騰訊智影”的基礎(chǔ)功能。從素材到音軌，從轉(zhuǎn)場(chǎng)到特效，“騰訊智影”的視頻剪輯功能可以說(shuō)是相當(dāng)強(qiáng)大，無(wú)論是初學(xué)者還是專業(yè)剪輯師都能快速上手。

素材和快捷鍵可

以說(shuō)是“騰訊智影”剪輯功能的一大特色，在軌道區(qū)進(jìn)行創(chuàng)作，免不了對(duì)素材進(jìn)行雕琢，智影目前已具備十余種素材調(diào)整操作功能，而且右上角的快捷鍵欄也上線30 余個(gè)預(yù)設(shè)快捷鍵，極大提升了剪輯效率。

趣味十足的微信小程序

相對(duì)功能強(qiáng)悍的PC版，微信“騰訊智影”小程序同樣能夠?qū)崿F(xiàn)數(shù)字人、智能配音等熱門功能，但受限于手機(jī)操作空間，視頻剪輯等功能并非其主打，而是引入了當(dāng)下最熱門的“AI繪畫”。

進(jìn)入AI繪畫頁(yè)面后，發(fā)現(xiàn)“騰訊智影”在繪圖方面支持文本生圖和圖生圖兩種生成方式，其中圖生圖只能生成動(dòng)漫風(fēng)格一種風(fēng)格，但可以額外添加文字修飾，以更加準(zhǔn)確地生成自己想要的效果（如圖8）。

而文本生圖支持的風(fēng)格則比較多元，有2D動(dòng)漫、2.5D動(dòng)漫、國(guó)風(fēng)、彩漫、素描、線稿、人像特寫、油畫、印象派共9 種，比較遺憾的是暫時(shí)只支持生成人像。從最終生成效果來(lái)看，“AI繪畫”最終成像效果還是比較讓人滿意了。