[摘要]文章以媒體深度融合為背景,對(duì)Sora的發(fā)展與應(yīng)用進(jìn)行分析,提出Sora在媒體深度融合中的應(yīng)用優(yōu)勢(shì),即先進(jìn)的學(xué)習(xí)能力、敏捷的轉(zhuǎn)化工具、豐富的個(gè)性化配置和高精度的仿真效果。據(jù)此,文章從主體維度、客體維度和介體維度三個(gè)維度闡述Sora在媒體深度融合中的發(fā)展困境,并針對(duì)問(wèn)題提出相應(yīng)的策略和措施,力圖探索新技術(shù)與媒體融合發(fā)展的可行的創(chuàng)新路徑,從而助力媒體更好地傳播時(shí)代聲音、履行社會(huì)責(zé)任。
[關(guān)鍵詞]Sora;人工智能;媒體融合;發(fā)展策略
隨著人工智能技術(shù)的飛速發(fā)展,其應(yīng)用領(lǐng)域正日益擴(kuò)展。2024年,OpenAI推出了一項(xiàng)名為Sora的文生視頻模型,其能夠生成高質(zhì)量視頻內(nèi)容。這一創(chuàng)新技術(shù)有望與媒體深度融合,從而為觀眾提供更為優(yōu)質(zhì)的觀賞體驗(yàn)。這項(xiàng)創(chuàng)新技術(shù)代表了人工智能在媒體領(lǐng)域的又一次飛躍,為內(nèi)容創(chuàng)作者和媒體從業(yè)者帶來(lái)了機(jī)遇和挑戰(zhàn)。
一、Sora在媒體深度融合中的應(yīng)用優(yōu)勢(shì)
融媒體時(shí)代,人工智能技術(shù)的應(yīng)用領(lǐng)域愈加廣泛,其不僅提高了內(nèi)容生產(chǎn)效率,還使得內(nèi)容樣態(tài)更加豐富、話語(yǔ)表達(dá)方式更加多元[1]。人工智能技術(shù)的突出代表Sora在媒體深度融合中具有以下應(yīng)用優(yōu)勢(shì)。
(一)先進(jìn)的學(xué)習(xí)能力
Sora的學(xué)習(xí)能力,不僅體現(xiàn)在視頻內(nèi)容的生成,還包括對(duì)現(xiàn)實(shí)世界物理規(guī)律的學(xué)習(xí),以及對(duì)視頻中各類元素之間的關(guān)系的理解。Sora基于深度學(xué)習(xí)技術(shù),采用了先進(jìn)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和算法,能夠從海量視頻數(shù)據(jù)中學(xué)習(xí)視頻的生成和編輯規(guī)律。Sora能夠通過(guò)深度學(xué)習(xí)和人工智能算法,理解文本中的信息,并將其轉(zhuǎn)換成逼真的視頻畫面[2],比如,其可以根據(jù)用戶輸入的文本說(shuō)明,自動(dòng)生成高清、多維度且內(nèi)容豐富的短視頻。Sora可以幫助媒體從業(yè)者更好地理解復(fù)雜的理論和技術(shù)概念,為其提供直觀和生動(dòng)的學(xué)習(xí)材料。
(二)敏捷的轉(zhuǎn)化工具
Sora在媒體深度融合應(yīng)用中,需要接收新聞相關(guān)信息,這意味著其要完成大量的文本、視頻等不同形式信息的轉(zhuǎn)化。Sora能夠根據(jù)用戶輸入的文本內(nèi)容,自動(dòng)生成與之對(duì)應(yīng)的視頻。這種能力意味著用戶可以給Sora提供一個(gè)故事、描述一個(gè)場(chǎng)景,甚至是輸入一個(gè)簡(jiǎn)單的想法,Sora都能將其變?yōu)橐欢紊鷦?dòng)的視頻。Sora作為一款強(qiáng)大的文生視頻大模型,能夠快速生成高質(zhì)量的視頻內(nèi)容,從而極大地提高新聞生產(chǎn)效率。傳統(tǒng)的視頻制作流程煩瑣且耗時(shí),然而,隨著Sora的出現(xiàn),這一局面得到了顛覆性的改變。用戶只需輸入一段文字描述,Sora就能生成60秒甚至更長(zhǎng)的視頻,省去了許多環(huán)節(jié)。在新聞報(bào)道中,時(shí)效性至關(guān)重要,特別是在需要迅速向公眾傳遞現(xiàn)場(chǎng)信息的突發(fā)事件中。Sora在這方面能發(fā)揮積極作用。新聞機(jī)構(gòu)利用Sora能夠更快地發(fā)布實(shí)時(shí)新聞視頻,滿足受眾對(duì)新聞時(shí)效性的要求。
(三)豐富的個(gè)性化配置
當(dāng)Sora應(yīng)用于媒體行業(yè),它的個(gè)性化配置為新聞內(nèi)容創(chuàng)作等提供了許多便利。Sora允許用戶根據(jù)具體需求調(diào)整模型的參數(shù),其可以根據(jù)不同的應(yīng)用場(chǎng)景,生成符合特定要求的視頻。此外,Sora的架構(gòu)也支持技術(shù)擴(kuò)展,其可以輕松地集成新的技術(shù)和算法,以適應(yīng)不斷變化的用戶需求。在新聞報(bào)道中,這意味著Sora可以根據(jù)不同事件的主題和受眾需求,生成定制化的視頻新聞。如針對(duì)不同平臺(tái)的不同需求,Sora可以生成合適的視頻內(nèi)容。Sora的技術(shù)架構(gòu)支持集成新的技術(shù)和算法。這對(duì)媒體行業(yè)來(lái)說(shuō)至關(guān)重要,因?yàn)槊襟w深度融合背景下技術(shù)迭代更新速度快,而Sora可以靈活地適應(yīng)這些變化,生成適合不同平臺(tái)和設(shè)備的視頻內(nèi)容。
(四)高精度的仿真效果
Sora擅長(zhǎng)生成復(fù)雜場(chǎng)景渲染視頻。對(duì)新媒體而言,這意味著其可以根據(jù)不同主題、受眾需求和平臺(tái)特點(diǎn),定制生成獨(dú)特的視頻內(nèi)容,以吸引不同平臺(tái)的受眾[3]。Sora基于自身的仿真功能和3D動(dòng)態(tài)賦能功能能夠生成更加逼真、高質(zhì)量的視頻,從而吸引觀眾的注意力。同時(shí),Sora的能力不僅限于文生視頻,其可以在生成的視頻中創(chuàng)建多個(gè)鏡頭,模擬復(fù)雜的攝像機(jī)運(yùn)鏡,并保持角色風(fēng)格。這為用戶提供了虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)和其他交互式媒體形式等創(chuàng)新的視覺(jué)體驗(yàn)。
二、Sora在媒體深度融合中的發(fā)展困境
(一)主體維度
從Sora研發(fā)的角度來(lái)看,以O(shè)penAI為主的科技公司是主體;從Sora應(yīng)用于媒體深度融合的角度來(lái)看,網(wǎng)絡(luò)與新媒體工作者也是主體。Sora的研發(fā)與部署成本龐大,包括專業(yè)人才招募、培養(yǎng)、訓(xùn)練等方面的投入。Sora可以根據(jù)提示詞生成高質(zhì)量的視頻,甚至能夠模擬復(fù)雜的場(chǎng)景。這意味著電影、廣告、短視頻等的制作將更加自動(dòng)化,從而使得影視制作行業(yè)的一些工作崗位消失。Sora的視頻生成能力可能對(duì)自媒體和新聞業(yè)產(chǎn)生影響。比如,Sora可以快速生成高質(zhì)量的視頻內(nèi)容,有可能在一定程度上替代記者。
(二)客體維度
AI生成的內(nèi)容涉及版權(quán)歸屬和原創(chuàng)性確認(rèn)等問(wèn)題,技術(shù)開(kāi)發(fā)者需要確保AI生成的內(nèi)容不侵犯他人權(quán)益、符合道德規(guī)范。保證內(nèi)容真實(shí)、防止“深度偽造”視頻的產(chǎn)生是Sora面臨的重要挑戰(zhàn)。Sora所生成的逼真視頻存在被用于偽造新聞事件或人物言論的風(fēng)險(xiǎn),其生成內(nèi)容可能會(huì)對(duì)公眾產(chǎn)生誤導(dǎo)。深度偽造技術(shù)的不斷發(fā)展,使得侵犯著作權(quán)等問(wèn)題愈發(fā)嚴(yán)重。然而,隨著AI技術(shù)的迅猛發(fā)展,現(xiàn)有的法律法規(guī)可能難以完全應(yīng)對(duì)這種技術(shù)變革帶來(lái)的挑戰(zhàn)。在Sora的應(yīng)用過(guò)程中,部分用戶可能濫用這一技術(shù),生成與他人作品相似但略有差異的作品,引發(fā)盜版和侵權(quán)問(wèn)題。企業(yè)在運(yùn)用Sora時(shí),必須高度重視數(shù)據(jù)隱私和安全問(wèn)題。由于生成的視頻可能包含用戶信息,確保用戶信息安全成為企業(yè)必須面對(duì)并重視的關(guān)鍵問(wèn)題。
(三)介體維度
作為一種媒介,Sora在視頻生成過(guò)程中也暴露了一些不足。在面對(duì)龐大的數(shù)字與媒體資源時(shí),Sora的訓(xùn)練對(duì)硬件要求較高,需要高性能的GPU和大容量?jī)?nèi)存支持,這使得它在普通設(shè)備上難以實(shí)時(shí)運(yùn)行[4]。盡管Sora在大規(guī)模訓(xùn)練中展現(xiàn)了出色的生成能力,但在某些情況下,它可能產(chǎn)生不穩(wěn)定的結(jié)果,如生成的視頻出現(xiàn)奇怪的圖像或不連貫的場(chǎng)景。Sora的性能還受到訓(xùn)練數(shù)據(jù)的影響,對(duì)數(shù)據(jù)產(chǎn)生“依賴”。如果訓(xùn)練數(shù)據(jù)中存在偏見(jiàn)、錯(cuò)誤或不完整的信息,Sora生成的視頻也可能受到這些信息的影響。Sora的內(nèi)部工作原理復(fù)雜且難以解釋。這使得用戶難以理解它為何生成特定的視頻內(nèi)容,從而限制了其在某些場(chǎng)景中應(yīng)用的可用性。
總之,在Sora的發(fā)展過(guò)程中,技術(shù)開(kāi)發(fā)者需要克服主體、客體、中介等多維度的問(wèn)題,同時(shí),媒體機(jī)構(gòu)也要采取正確的應(yīng)對(duì)措施。
三、Sora技術(shù)在媒體深度融合中發(fā)展的策略分析
(一)以行為主體為根本,精準(zhǔn)培訓(xùn)提能力,科技賦能促就業(yè)
在人工智能時(shí)代,每個(gè)人都有機(jī)會(huì)參與到新技術(shù)帶來(lái)的變革中,這也要求個(gè)人、企業(yè)、政府三方共同努力以應(yīng)對(duì)變革。企業(yè)應(yīng)提供再教育和技能培訓(xùn),以幫助媒體工作者適應(yīng)數(shù)字化轉(zhuǎn)型后的新工作環(huán)境,學(xué)習(xí)并掌握新技術(shù)。同時(shí),企業(yè)還應(yīng)適當(dāng)引導(dǎo)人們進(jìn)行“職業(yè)轉(zhuǎn)換”,鼓勵(lì)和支持人們轉(zhuǎn)向那些人工智能較難取代的行業(yè),如創(chuàng)意相關(guān)產(chǎn)業(yè)等,以激發(fā)創(chuàng)新精神和創(chuàng)業(yè)活力,從而創(chuàng)造更多的就業(yè)機(jī)會(huì)。政府應(yīng)完善社會(huì)保障體系,為受新技術(shù)變革影響的媒體工作者提供必要的經(jīng)濟(jì)支持和社會(huì)服務(wù)。此外,政府可以制定相關(guān)政策,以鼓勵(lì)企業(yè)加強(qiáng)創(chuàng)新,共同推動(dòng)社會(huì)的和諧發(fā)展。
隨著技術(shù)的進(jìn)步,一些傳統(tǒng)職業(yè)可能會(huì)被自動(dòng)化工具取代,但同時(shí)也會(huì)出現(xiàn)新的工作崗位:負(fù)責(zé)開(kāi)發(fā)和訓(xùn)練人工智能模型,以及優(yōu)化其學(xué)習(xí)過(guò)程的人工智能訓(xùn)練師,開(kāi)發(fā)如ChatGPT、Sora等大語(yǔ)言模型;使用人工智能工具創(chuàng)作文章甚至是電影劇本的內(nèi)容創(chuàng)作者,通過(guò)編寫提示文本使大語(yǔ)言模型生成用戶想要的內(nèi)容;專注于研究人工智能倫理問(wèn)題的專業(yè)人員,他們負(fù)責(zé)在人工智能產(chǎn)品向公眾發(fā)布前進(jìn)行系統(tǒng)測(cè)試,以確保大語(yǔ)言模型不會(huì)生成有害或不道德的內(nèi)容。
(二)以數(shù)據(jù)客體為保障,強(qiáng)化意識(shí)明版權(quán),機(jī)制審查維權(quán)益
在知識(shí)產(chǎn)權(quán)領(lǐng)域,相關(guān)部門應(yīng)增強(qiáng)創(chuàng)作者的版權(quán)意識(shí),以確保他們了解著作權(quán)法以及Sora的合法使用范圍。在使用Sora生成內(nèi)容之前,創(chuàng)作者應(yīng)接受版權(quán)法律培訓(xùn),以了解受版權(quán)保護(hù)的內(nèi)容的范圍,從而在創(chuàng)作過(guò)程中避免潛在的版權(quán)風(fēng)險(xiǎn)。此外,在使用Sora生成內(nèi)容時(shí),創(chuàng)作者應(yīng)明確標(biāo)識(shí)版權(quán)歸屬,并應(yīng)用數(shù)字水印或元數(shù)據(jù)技術(shù)來(lái)有效追蹤內(nèi)容來(lái)源。具體而言,每個(gè)通過(guò)Sora生成的視頻片段都應(yīng)嵌入獨(dú)特的數(shù)字水印,以便明確版權(quán)所有者的身份。此外,創(chuàng)作者在使用Sora生成內(nèi)容之前,應(yīng)確保所使用的素材獲得合法授權(quán)或?qū)儆诠差I(lǐng)域,以避免侵犯他人的版權(quán)。例如,創(chuàng)作者如果使用了像《西游記》這樣的公共領(lǐng)域作品作為素材,其利用Sora生成的視頻就不會(huì)構(gòu)成侵權(quán)。為了確保Sora生成的所有內(nèi)容在發(fā)布前不侵犯他人的知識(shí)產(chǎn)權(quán),相關(guān)部門應(yīng)建立一套完整的版權(quán)審查機(jī)制。這一機(jī)制可以由法律專家組成的團(tuán)隊(duì)來(lái)執(zhí)行,對(duì)Sora生成的內(nèi)容進(jìn)行版權(quán)審查。
值得一提的是,廣州互聯(lián)網(wǎng)法院曾就一起生成式AI服務(wù)侵犯他人著作權(quán)案件作出生效判決,這表明了版權(quán)審查的重要性[5]。同時(shí),相關(guān)部門還應(yīng)明確版權(quán)爭(zhēng)議解決流程,以便能夠迅速應(yīng)對(duì)可能出現(xiàn)的版權(quán)問(wèn)題。例如,如果Sora生成的內(nèi)容涉嫌侵權(quán),創(chuàng)作者應(yīng)立即與版權(quán)所有者進(jìn)行溝通,尋求解決方案。另外,相關(guān)部門利用區(qū)塊鏈等技術(shù)建立內(nèi)容創(chuàng)建和所有權(quán)的不可變記錄,通過(guò)透明和去中心化的方式來(lái)驗(yàn)證內(nèi)容的完整性和版權(quán)歸屬。這樣的做法可以有效地應(yīng)對(duì)Sora在知識(shí)產(chǎn)權(quán)方面可能出現(xiàn)的問(wèn)題,以保護(hù)創(chuàng)作者的權(quán)益。
(三)以媒體介質(zhì)為支撐,優(yōu)化計(jì)算保質(zhì)量,規(guī)范使用合倫理
為了解決高性能GPU和大內(nèi)存的需求,技術(shù)開(kāi)發(fā)者可以通過(guò)云計(jì)算技術(shù)來(lái)優(yōu)化硬件,使得用戶無(wú)須擁有高端硬件也能使用Sora。云服務(wù)具備彈性的計(jì)算能力,能夠按需分配資源,從而降低成本并提高可訪問(wèn)性。同時(shí),技術(shù)開(kāi)發(fā)者應(yīng)開(kāi)發(fā)更高效的算法來(lái)減少對(duì)硬件的依賴。例如,其可以通過(guò)使用量子化技術(shù)來(lái)縮小模型,或者開(kāi)發(fā)新的輕量級(jí)模型,這些模型在保證生成視頻質(zhì)量的同時(shí),能夠在較低規(guī)格的設(shè)備上運(yùn)行。技術(shù)開(kāi)發(fā)者應(yīng)高度重視訓(xùn)練數(shù)據(jù)的質(zhì)量。技術(shù)開(kāi)發(fā)者可以通過(guò)人工審核和自動(dòng)化工具來(lái)識(shí)別和糾正偏見(jiàn)、錯(cuò)誤和不完整的信息。此外,多樣化的數(shù)據(jù)來(lái)源也有助于減少偏見(jiàn),為了提高生成結(jié)果的穩(wěn)定性,技術(shù)開(kāi)發(fā)者可以使用不同的數(shù)據(jù)集來(lái)評(píng)估模型的性能。
另外,技術(shù)開(kāi)發(fā)者應(yīng)建立倫理指導(dǎo)原則來(lái)規(guī)范Sora的使用。這包括確保生成的內(nèi)容不侵犯版權(quán)、不傳播虛假信息,并且符合社會(huì)道德標(biāo)準(zhǔn);提供教育資源和培訓(xùn),幫助用戶理解Sora的潛力和限制。通過(guò)接受相關(guān)教育,用戶可以更好地利用這項(xiàng)技術(shù),并對(duì)其生成的內(nèi)容負(fù)責(zé)。技術(shù)開(kāi)發(fā)者還可以通過(guò)建立一個(gè)活躍的用戶社區(qū),鼓勵(lì)用戶分享創(chuàng)作經(jīng)驗(yàn)。用戶社區(qū)可以促進(jìn)知識(shí)的傳播,加速問(wèn)題的解決。
四、結(jié)語(yǔ)
近年來(lái),在人工智能技術(shù)的支持下,虛擬主播、跨屏互動(dòng)、智能互動(dòng)等成為現(xiàn)實(shí),并深度融入媒體新聞實(shí)踐,成為豐富受眾體驗(yàn)及推進(jìn)媒體社交化、智能化轉(zhuǎn)型的利器。在媒體融合向縱深發(fā)展的趨勢(shì)下,Sora在新聞媒體行業(yè)擁有廣闊的發(fā)展前景。為了持續(xù)推進(jìn)Sora與媒體融合并有效落地,文章從主體、客體和介體三個(gè)維度分析Sora在媒體融合中的發(fā)展困境并提出相應(yīng)策略,為Sora在媒體融合中的應(yīng)用提供了具有可行性的路徑參考。
[參考文獻(xiàn)]
[1]喬曉鵬,竇立敏.技術(shù)引領(lǐng)下媒體融合的發(fā)展路徑探析:以北京市豐臺(tái)區(qū)融媒體中心為例[J].傳媒,2024(04):36-37.
[2]馮雨奐.AIGC時(shí)代教育的視頻化轉(zhuǎn)向及其風(fēng)險(xiǎn)應(yīng)對(duì):由文生視頻模型Sora引發(fā)的思考[J].思想理論教育,2024(05):27-33.
[3]趙臘輝.廣電媒體與新媒體融合發(fā)展存在的問(wèn)題及對(duì)策[J].中國(guó)廣播電視學(xué)刊,2024(02):47-49.
[4]高曉虹.中國(guó)新聞傳播研究:智能媒介與傳播[M]北京:中國(guó)傳媒大學(xué)出版社,2021.
[5]孫偉平,劉航宇.生成式人工智能與知識(shí)生產(chǎn)方式的革命:從Sora的沖擊波談起[J].思想理論教育,2024(05):12-18.