陳文泰 孫仲伯
【摘要】Sora模型作為構(gòu)建物理世界通用模擬器的路徑方式,證實(shí)了生成式AI對(duì)現(xiàn)實(shí)復(fù)刻的強(qiáng)大能力,誘發(fā)人們對(duì)技術(shù)鏡像的生態(tài)級(jí)反思。首先闡明Sora技術(shù)邏輯的兩個(gè)關(guān)鍵詞,即生成性與轉(zhuǎn)化性;其次從技術(shù)性問題和主體性問題兩個(gè)角度分析了生成式技術(shù)失靈所導(dǎo)致的鏡像困境;最后探討了技術(shù)同以人為主體的價(jià)值對(duì)齊治理路徑,強(qiáng)調(diào)在視頻敘事上在觀照人類文明共同價(jià)值,在主體行動(dòng)上助力推進(jìn)多元主體價(jià)值規(guī)訓(xùn)與協(xié)同演進(jìn)。此外,依托后現(xiàn)代主義視域,提請(qǐng)人們關(guān)注生成式AI浪潮下自身主體存在著不可生成性的價(jià)值,追問生活世界和主體性行動(dòng)的存在意義,以期理解Sora在引領(lǐng)媒介生態(tài)迭代過程中所存在的結(jié)構(gòu)化危機(jī)和價(jià)值性出路。
【關(guān)鍵詞】生成式AI;Sora;技術(shù)邏輯;人機(jī)協(xié)同;價(jià)值對(duì)齊
2024年2月15日,由Open AI開發(fā)的文生視頻模型Sora在全網(wǎng)爆火,使人們對(duì)建構(gòu)視頻場(chǎng)景的精神想象轉(zhuǎn)化為具體可見的技術(shù)性實(shí)踐。理解Sora,也就是使AI理解現(xiàn)實(shí)世界,以更為細(xì)膩的色彩、動(dòng)作、光影等元素對(duì)話客觀實(shí)在,填補(bǔ)文本或單一媒介衍射現(xiàn)實(shí)的感官缺陷。本文傾向于將Sora所帶來的媒介生態(tài)迭代理解為一種漸進(jìn)式革命,在探討其對(duì)相關(guān)媒介行業(yè)的顛覆性作用的同時(shí)不斷追問其所扎根的現(xiàn)實(shí)社會(huì)基礎(chǔ)與人的主體性權(quán)力操縱,也就是說,Sora是定位在生成式AI浪潮下的一個(gè)視頻技術(shù)革命的節(jié)點(diǎn),是繼ChatGPT討論后人們對(duì)圖示化世界的技術(shù)性理解。不難發(fā)現(xiàn),人類對(duì)自身存在之境的探索與媒介技術(shù)演化同軌同歸,Sora的內(nèi)在生成和語義轉(zhuǎn)化正在實(shí)現(xiàn)著重建自然與人性對(duì)話的交往目的。Sora或許揭示了這樣一種可能,即以生成式鏡像來映射我們對(duì)世界的情感與想象,將無限生成的數(shù)字圖景同絕對(duì)運(yùn)動(dòng)的客觀世界緊密聯(lián)系,甚至反哺現(xiàn)實(shí)生活的需求和發(fā)展,擴(kuò)容了我們對(duì)社會(huì)存在的討論,重塑了我們接觸和處理這個(gè)世界的方式。
這需要注意兩個(gè)問題:一是對(duì)技術(shù)本體的追問,尤其是在新技術(shù)誕生之初,因其自身功能設(shè)置的不成熟和系統(tǒng)規(guī)則的不完備情況所帶來的種種技術(shù)性失實(shí)問題。在Sora建構(gòu)超真實(shí)社會(huì)之時(shí),技術(shù)對(duì)人的沉淪(這包括了對(duì)自我身份職業(yè)的認(rèn)知迷思、現(xiàn)實(shí)境況的認(rèn)知錯(cuò)位及一切關(guān)于自身存在意義的忽視問題)將重新掀起當(dāng)下媒介哲學(xué)的討論風(fēng)波。二是對(duì)人的主體性追問,這里突出人們對(duì)Sora的能動(dòng)性應(yīng)用以及潛在的資本支配和權(quán)力博弈問題。這兩個(gè)問題指涉了技術(shù)發(fā)展同人本價(jià)值的行動(dòng)糾纏,追問了技術(shù)作為現(xiàn)實(shí)鏡像的仿真能力與社會(huì)作用。值得一提的是,Sora所呈現(xiàn)的技術(shù)邏輯,不僅僅體現(xiàn)了技術(shù)對(duì)客觀現(xiàn)實(shí)的鏡像式處理,還夾雜了人們對(duì)技術(shù)賦能(諸如時(shí)空延展、無限生成)的數(shù)字想象,這可能加劇遮蔽著我們對(duì)生活世界的生存追問。故而,無論生成式AI浪潮何以解構(gòu)真實(shí)并建構(gòu)擬態(tài),人作為一切技術(shù)運(yùn)作的操盤手都應(yīng)嵌入自身主體性價(jià)值,讓技術(shù)成為有溫度、有效度的社會(huì)生活方式和生產(chǎn)方式,進(jìn)而實(shí)現(xiàn)媒介生態(tài)中多元主體的價(jià)值共創(chuàng)和協(xié)同演進(jìn)。
一、生成性與轉(zhuǎn)化性:Sora技術(shù)邏輯的兩個(gè)關(guān)鍵詞
理解Sora技術(shù)邏輯的關(guān)鍵在于兩點(diǎn):一是生成性。其自身延續(xù)了AI的生成式邏輯,在注入文本要素和價(jià)值關(guān)系基礎(chǔ)上進(jìn)行預(yù)訓(xùn)練及深度數(shù)據(jù)學(xué)習(xí),實(shí)現(xiàn)視頻圖片的結(jié)構(gòu)化生成。二是轉(zhuǎn)化性。訴之于文本、圖片轉(zhuǎn)化為視頻的基礎(chǔ)上,主體權(quán)力下沉與數(shù)字主體轉(zhuǎn)化是Sora實(shí)現(xiàn)其技術(shù)特質(zhì)的重要表現(xiàn)。
(一)生成性:實(shí)現(xiàn)人機(jī)對(duì)話與功能涌現(xiàn)的底層邏輯
Sora技術(shù)邏輯的生成性是根據(jù)Transformer和Diffusion模型對(duì)文本中場(chǎng)景、色彩、動(dòng)作等信息要素進(jìn)行數(shù)字化處理并生成結(jié)構(gòu)化視頻圖像產(chǎn)品,其作為一種生產(chǎn)過程橋接了人機(jī)對(duì)話和功能涌現(xiàn)的兩端。
其中,人機(jī)對(duì)話包含了Sora的自然語言處理(NLP)系統(tǒng)和用戶交互式提示兩個(gè)向度,使得生成視頻的同時(shí)可以實(shí)時(shí)反饋和調(diào)適作品內(nèi)容。Sora的后端系統(tǒng)包含自然語言處理模塊,其能夠理解和解析用戶的文本指令。Sora的NLP系統(tǒng)主要體現(xiàn)出四個(gè)方面生成特征:第一,理解性。NLP系統(tǒng)能夠理解用戶輸入文本的上下文含義,并據(jù)此生成相關(guān)文本內(nèi)容。第二,創(chuàng)造性。NLP系統(tǒng)可以生成全新文本,而不僅僅是復(fù)制或總結(jié)已有內(nèi)容。第三,適應(yīng)性。NLP系統(tǒng)可以生成多種不同風(fēng)格和類型的文本,以適應(yīng)不同的用戶需求和場(chǎng)景。第四,人性化。NLP系統(tǒng)不僅能夠生成文本,還能夠模擬人類的情感和思維方式,生成具有情感色彩和人性化的文本。用戶的交互式提示則需要用戶向Sora提供指令、修改和調(diào)整在文本生成過程中的種種偏差,以引導(dǎo)模型朝向用戶期望的結(jié)果發(fā)展??梢哉f,這一交互式生產(chǎn)反映出了實(shí)時(shí)性特征,用戶可以看到視頻生成的進(jìn)度和效果并根據(jù)實(shí)際情況進(jìn)行調(diào)整,通過大數(shù)據(jù)學(xué)習(xí)及算法自動(dòng)識(shí)別也可以改進(jìn)生成過程中的種種缺陷,進(jìn)而反饋出其迭代性特征,即Sora可以進(jìn)行迭代生成,以不斷修改和完善文本內(nèi)容來滿足用戶需求。
涌現(xiàn)性是生成性的高級(jí)形態(tài),Sora模型作為一個(gè)復(fù)雜系統(tǒng),其內(nèi)部元素(如神經(jīng)網(wǎng)絡(luò)的層、文本指令的詞匯等)之間的非線性相互作用及無限生成導(dǎo)致了功能的涌現(xiàn)。因而理解Sora生成性的同時(shí),需要觀照其所帶來的涌現(xiàn)性,以此解讀Sora作為“世界模擬器”(word simulator)的可能。涌現(xiàn)性描述了一種從簡(jiǎn)單到復(fù)雜的行為或特性出現(xiàn)的現(xiàn)象,這在Sora中表現(xiàn)為以文本指令催生豐富、連貫、具有情感性的視頻故事。
(二)轉(zhuǎn)化性:從敘事形式轉(zhuǎn)換到數(shù)字主體的深度追問
Sora技術(shù)邏輯的轉(zhuǎn)化性既是針對(duì)文生視頻圖示的形式迭代,也是主體層面上的權(quán)力下沉與敘事轉(zhuǎn)換,其技術(shù)發(fā)展一方面正在跨越專業(yè)邊界實(shí)現(xiàn)用戶深度參與,一方面將抽象、感性的人類想象方式具化為一種可見的數(shù)字景觀。
Sora最直觀的表現(xiàn)就在于實(shí)現(xiàn)從文本到視頻圖示的轉(zhuǎn)化,這一轉(zhuǎn)化同時(shí)伴隨著對(duì)文本內(nèi)容的多模態(tài)敘事。當(dāng)然,Sora不僅能夠根據(jù)文本生成視頻,還能夠根據(jù)靜態(tài)圖像制作動(dòng)畫,實(shí)現(xiàn)敘事效果從靜態(tài)到動(dòng)態(tài)的轉(zhuǎn)化。這種敘事呈現(xiàn)形式的轉(zhuǎn)化有著重要的媒介意義,其在于聯(lián)通了人與媒介之間以及媒介與媒介之間的關(guān)系性,實(shí)現(xiàn)了真正意義上的跨媒介敘事。不難發(fā)現(xiàn),Sora對(duì)用戶的深度賦權(quán)正在為個(gè)體提供前所未有的創(chuàng)作自由度和可能性,也正在逐步實(shí)現(xiàn)創(chuàng)作與編輯高質(zhì)量視頻的社會(huì)化推廣。孫瑋曾以“媒介通用性”概念理解AI技術(shù)如何接入特定時(shí)空的文化境況并轉(zhuǎn)化為社會(huì)及人類自身的變革動(dòng)能[1]。Sora的出現(xiàn)則將這一概念進(jìn)一步實(shí)體化,將人們對(duì)現(xiàn)實(shí)與數(shù)字世界的感知存在轉(zhuǎn)化為可見、可預(yù)測(cè)的數(shù)字圖景,在此基礎(chǔ)上的主體轉(zhuǎn)化也就包括了主體性數(shù)字化轉(zhuǎn)型、準(zhǔn)入及專業(yè)性門檻降低等表征。數(shù)字主體突破了現(xiàn)實(shí)主體的信息儲(chǔ)存、語言與思維阻隔等交往障礙,將人的身體與思想同時(shí)空存在相切割剖離,并揭示了生成式AI浪潮下媒介通用性的合法性,以Sora為代表的文生視頻模型正在助力全息化與全能型媒介的全域境溝通。
二、生成式技術(shù)失靈的鏡像困境
當(dāng)人不再是傳播的主體,而是以新技術(shù)為依托,以非人類實(shí)體融入實(shí)踐,真實(shí)與虛擬的界限就會(huì)變得愈加模糊。[2]Sora不僅在實(shí)現(xiàn)著真實(shí)與虛擬的邊界內(nèi)爆,更在重構(gòu)著人們對(duì)世界景觀的整體性認(rèn)同。可以說,Sora對(duì)生活世界的追問與復(fù)刻以至于生成一個(gè)孿生場(chǎng)域,每每在技術(shù)失靈的情況下,我們才能體悟現(xiàn)實(shí)世界對(duì)其的操作控制。如是,我們可以從兩個(gè)維度探討Sora可能帶來的鏡像式困境:技術(shù)本身所反饋的問題和技術(shù)背后的權(quán)力博弈。
(一)技術(shù)深耕的欠缺:鏡像失實(shí)的技術(shù)性問題
Sora作為一種新興技術(shù)產(chǎn)品在誕生之初也存在諸多功能不足的情況,一系列技術(shù)性問題導(dǎo)致了視覺體驗(yàn)同物理空間規(guī)律呈現(xiàn)相互割裂,進(jìn)而未能深度實(shí)現(xiàn)人機(jī)交互與用戶沉浸。
具體來說,突出表現(xiàn)在以下幾個(gè)方面:(1)Sora對(duì)生活細(xì)節(jié)捕捉不足。盡管Sora能夠生成具有多個(gè)角色和復(fù)雜場(chǎng)景的視頻,但在捕捉細(xì)節(jié)方面仍有欠缺,如視頻畫面表現(xiàn)的隱喻及其共情能力,異質(zhì)文化下習(xí)俗與語言應(yīng)用能力,非語言符號(hào)的信息讀取能力等問題仍是生成式AI對(duì)人類生活生產(chǎn)行動(dòng)領(lǐng)會(huì)的盲點(diǎn)。(2)Sora在物理及自然規(guī)律理解的準(zhǔn)確性不足。首先Sora無法精準(zhǔn)捕捉和模擬物體運(yùn)動(dòng),導(dǎo)致生成視頻中物體動(dòng)作表現(xiàn)得不自然或者不符合物理規(guī)律。其次Sora在處理空間關(guān)系時(shí)出現(xiàn)錯(cuò)誤。比如混淆左右方向,或者在生成的視頻中錯(cuò)誤地放置物體,導(dǎo)致它們?cè)诳臻g中的關(guān)系不符合現(xiàn)實(shí)世界的邏輯。再次Sora對(duì)光影效果的模擬失真。在生成視頻時(shí),Sora無法準(zhǔn)確模擬光影效果,導(dǎo)致光線和陰影的分布看起來不自然,或者在特定場(chǎng)景中的光照條件不符合物理定律。(3)Sora對(duì)生成視頻的邏輯性與連貫性理解不強(qiáng)。首先時(shí)間順序方面。生成視頻中的事件沒有按照合理的時(shí)間順序發(fā)生,導(dǎo)致觀眾難以跟隨故事進(jìn)展。其次因果關(guān)系方面。視頻中事件缺乏清晰的因果關(guān)系,使得角色的行為和事件的后果之間似乎沒有合理聯(lián)系。再次邏輯流程方面。視頻的情節(jié)和對(duì)話可能缺乏內(nèi)在的邏輯性,使得角色的決策和行為難以理解。Sora生成視頻中的場(chǎng)景轉(zhuǎn)換可能過于突兀,使得觀眾難以理解場(chǎng)景之間的聯(lián)系。(4)Sora在生成視頻時(shí)需要較高的算力資源,這導(dǎo)致其在實(shí)時(shí)應(yīng)用場(chǎng)景中的性能受限。在資源有限的環(huán)境中(如移動(dòng)設(shè)備或嵌入式系統(tǒng)),Sora的高計(jì)算資源需求會(huì)導(dǎo)致系統(tǒng)無法有效分配資源給其他關(guān)鍵任務(wù)。綜合來看,這些問題在需要快速響應(yīng)和高效計(jì)算的應(yīng)用場(chǎng)景中尤為突出,可能會(huì)導(dǎo)致用戶體驗(yàn)下降和應(yīng)用效果受限。
(二)主體權(quán)力的博弈:鏡像呈現(xiàn)背后的始作俑者
技術(shù)升維降低了媒介的準(zhǔn)入門檻[3],但在Sora使用權(quán)限逐漸開放的初始期,權(quán)力與資本早已侵占或規(guī)劃了技術(shù)的使用限度,這使得我們不得不追問個(gè)體賦權(quán)的限度以及賦權(quán)后所可能帶來的媒介生態(tài)亂象。
首先是確認(rèn)Sora對(duì)個(gè)體賦權(quán)的有限性,這種有限性將擴(kuò)大既有數(shù)字鴻溝。有學(xué)者將生成式AI對(duì)個(gè)體的賦權(quán)歸納為兩個(gè)方面:一是提升個(gè)體傳播能力與彌合數(shù)字文明社會(huì)的能力溝,二是增強(qiáng)個(gè)體的知覺與連接能力。[4]優(yōu)先使用接觸Sora的用戶同其對(duì)信息技術(shù)發(fā)展的敏感度、技術(shù)使用素質(zhì)、可接入設(shè)備條件有著強(qiáng)關(guān)聯(lián),那么言及Sora的個(gè)體賦權(quán)即前置性將具有相應(yīng)條件的用戶納入技術(shù)使用的目標(biāo)對(duì)象之中。在用戶實(shí)現(xiàn)技術(shù)賦權(quán)后,我們可以發(fā)現(xiàn)用戶的數(shù)字化生存即出現(xiàn)數(shù)字主體同肉身的割裂。Sora正在反映出現(xiàn)實(shí)鏡像對(duì)主體在媒介生態(tài)中的權(quán)力消解,用戶將權(quán)力(包括編輯、渲染、審查等方面)讓渡于技術(shù)模型,使數(shù)字在場(chǎng)(digital present)與肉身在場(chǎng)之間存在巨大的斷裂與鴻溝。[5]需要說明的是,盡管生成式AI能夠?qū)⑷说男袆?dòng)、情緒甚至思維觀念進(jìn)行模仿,但這更多是基于對(duì)已知數(shù)據(jù)的建構(gòu)和推測(cè),不能對(duì)人類行動(dòng)表達(dá)的未知性進(jìn)行框架化、模式化處理,同理,用戶對(duì)生成視頻的游牧式閱覽也不能證明主體行動(dòng)自身的無序性。
其次是權(quán)力控制下的Sora可能衍生出的媒介生態(tài)亂象。一是從用戶間數(shù)字鴻溝到國(guó)家間數(shù)字鴻溝的技術(shù)整體性失衡問題。如上文所言,受社會(huì)資本分布不平等的結(jié)構(gòu)制約,擁有豐富社會(huì)資本的個(gè)體或群體(如專家、意見領(lǐng)袖、媒體機(jī)構(gòu)等)可以利用Sora生成與其相關(guān)的研究分析、藝術(shù)作品、廣告或新聞來擴(kuò)大影響力,進(jìn)而加劇同社會(huì)資本較少人員之間的差距。那么,Sora及Open AI的崛起同樣意味著國(guó)家信息主權(quán)的全球性爭(zhēng)奪,政治傳播的數(shù)智化迭代放大了我們對(duì)第三世界國(guó)家及“失語”群體的觀照,由Sora所塑造的景觀社會(huì)及民族想象將加劇政治地緣的緊張關(guān)系。二是用戶賦權(quán)下Sora對(duì)新聞?wù)鎸?shí)性的沖擊。Sora模型可以輕松生成較為逼真的視頻內(nèi)容,這使得自媒體創(chuàng)作者在利益或某種時(shí)效性驅(qū)使下制作并傳播虛假新聞,這些虛假視頻可能被用于散布誤導(dǎo)性信息、操縱公眾輿論甚至進(jìn)行網(wǎng)絡(luò)攻擊和詐騙等非法活動(dòng)。由于Sora生成高度逼真的視頻圖像,類似“火星人入侵地球”事件或?qū)⒅鼗禺?dāng)代媒介現(xiàn)實(shí)之中,導(dǎo)致公眾對(duì)新聞媒體的信任度下降。此外,以技術(shù)為行動(dòng)主體行使其自身規(guī)則的技術(shù)權(quán)力正在對(duì)人類生活意義與工作成就產(chǎn)生存在性隱憂。當(dāng)我們考慮到工作不僅是人們的謀生手段,還與我們對(duì)生活的意義聯(lián)系在一起時(shí),由Sora映射出的生成式AI浪潮會(huì)將這些擔(dān)憂進(jìn)一步放大。Danaher認(rèn)為人工智能的部署可能將我們從各種意義領(lǐng)域截?cái)?,人類?huì)在一個(gè)以作為機(jī)器人玩游戲?yàn)閷?dǎo)向的社會(huì)中過上有意義的生活[6]。Sora的普及對(duì)生活意義與工作成就所產(chǎn)生的威脅可以從“人—機(jī)”三種演進(jìn)角色中呈現(xiàn):人類仍然對(duì)技術(shù)處于“監(jiān)督”角色、人為參與減少到機(jī)器的“維護(hù)”角色和人類屈從于機(jī)器,淪為僅僅“服從命令”[7]。在此過程中,人類正在逐漸實(shí)現(xiàn)從AI代筆到AI推理的工作轉(zhuǎn)化,逐步降低與人類工作任務(wù)相關(guān)的產(chǎn)出價(jià)值,并最終切斷人工與價(jià)值產(chǎn)出之間的因果關(guān)系以及人類對(duì)生活世界的認(rèn)知體驗(yàn)。
三、價(jià)值對(duì)齊:生成式AI浪潮下Sora的人本省思與治理之策
價(jià)值對(duì)齊的核心要義就是使Sora的應(yīng)用運(yùn)行同人類社會(huì)的道德倫理和法制觀念相統(tǒng)一,其關(guān)系著Sora乃至生成式AI是否能夠真正為人類服務(wù)。本文力圖從內(nèi)容和主體兩個(gè)維度省思Sora模型中可供內(nèi)嵌的人文價(jià)值,剖析以人為主體如何實(shí)現(xiàn)對(duì)Sora的價(jià)值規(guī)訓(xùn),以期達(dá)到人類意圖與價(jià)值觀同生成式AI系統(tǒng)的目標(biāo)行為實(shí)現(xiàn)深度互嵌。
(一)技術(shù)人本化的價(jià)值嵌入
Sora實(shí)現(xiàn)價(jià)值對(duì)齊的本質(zhì)就在于其與人類文明共同價(jià)值追求相一致,提升Sora生成視頻的表現(xiàn)水平,關(guān)鍵在于發(fā)掘其內(nèi)在敘事的價(jià)值倫理以及跨文化表現(xiàn)張力。由于訓(xùn)練算法模型的大量數(shù)據(jù)具有高速、異構(gòu)和可變性特征,所以對(duì)Sora的價(jià)值倫理審查與算法偏見篩選應(yīng)補(bǔ)充定期風(fēng)險(xiǎn)評(píng)估。一旦確定風(fēng)險(xiǎn),就可以用道德模型來幫助確定Sora的發(fā)展方向,其中作為倫理理論的功利主義是做出對(duì)個(gè)人、社會(huì)、環(huán)境造成最小傷害的常見道德決策方法。從生成式AI風(fēng)險(xiǎn)管理的角度來看,該理論通過以結(jié)果為導(dǎo)向的視角,在風(fēng)險(xiǎn)管理周期的各個(gè)階段制定和測(cè)試政策。應(yīng)該以倫理理論視角鞏固AI風(fēng)險(xiǎn)管理框架,在AI工具包和框架內(nèi)嵌入倫理觀點(diǎn),做出對(duì)社會(huì)負(fù)責(zé)的判斷,這也將有助于確保以有目的、謹(jǐn)慎、理性與道德的方式利用Sora等生成式AI模型,進(jìn)一步促進(jìn)媒介生態(tài)良性發(fā)展。
(二)主體應(yīng)用中的價(jià)值規(guī)訓(xùn)
主體應(yīng)用是探討價(jià)值對(duì)齊的主體維度,依靠各主體對(duì)生成視頻敘事的價(jià)值規(guī)訓(xùn)來實(shí)現(xiàn)AI向善。科瓦奇認(rèn)為“新聞工作的實(shí)質(zhì)是用核實(shí)進(jìn)行約束”[8],執(zhí)行Sora的主體同樣承載著對(duì)其內(nèi)容價(jià)值的核查與規(guī)訓(xùn),橋接了媒介價(jià)值驗(yàn)證與公眾理解信任的雙重意義。各主體對(duì)Sora的應(yīng)用過程就是面向價(jià)值對(duì)其的核實(shí)過程,是對(duì)技術(shù)人本化的能動(dòng)實(shí)現(xiàn),調(diào)整Sora生成視頻呈現(xiàn)中普適性與特殊性、理性與感性價(jià)值之間的矛盾性。具體來看,價(jià)值核實(shí)的主體可以分為監(jiān)管機(jī)構(gòu)、提示工程師和用戶等諸多協(xié)同主體。
一是監(jiān)管機(jī)構(gòu)層面。監(jiān)管機(jī)構(gòu)應(yīng)制定針對(duì)生成式Sora視頻模型的數(shù)據(jù)安全規(guī)定,明確數(shù)據(jù)收集、存儲(chǔ)、處理和傳輸?shù)暮弦?guī)要求,這包括對(duì)用戶隱私的保護(hù)、數(shù)據(jù)的加密存儲(chǔ)以及敏感信息的嚴(yán)格控制。監(jiān)管機(jī)構(gòu)有權(quán)要求Sora提供透明的隱私政策,讓用戶清楚自身數(shù)據(jù)如何被收集和利用,并讓Sora開發(fā)者提供算法的透明度和可解釋性,以便平臺(tái)方和公眾能夠理解和評(píng)估其內(nèi)容的生成過程,及時(shí)糾正潛在的偏見和歧視問題。白宮科技政策辦公室曾在2022年提出的《人工智能權(quán)利法案藍(lán)圖》中確定了圍繞安全、歧視、隱私和人類價(jià)值考慮的四項(xiàng)原則用于指導(dǎo)生成式AI系統(tǒng)的開發(fā),以及明確在模型開發(fā)生命周期中實(shí)現(xiàn)這些原則的細(xì)節(jié)[9],對(duì)隱私數(shù)據(jù)和安全風(fēng)險(xiǎn)的監(jiān)管已然成為監(jiān)管機(jī)構(gòu)維系平臺(tái)社會(huì)穩(wěn)定與保障公眾利益價(jià)值的重要職能。
二是提示工程師層面。提示工程師強(qiáng)調(diào)對(duì)設(shè)計(jì)、優(yōu)化和迭代機(jī)器學(xué)習(xí)模型的提示,以提高模型的性能和輸出質(zhì)量。雖然Sora的信源是人類,處理后的敘述目標(biāo)也是人類,但認(rèn)知、解釋和自由裁量權(quán)的功能卻是具有計(jì)算性的。因此,當(dāng)我們看到Sora工具執(zhí)行代理任務(wù)時(shí),提示工程師發(fā)揮了調(diào)和兩端價(jià)值的中堅(jiān)作用。尤其在提升模型理解能力上,提示工程師可以結(jié)合文本、圖像、音頻等多種數(shù)據(jù)類型,提高模型對(duì)不同模態(tài)信息的理解和處理能力。通過加強(qiáng)模型對(duì)物理規(guī)律和邏輯關(guān)系的理解,確保視頻圖像在物理上可行且邏輯上連貫。
三是用戶層面。重視用戶的主體價(jià)值建設(shè),關(guān)鍵在于提高用戶的技術(shù)使用素養(yǎng)以及對(duì)其自身主體性的認(rèn)同。在Sora模型實(shí)現(xiàn)權(quán)力下沉的過程中,人的主體性發(fā)揮可能同技術(shù)建構(gòu)之間的關(guān)系發(fā)生扭曲,用戶逐步淪為對(duì)Sora的喂養(yǎng)者和打工人,并沉迷于Sora所生成的超真實(shí)世界之中,由此所生成的思維和行動(dòng)反向限制了用戶在現(xiàn)實(shí)世界中的正常生活。對(duì)此,為防范技術(shù)對(duì)自身主體性的異化,用戶需要培養(yǎng)對(duì)技術(shù)的批判性思維。用戶應(yīng)在接入Sora模型時(shí),了解自身可供開放的隱私權(quán)限,知曉應(yīng)用程序?qū)ψ陨砥脚_(tái)關(guān)聯(lián)數(shù)據(jù)和行動(dòng)數(shù)據(jù)的讀取,了解生成視頻所存在的潛在隱私風(fēng)險(xiǎn)、版權(quán)危機(jī)及其價(jià)值觀問題。全面提升Sora用戶素養(yǎng),就應(yīng)著力提升用戶對(duì)模型的理解力、鑒別力、判斷力和應(yīng)用力,將Sora的價(jià)值建構(gòu)主體和價(jià)值引領(lǐng)主體延伸至“最后一公里”,在個(gè)體維度實(shí)現(xiàn)與社會(huì)價(jià)值的細(xì)粒度對(duì)齊。
需要說明的是,探討價(jià)值對(duì)齊的主體維度不限于上述三個(gè)層面,還涉及相關(guān)立法機(jī)構(gòu)、行業(yè)協(xié)會(huì)、平臺(tái)組織、程序設(shè)計(jì)師、教育機(jī)構(gòu)等多元責(zé)任主體。在媒介生態(tài)治理機(jī)制中,要實(shí)現(xiàn)價(jià)值主體的“聚沙成塔”,多元協(xié)同形成覆蓋Sora生成過程中的價(jià)值主體鏈,及時(shí)規(guī)訓(xùn)與糾正技術(shù)演化邏輯中的問題點(diǎn),著力覆蓋生成式AI價(jià)值路徑中的問題域,以期實(shí)現(xiàn)以人為本、尊重人權(quán)和法治原則的平臺(tái)媒介價(jià)值規(guī)制。
四、反思與討論:不可生成性的價(jià)值
AI浪潮下Sora的出現(xiàn)正在放大我們對(duì)技術(shù)邏輯及其所帶來種種可能的討論,它所生成的世界不再是對(duì)符碼、數(shù)據(jù)的簡(jiǎn)單羅列,而是對(duì)數(shù)據(jù)群以及概念化世界的系統(tǒng)性整合。筆者傾向于將Sora所建構(gòu)的圖示化景觀比作技術(shù)對(duì)照現(xiàn)實(shí)的某種鏡像,并認(rèn)為這順延了西方傳統(tǒng)語音中心主義和邏輯中心主義的發(fā)展理路,依靠數(shù)字技術(shù)將人類復(fù)雜文化活動(dòng)化約為同一性、確定性和可理解性的符碼模型,以權(quán)力、資本及與之相關(guān)的生存需求為動(dòng)力,實(shí)現(xiàn)了人類對(duì)技術(shù)從“賦能”到“賦魂”的深層次轉(zhuǎn)變。雖然我們討論了價(jià)值對(duì)齊對(duì)于Sora的人本省思,力圖通過AI對(duì)人類已有知識(shí)成果強(qiáng)大的學(xué)習(xí)和整合能力實(shí)現(xiàn)全領(lǐng)域、細(xì)粒度的價(jià)值連接[10],以此促成人與技術(shù)的協(xié)同共生,但不得不承認(rèn),在Sora對(duì)現(xiàn)實(shí)存在的媒介化過程中,思維意識(shí)、情感表達(dá)及各種相關(guān)因素都不可避免地發(fā)生了扭曲。如此一來,“價(jià)值對(duì)齊”就成為我們對(duì)一切可供符號(hào)化表述的敘事參照,對(duì)模糊化、不確定性、非建制的不可生成性問題懸置一旁。
發(fā)掘不可生成性價(jià)值,是使人們?cè)偎糀I浪潮下的主體性存在方式并重新發(fā)現(xiàn)生活之美。不難發(fā)現(xiàn)這樣一種現(xiàn)象:人類一方面通過媒介來截除肉身同現(xiàn)實(shí)世界的感知能力,實(shí)現(xiàn)著某種超乎肉體所能達(dá)到的快感,比如通過建立文字、聲音系統(tǒng)來理解客觀實(shí)在;另一方面又在技術(shù)演進(jìn)過程中重拾身體的重要性,寄希望肉身在虛擬世界中找到某種現(xiàn)實(shí)的感覺,這也誕生了我們對(duì)Sora的功能界定—理解和模擬現(xiàn)實(shí)世界的模型基礎(chǔ)。但一系列數(shù)字孿生的出現(xiàn),需要我們重拾對(duì)“中心—邊緣”關(guān)系的隱憂,這不僅僅是指資本權(quán)力締造下的數(shù)字生態(tài)格局,還存在虛擬世界同現(xiàn)實(shí)生活、非人行動(dòng)者與人類之間的種種關(guān)系性問題。在技術(shù)全面滲透進(jìn)生活世界之后,我們愈加發(fā)現(xiàn)生活世界逐步淪為技術(shù)的某種鏡像,我們的生活語言、生產(chǎn)與消費(fèi)方式以及情感正在不斷效仿某種技術(shù)邏輯。1979年,利奧塔在他關(guān)于《后現(xiàn)代狀況》的報(bào)告中寫道,技術(shù)變革正在改變我們理解敘事和話語的方式。他認(rèn)為,將不可翻譯的信息過濾到數(shù)字系統(tǒng)中,以信息系統(tǒng)的交流透明度實(shí)現(xiàn)知識(shí)的商品化,是計(jì)算技術(shù)如何產(chǎn)生新的認(rèn)識(shí)條件。[11]于是衍生了我們對(duì)技術(shù)何以異化人類生活的討論,Sora正在放大我們對(duì)這些問題的關(guān)切,比如它反向控制了某些行業(yè)走向消弭、淘汰掉重復(fù)性或低端勞動(dòng)進(jìn)而加大就業(yè)內(nèi)卷、重塑我們對(duì)審美的判定等。這需要提請(qǐng)人們關(guān)注自身主體性的存在價(jià)值,強(qiáng)調(diào)生成式AI引發(fā)對(duì)生活的結(jié)構(gòu)化浪潮下主體自身的去結(jié)構(gòu)化路徑。一種形而上的方式是,將各種以視頻圖示作為主要表現(xiàn)形態(tài)和表達(dá)方式的傳統(tǒng)思想,演變?yōu)榫哂卸嘀叵笳饕饬x或模糊關(guān)系的純符號(hào)游戲結(jié)構(gòu),破除原有的“符號(hào)—意義”二元對(duì)立固定結(jié)構(gòu)和二元對(duì)立指涉關(guān)系,將人們?cè)赟ora模型上的應(yīng)用行動(dòng)理解為一種破除符號(hào)結(jié)構(gòu)而進(jìn)行自由詮釋的創(chuàng)造性活動(dòng)。喚醒人們?cè)谏墒紸I時(shí)代中對(duì)生活本真狀態(tài)的追求,需要融入新盧德主義對(duì)新技術(shù)的批判性反思,以人文主義情懷批判操縱生活和自然的機(jī)械主義世界觀,理解技術(shù)建構(gòu)的有限性問題。實(shí)際上,每一種建構(gòu)都是不完整的,因?yàn)樗缓w了被遺忘時(shí)間的細(xì)小片段。[12]所以,再思人類情感價(jià)值與生活狀態(tài)的不可表達(dá)性,其對(duì)照了技術(shù)層面的不可生成性,是網(wǎng)絡(luò)環(huán)境中觀照主體性存在的后現(xiàn)代策略。這種策略旨在表現(xiàn)某種不能精確表達(dá)的離經(jīng)叛道心態(tài)、思想觀念與生活方式,以此發(fā)現(xiàn)具有感性或想象的認(rèn)知能力的無序創(chuàng)造。
最后,我們重申Sora作為世界模擬器所具備的生成性和轉(zhuǎn)化性特征,這使得權(quán)力話語或某種意向性指向具備更明顯的增值和撒播能力。當(dāng)Sora成為實(shí)現(xiàn)邏各斯或某種建制主義工具時(shí),從人類主體活動(dòng)的不可生成性價(jià)值反思,到民族國(guó)家的本土敘事與集體反抗,都能說明Sora自身技術(shù)性同人類主體價(jià)值之間存在著巨大鴻溝。正是這一鴻溝的存在,才證明了人類主體存在的不可替代性,證實(shí)了生活世界中“無用之用”的存在意義,強(qiáng)調(diào)了媒介生態(tài)迭代過程中多元主體的交往價(jià)值與行動(dòng)要義。
[本文為教育部人文社會(huì)科學(xué)研究青年項(xiàng)目“國(guó)際傳播中多級(jí)文化折扣生成機(jī)理及治理研究”(23YJC860003)、河南省研究生教育改革與質(zhì)量提升工程項(xiàng)目“傳媒經(jīng)濟(jì)研究”(YJS2024KC27)階段性研究成果]
參考文獻(xiàn):
[1]孫瑋.“視頻化社會(huì)”的來臨:從Chat GPT展望媒介通用性變革[J].探索與爭(zhēng)鳴,2023(12):55-62+193.
[2]郭全中,黃澤晶.眼鏡下的虛實(shí)邊界:空間計(jì)算對(duì)虛擬與現(xiàn)實(shí)的重構(gòu)[J].新聞愛好者,2023(10):4-9.
[3]約翰·杜海姆·彼得斯.奇云:媒介即存有[M].上海:復(fù)旦大學(xué)出版社,2020:124-312.
[4]喻國(guó)明,蘇健威.生成式人工智能浪潮下的傳播革命與媒介生態(tài):從Chat GPT到全面智能化時(shí)代的未來[J].新疆師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2023,44(5):81-90.
[5]胡正榮,李涵舒.“數(shù)字在場(chǎng)”:社交媒體時(shí)代視覺圖像的傳播范式重構(gòu)[J].傳媒觀察,2024(2):64-71.
[6]Danaher J.Automation and utopia:human flourishing in a world without work[M].Harvard University Press,2019.
[7]Danaher J,Nyholm S.Automation,work and the achievement gap[J].AI Ethics,2021(01):227–237.
[8]比爾·科瓦奇,湯姆·羅森斯蒂爾.新聞的十大基本原則[M].北京:北京大學(xué)出版社,2011:95.
[9]WHOSTP.Blueprint for an AI Bill of Rights |OSTP| The White House-white house.gov[EB/OL].[2023-05-09].https://www.white house.gov/ostp/ai-bill-of-rights/.
[10]顏世健,喻國(guó)明.智能方法作為“第五范式”:人工智能時(shí)代科研范式的“新物種”[J].學(xué)術(shù)探索,2024(1):34-43.
[11]Lyotard J-F.The Postmodern Condition:A Report on Knowledge[M].Manchester:Manchester University Press.1984:4.
[12]齊格蒙特·鮑曼.現(xiàn)代性與矛盾性[M].北京:商務(wù)印書館, 2003:71.
作者簡(jiǎn)介:陳文泰,河南大學(xué)新聞與傳播學(xué)院副教授,廣告系主任,中部傳媒與社會(huì)發(fā)展研究院研究員(開封 475001);孫仲伯,中國(guó)石化天津分公司黨委宣傳部新聞中心記者(天津 300270),中部傳媒與社會(huì)發(fā)展研究院助理研究員(開封 475001)。
編校:王志昭