• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      認(rèn)知的展褶:生成式人工智能的技術(shù)審思

      2024-09-06 00:00:00胡栩睿
      決策與信息 2024年9期

      [摘 要] 文生視頻大模型Sora超越了人工智能的文本表達(dá)結(jié)構(gòu),不斷強(qiáng)化圖像與視頻的價(jià)值意義,其話語(yǔ)建構(gòu)能力日益趨近人類(lèi)的創(chuàng)作水平。這種“超能力”背后隱喻著“技術(shù)”的本質(zhì)。生成式人工智能的技術(shù)機(jī)理主要通過(guò)資源堆疊、機(jī)器學(xué)習(xí)與序列預(yù)測(cè)來(lái)實(shí)現(xiàn),其中資源堆疊奠定了智能根基、機(jī)器學(xué)習(xí)促進(jìn)了知識(shí)萃取、序列預(yù)測(cè)形塑內(nèi)容體系。世界模擬想象和人機(jī)關(guān)系演進(jìn)共同構(gòu)筑了生成式人工智能的意義價(jià)值。然而,隨著生成式人工智能的普泛化滲透,其遮蔽的想象塌縮、資源消耗以及內(nèi)容速朽等困境日漸凸顯,亟須通過(guò)價(jià)值對(duì)齊、黑箱稀釋等實(shí)踐方式回應(yīng)人機(jī)協(xié)同進(jìn)化的時(shí)代命題。

      [關(guān)鍵詞] 大模型;生成式AI;機(jī)器學(xué)習(xí);Sora;人工智能;人機(jī)關(guān)系;AI技術(shù)-社會(huì)協(xié)同

      [中圖分類(lèi)號(hào)] G206 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1002-8129(2024)09-0087-10

      Sora的橫空出世將人們的目光再一次引向人工智能這一技術(shù)迭代如火如荼展開(kāi)的概念范疇之中。伴隨技術(shù)火熱的一方面是社會(huì)行業(yè)的廣泛關(guān)注,另一方面則是學(xué)界研究的展開(kāi)。在學(xué)界認(rèn)知深化與業(yè)界革命促動(dòng)的交相輝映之下,人們對(duì)于Sora、ChatGPT等現(xiàn)象級(jí)人工智能產(chǎn)品有了更為細(xì)致、清晰的具象認(rèn)知。然而,細(xì)究OpenAI最新的技術(shù)文檔可以發(fā)現(xiàn),Sora在模型架構(gòu)、訓(xùn)練方法上更多的是對(duì)現(xiàn)有技術(shù)路線的優(yōu)化,并未有顛覆式的技術(shù)革新,其應(yīng)用潛能仍是建立在規(guī)模法則(Scaling Law)的大模型(Large Model,LM)開(kāi)發(fā)上,因而其更象是技術(shù)路線量變積累的結(jié)果,而非斷裂式的質(zhì)變。

      德勒茲(Gilles Deleuze)在對(duì)巴洛克藝術(shù)風(fēng)格的論述中以“褶子”(fold)的概念強(qiáng)調(diào)了一種多元、復(fù)雜的思考方式[1] 16-21,旨在幫助我們更好地理解和把握世界的復(fù)雜性與多樣性。因此對(duì)于生成式人工智能的考察視角顯然不能拘囿于單一的產(chǎn)品特性,而是需要深入透視其技術(shù)機(jī)理,以此勾勒關(guān)于生成式人工智能社會(huì)認(rèn)知與實(shí)踐應(yīng)用整體譜系,并進(jìn)一步為人工智能時(shí)代個(gè)體融入社會(huì)以及AI技術(shù)潛能的充分釋放構(gòu)建良好的理論與實(shí)踐框架。有鑒于此,本文嘗試從Sora這一生成式人工智能最新產(chǎn)品出發(fā),結(jié)合業(yè)已滲透至生活日常情景的ChatGPT等AI應(yīng)用,通過(guò)拆解、歸納生成式人工智能核心機(jī)理的方式觸摸伏脈其中的技術(shù)意蘊(yùn),并在梳理技術(shù)公司等話語(yǔ)主體關(guān)于生成式人工智能實(shí)踐應(yīng)用的多元價(jià)值鋪陳以及駁雜社會(huì)想象的同時(shí)對(duì)其實(shí)踐現(xiàn)狀進(jìn)行追問(wèn),進(jìn)而探求人機(jī)協(xié)同進(jìn)化的未來(lái)進(jìn)路,最終勾勒出關(guān)于生成式人工智能應(yīng)用與想象的更為全面的技術(shù)圖景。

      一、技術(shù)拆解:生成式人工智能的機(jī)理透視

      作為一種能夠自主創(chuàng)造新內(nèi)容的AI技術(shù),生成式人工智能的核心在于理解和模仿現(xiàn)有數(shù)據(jù)模型,進(jìn)而在用戶提示詞(prompt)的引導(dǎo)下輸出基于既有內(nèi)容形態(tài)的全新內(nèi)容。拆解其技術(shù)機(jī)理后可發(fā)現(xiàn),對(duì)這一生成能力的認(rèn)識(shí)實(shí)則可劃分為三個(gè)更為具體的維度:資源堆疊下的智能涌現(xiàn)、機(jī)器學(xué)習(xí)中的知識(shí)萃取以及序列預(yù)測(cè)下的內(nèi)容編織。

      (一)資源堆疊積淀智能涌現(xiàn)根基

      2020年,OpenAI首次提出了基于規(guī)模法則的模型訓(xùn)練方法,即模型性能會(huì)在大算力、大參數(shù)、大數(shù)據(jù)的加持下持續(xù)提升,這一法則適用于包括語(yǔ)言模型在內(nèi)的多模態(tài)模型[2]。這一法則精準(zhǔn)地詮釋了生成式人工智能的重要技術(shù)機(jī)理,即基于算力與數(shù)據(jù)等資源堆疊所形成的智能涌現(xiàn)。涌現(xiàn)(emergence)作為描述復(fù)雜系統(tǒng)中由系統(tǒng)數(shù)量變化所導(dǎo)致行為質(zhì)量變化的重要概念,已成為大語(yǔ)言模型所特有的一種能力[3]。具體而言,資源堆疊可歸納為兩個(gè)層面:一是涵蓋文本、圖像等多模態(tài)信息的數(shù)據(jù)資源,二是以GPU(Graphics Processing Unit)、TPU(Tensor Processing Unit)等硬件設(shè)施所組成的算力資源。

      數(shù)據(jù)是生成式人工智能學(xué)習(xí)和創(chuàng)造的基礎(chǔ)資源。一方面,生成式人工智能需要大量數(shù)據(jù)來(lái)學(xué)習(xí)人類(lèi)潛在的知識(shí)結(jié)構(gòu)與模式,文本、圖像等多模態(tài)內(nèi)容能夠幫助模型捕捉到對(duì)應(yīng)領(lǐng)域的復(fù)雜特征和統(tǒng)計(jì)規(guī)律,從而在用戶新輸入新數(shù)據(jù)的提示下生成合理、連貫的內(nèi)容。另一方面,數(shù)據(jù)還可用于人工智能的持續(xù)學(xué)習(xí)與迭代優(yōu)化,用戶的反饋、新數(shù)據(jù)的加入能夠在人類(lèi)反饋強(qiáng)化學(xué)習(xí)(RLHF)、指示學(xué)習(xí)(Instruct Learning)等學(xué)習(xí)技術(shù)的加持下不斷調(diào)整和優(yōu)化模型,促進(jìn)其智能進(jìn)一步涌現(xiàn)。正是龐大的數(shù)據(jù)學(xué)習(xí)催生了ChatGPT等一系列備受矚目的生成式人工智能產(chǎn)品。公開(kāi)數(shù)據(jù)顯示,GPT-3的參數(shù)量達(dá)1750億,預(yù)訓(xùn)練數(shù)據(jù)量為45T;GPT-4的參數(shù)量則高達(dá)1.8萬(wàn)億。而在其他同期產(chǎn)品中,Meta開(kāi)源模型Llama3訓(xùn)練數(shù)據(jù)量超過(guò)14萬(wàn)億個(gè)token,Claude3的訓(xùn)練數(shù)據(jù)量也在萬(wàn)億級(jí)別或更高。由是觀之,龐大的數(shù)據(jù)資源已成為大模型發(fā)展的重要依托。

      如果說(shuō)數(shù)據(jù)是大語(yǔ)言模型智能涌現(xiàn)的燃料,那么算力則可被視為生成式人工智能發(fā)展的重要助推器。強(qiáng)大的算力不僅能顯著縮短模型的訓(xùn)練時(shí)間,促進(jìn)模型快速迭代;還能提升生成式人工智能在應(yīng)用場(chǎng)景中的響應(yīng)效率,拓展大模型的應(yīng)用邊界。自互聯(lián)網(wǎng)誕生以來(lái),人類(lèi)便已生產(chǎn)出數(shù)以萬(wàn)億計(jì)的數(shù)據(jù),但人工智能的發(fā)展并未同龐大的數(shù)據(jù)生成同步展開(kāi),其發(fā)展的掣肘主要源自彼時(shí)的算力尚不足以支撐龐大的數(shù)據(jù)處理工程。隨著辛頓(Geoffrey Hinton)等人在神經(jīng)網(wǎng)絡(luò)訓(xùn)練中發(fā)掘出GPU在深度學(xué)習(xí)中的潛力[4] 84-90,即借助GPU的帶寬優(yōu)勢(shì)實(shí)現(xiàn)大規(guī)模數(shù)據(jù)的并行處理。GPU的強(qiáng)大算力使得深度學(xué)習(xí)中的算力瓶頸得以突破,人工智能的發(fā)展也在此過(guò)程中迎來(lái)了指數(shù)級(jí)增長(zhǎng)。

      (二)機(jī)器學(xué)習(xí)加速知識(shí)萃取進(jìn)程

      人工智能若僅止步于吸收與儲(chǔ)存人類(lèi)的文本、圖像及視頻等多模態(tài)信息,將可能退化為一個(gè)功能增強(qiáng)版的搜索引擎,而非真正意義上的智能體。其中所涉及的數(shù)據(jù)存儲(chǔ)等必要條件不僅會(huì)造成更為極端的資源消耗,還會(huì)因數(shù)據(jù)的過(guò)度擬合而失去泛化能力。泛化能力是機(jī)器學(xué)習(xí)的關(guān)鍵,它能確保機(jī)器理解所學(xué)數(shù)據(jù)并將其推廣到一般情況。具備良好泛化能力的模型能夠依據(jù)訓(xùn)練數(shù)據(jù)中所學(xué)習(xí)到的知識(shí),就用戶輸入的數(shù)據(jù)或提示給出更為準(zhǔn)確合理的輸出結(jié)果,從而提升人工智能的通用能力,因此可視為通往AGI(通用人工智能)的關(guān)鍵。而在提升人工智能泛化能力的過(guò)程中,壓縮(compression)已成為包括大模型在內(nèi)的生成模型的固有優(yōu)化目標(biāo)。在香農(nóng)(Claude Elwood Shannon)看來(lái)任何信息的編碼均可被量化,通過(guò)基于信息出現(xiàn)頻率差異的異質(zhì)編碼便能夠?qū)崿F(xiàn)信息的壓縮[5]。信息壓縮的過(guò)程在于通過(guò)減少數(shù)據(jù)冗余,并利用數(shù)據(jù)的統(tǒng)計(jì)特性在減少表達(dá)所需比特?cái)?shù)的同時(shí)盡可能保持信息的完整性和可恢復(fù)性。數(shù)據(jù)壓縮通常包含兩個(gè)階段:首先是將原始數(shù)據(jù)轉(zhuǎn)換為更加規(guī)則或統(tǒng)計(jì)特性更為明顯的形態(tài),然后再借助熵編碼、行程長(zhǎng)度編碼等編碼技術(shù)有效利用數(shù)據(jù)中的統(tǒng)計(jì)規(guī)律,進(jìn)而實(shí)現(xiàn)數(shù)據(jù)的高效存儲(chǔ)與傳輸。除此之外,對(duì)于一組數(shù)據(jù)的最佳解釋是對(duì)該數(shù)據(jù)進(jìn)行盡可能短而準(zhǔn)確的描述,模型的泛化性和推理能力的優(yōu)越性與描述長(zhǎng)度存在顯著相關(guān)性。因此為進(jìn)一步提升模型性能,數(shù)據(jù)在壓縮時(shí)應(yīng)遵循最小描述長(zhǎng)度(Minimum Description Length,MDL)原則,即在壓縮數(shù)據(jù)的同時(shí)保持足夠的信息量以準(zhǔn)確預(yù)測(cè)和理解數(shù)據(jù)。OpenAI團(tuán)隊(duì)負(fù)責(zé)人Jack Rae曾在一場(chǎng)學(xué)術(shù)分享會(huì)上坦言大模型的本質(zhì)實(shí)際上是一個(gè)性能強(qiáng)大的數(shù)據(jù)無(wú)損壓縮器。可見(jiàn),壓縮的過(guò)程實(shí)則建立在對(duì)于數(shù)據(jù)規(guī)則、統(tǒng)計(jì)特性等規(guī)律的尋找之上,其中便已經(jīng)具備了智能的大致輪廓。

      弗魯塞爾(Vilém Flusser)曾在就人類(lèi)存在過(guò)程的“文化史現(xiàn)象學(xué)”考察的過(guò)程中指出,由現(xiàn)代人所創(chuàng)造的零維度量子世界使一切呈現(xiàn)的可能性都轉(zhuǎn)變?yōu)橐粓?chǎng)組合游戲[6] 14-15。這一判斷與當(dāng)前人工智能知識(shí)生產(chǎn)邏輯不謀而合。在語(yǔ)言模型中,處理和生成文本的基本單元是“token”,它是一種編譯后具有意義的可作處理單元的字符串實(shí)例;而在以Sora為代表的文生視頻大模型中,通過(guò)在算法上融合diffusion和transformer兩種架構(gòu),這一基本單元?jiǎng)t是視覺(jué)切片(visual patches),這是一種經(jīng)特定視覺(jué)編碼器壓縮后的包含時(shí)空信息的低維數(shù)據(jù)格式,能夠承載生成視頻的關(guān)鍵時(shí)空特征與動(dòng)態(tài)變化信息。可以說(shuō),token實(shí)現(xiàn)了代碼、數(shù)字及各種自然語(yǔ)言的統(tǒng)一,patch則整合了圖像與視頻等多模態(tài)信息。通過(guò)將復(fù)雜的信息整合至基于“0”“1”的數(shù)字編碼中,不僅能夠在減少存儲(chǔ)需求的同時(shí)加速計(jì)算進(jìn)程,還能顯著提高模型的可移植性和可部署性,從而使人工智能發(fā)展不斷向通用人工智能這一終極目標(biāo)邁進(jìn)。

      (三)序列預(yù)測(cè)助力內(nèi)容編織

      法國(guó)數(shù)學(xué)家博瑞爾(Emile Borel)曾在《統(tǒng)計(jì)力學(xué)與不可逆性》中提出了“無(wú)限猴子定律”(infinite monkey theorem),指出一只猴子在打字機(jī)上隨意敲出一部《哈姆雷特》在概率上的可能;維利里奧(Paul Viritio)則在考察視覺(jué)機(jī)器的技術(shù)邏輯時(shí)注意到其內(nèi)含的統(tǒng)計(jì)學(xué)意蘊(yùn),認(rèn)為合成圖像事實(shí)上是一種通過(guò)對(duì)組成數(shù)碼再現(xiàn)像素的快速計(jì)算,并對(duì)緊隨其后的像素進(jìn)行分析解碼進(jìn)行生成的統(tǒng)計(jì)方法[7] 145。博瑞爾的思想實(shí)驗(yàn)和維利里奧的深刻洞察共同揭示了生成式人工智能的基本運(yùn)作邏輯,即二者均試圖表明連貫、自然的內(nèi)容生成在一定程度上可視為一場(chǎng)概率游戲,通過(guò)基于既有信息的預(yù)測(cè)方法能夠得到有效、期望的反饋結(jié)果。這種對(duì)現(xiàn)有及緊隨其后像素進(jìn)行計(jì)算的技術(shù)洞察顯然已經(jīng)觸及當(dāng)前人工智能內(nèi)容生成的根本邏輯,即一種基于既定內(nèi)容的概率鏈預(yù)測(cè)。這一觀念在當(dāng)前基于大模型的生成式人工智能中得以貫徹,并形成了基于NTP(next token prediction)的技術(shù)框架。NTP策略強(qiáng)調(diào)通過(guò)深入挖掘既有的文本和上下文信息,精確預(yù)測(cè)序列中每個(gè)位置的后續(xù)詞匯,此乃構(gòu)建高效語(yǔ)言生成與理解系統(tǒng)之關(guān)鍵。NTP遠(yuǎn)非單純的統(tǒng)計(jì)技巧,它是對(duì)機(jī)器理解語(yǔ)言深層含義及知識(shí)圖譜能力的度量,體現(xiàn)了從紛繁數(shù)據(jù)中提煉意義、壓縮并表達(dá)世界本質(zhì)的能力。因此,NTP不僅構(gòu)成了高級(jí)語(yǔ)言處理技術(shù)的應(yīng)用基礎(chǔ),也反映了人工智能在逼近人類(lèi)語(yǔ)言智能方面取得的實(shí)質(zhì)性進(jìn)展。OpenAI首席科學(xué)家在接受采訪時(shí)也不斷暗示NTP在GPT系列大模型成功中的關(guān)鍵作用。

      需要強(qiáng)調(diào)的是,基于概率的序列預(yù)測(cè)使人工智能的內(nèi)容生成存在一定的不確定性。一方面,這種不確定性是由個(gè)體與機(jī)器間的知識(shí)差異所催生的。實(shí)際上人們?cè)谳斎胂嚓P(guān)提示詞時(shí)會(huì)預(yù)設(shè)一定的輸出結(jié)果,這種預(yù)設(shè)結(jié)果是個(gè)體基于自我經(jīng)驗(yàn)及知識(shí)儲(chǔ)備所生成的內(nèi)容,但個(gè)體經(jīng)驗(yàn)顯然無(wú)法超越已進(jìn)行海量數(shù)據(jù)學(xué)習(xí)的AI的內(nèi)容儲(chǔ)備,個(gè)體建構(gòu)與機(jī)器生成之間的資源差異使內(nèi)容生成的不確定得以凸顯。另一方面,經(jīng)過(guò)海量數(shù)據(jù)學(xué)習(xí)的大模型能夠在更大的范疇內(nèi)遍歷可能的結(jié)果,因此可能會(huì)生成多個(gè)符合概率分布的內(nèi)容預(yù)測(cè)。喬姆斯基(Chomsky)在一次采訪中直言ChatGPT只是一種通過(guò)訪問(wèn)海量數(shù)據(jù)生成不規(guī)則字符串,并以組合的方式使其看起來(lái)像人類(lèi)作品的高級(jí)剽竊工具[8]。喬氏的斷言雖略顯激進(jìn),但在一定程度上觸及到生成式人工智能基于概率預(yù)測(cè)組合的技術(shù)實(shí)質(zhì),而這也是其在相同提示詞下輸出差異化內(nèi)容的重要原因。人工智能在內(nèi)容生成上的不確定看似影響了其在應(yīng)用過(guò)程中的可信任度,但也正是不確定性的存在為智能的涌現(xiàn)奠定了必要的生成條件。法國(guó)技術(shù)哲學(xué)家西蒙東(Gilbert Simondon)便指出機(jī)器真正的完美性或者說(shuō)技術(shù)性程度的提高是由一種不確定性范圍來(lái)界定的,這種不確定性范圍能夠賦予機(jī)器對(duì)外來(lái)信息的敏感性[9] 3。換言之,機(jī)器的成熟并不單純依賴于其遵循預(yù)設(shè)指令的精確度,而在于其是否能在不確定的環(huán)境下展現(xiàn)出靈活的學(xué)習(xí)能力,這關(guān)乎復(fù)雜多變的現(xiàn)實(shí)世界中機(jī)器與人互動(dòng)的動(dòng)態(tài)性與適應(yīng)性。由此看來(lái),序列預(yù)測(cè)驅(qū)動(dòng)的內(nèi)容生成不僅僅是一場(chǎng)邏輯嚴(yán)密的概率游戲,更是人工智能通往更高維度智能的一座橋梁。它不僅要求AI在統(tǒng)計(jì)學(xué)與邏輯推理上達(dá)到新的高度,還促使其在不確定性環(huán)境中穩(wěn)定發(fā)揮創(chuàng)造潛力與技術(shù)適應(yīng)力,從而為AGI的實(shí)現(xiàn)奠定堅(jiān)實(shí)的技術(shù)基底。

      二、意義展褶:生成式人工智能的應(yīng)用想象

      對(duì)于生成式人工智能這一現(xiàn)象級(jí)技術(shù)物,技術(shù)公司往往會(huì)通過(guò)技術(shù)腳本操演的方式為大眾摹畫(huà)一幅人機(jī)和諧共生的應(yīng)用藍(lán)圖。但作為一款持續(xù)迭代進(jìn)化的產(chǎn)品,其技術(shù)發(fā)展中還蘊(yùn)含著駁雜的社會(huì)想象以及多元的價(jià)值鋪陳,因此需要在展開(kāi)技術(shù)褶皺的過(guò)程中窺視生成式人工智能的復(fù)雜機(jī)理,以此形成更為全面多元的整體觀照。

      (一)世界模擬想象

      OpenAI在技術(shù)報(bào)告中將Sora定義為一款世界模擬器(World Simulator),并旨在將其作為“構(gòu)筑物理世界通用模擬器的一條可行路徑”[10]。在其發(fā)布的視頻樣片中,不論是雪地中嬉戲的小狗,還是東京街頭漫步的女子,抑或是屋內(nèi)花朵綻放的定格動(dòng)畫(huà),其真實(shí)的景別呈現(xiàn)以及人物形象刻畫(huà)無(wú)不讓人感嘆其強(qiáng)大的現(xiàn)實(shí)場(chǎng)景還原能力。從這一維度而言,Sora似乎已經(jīng)初步掌握模擬物理世界的能力,其在內(nèi)容生成上愈發(fā)精細(xì)的編輯可能性以及更為突出的連續(xù)圖像處理能力使人們對(duì)生成式人工智能的內(nèi)容創(chuàng)作前景抱以樂(lè)觀的態(tài)度,并向外投射出社會(huì)對(duì)于世界模型(World Model)的再度思考。

      從曾經(jīng)元宇宙的平行世界到如今Sora的世界模擬(World Simulation),人類(lèi)似乎執(zhí)著于探索構(gòu)建與現(xiàn)實(shí)同在的虛擬世界。這一追求映射出人類(lèi)對(duì)創(chuàng)造、控制與理解世界本質(zhì)的深切渴望。元宇宙概念曾激發(fā)了人們對(duì)一個(gè)沉浸式、交互式虛擬環(huán)境的無(wú)限遐想,它被設(shè)想為一個(gè)超越地理界限、融合現(xiàn)實(shí)與數(shù)字體驗(yàn)的嶄新空間。而在人工智能的技術(shù)版圖中,世界模擬或世界模型實(shí)際上是一種高級(jí)的理論框架與實(shí)踐方法,旨在通過(guò)構(gòu)建復(fù)雜的、動(dòng)態(tài)的計(jì)算模型來(lái)模仿和預(yù)測(cè)真實(shí)世界的結(jié)構(gòu)、行為及其內(nèi)在規(guī)律。戴維(David Ha)等人曾在人類(lèi)認(rèn)知系統(tǒng)的啟發(fā)下將智能體世界模型劃分為三個(gè)緊密相連、協(xié)同工作的組件,分別為視覺(jué)(Vision)、記憶(Memory)和控制器(Controller)[11],其工作流程是通過(guò)控制器將視覺(jué)感知模塊觀察到的高維內(nèi)容壓縮為一個(gè)小型表征性代碼,并通過(guò)內(nèi)置的記憶模塊根據(jù)歷史信息對(duì)未來(lái)狀態(tài)做出預(yù)測(cè)。而在實(shí)際應(yīng)用過(guò)程中,世界模型旨在建立一個(gè)可反復(fù)試錯(cuò)的環(huán)境以推動(dòng)制定現(xiàn)實(shí)最優(yōu)決策,其核心作用便是通過(guò)反事實(shí)推理(Counterfactual reasoning)模擬生成數(shù)據(jù)中并未存在的決策??梢?jiàn),由人工智能所驅(qū)動(dòng)的世界模擬更像是優(yōu)化、調(diào)節(jié)現(xiàn)實(shí)世界的模擬器,試圖在虛擬環(huán)境中復(fù)現(xiàn)人類(lèi)社會(huì)的動(dòng)態(tài)互動(dòng)與經(jīng)濟(jì)活動(dòng),這不僅是一種促進(jìn)人類(lèi)復(fù)歸自然的技術(shù)嘗試,也能在反復(fù)的調(diào)試中觸摸物理世界真實(shí)的內(nèi)在本質(zhì)。然而,弗魯塞爾在對(duì)由計(jì)算(Komputationen)重構(gòu)的經(jīng)濟(jì)情景與“現(xiàn)實(shí)中的經(jīng)濟(jì)狀況”間的切實(shí)程度進(jìn)行追問(wèn)的過(guò)程中指出,其間彌漫的不真實(shí)會(huì)讓人產(chǎn)生不寒而栗的顫栗感(Gruseln)[6] 5,而在世界模擬所營(yíng)造的虛擬空間之中,這一問(wèn)題同樣值得深思。

      除此之外,作為一個(gè)承載宏大科技愿景的技術(shù)概念,“世界模擬器”在一定程度上仍屬于科技公司精心編織的“技術(shù)腳本”,旨在通過(guò)這樣的方式引導(dǎo)社會(huì)的技術(shù)想象,并借此爭(zhēng)奪人工智能發(fā)展所需的技術(shù)資源。OpenAI正是憑借對(duì)話模型ChatGPT、文生視頻大模型Sora等生成式人工智能的先發(fā)優(yōu)勢(shì)而獲得極大的關(guān)注與資源傾斜,以至于其后的Gemini、Claude等大模型即使在性能上與其相差無(wú)幾,卻都只能被視為暗淡的“追隨者”。由此可見(jiàn),單一企業(yè)主導(dǎo)的技術(shù)敘事框架會(huì)在一定程度上遮蔽技術(shù)發(fā)展的多樣可能,因而需多視角地整合信息,以更加全面的認(rèn)知視野去洞穿那些特定利益導(dǎo)向所營(yíng)造的信息壁障。

      (二)人機(jī)關(guān)系演進(jìn)

      生成式人工智能技術(shù)的涌現(xiàn),正深度重塑著人類(lèi)社會(huì)的勞動(dòng)關(guān)系架構(gòu)與人機(jī)交互的內(nèi)涵。以ChatGPT、百度文心一言為代表的對(duì)話式人工智能,憑借其精湛的自然語(yǔ)言處理能力,已作為智能行動(dòng)者積極參與到人類(lèi)社會(huì)的溝通網(wǎng)絡(luò)之中,并在一定程度上重塑著知識(shí)獲取與生產(chǎn)的傳統(tǒng)范式。生成式人工智能通過(guò)模擬復(fù)雜的人類(lèi)語(yǔ)言表達(dá)與創(chuàng)新思維過(guò)程,極大提升了交互體驗(yàn)的自然流暢度與感知的真實(shí)性,從而在操作層面溝通了橫亙于人機(jī)間的交往隔閡,模糊了傳統(tǒng)二元對(duì)立的人機(jī)界線。此番轉(zhuǎn)型不僅革新了個(gè)體內(nèi)在與技術(shù)外在互動(dòng)的模式,還激起了對(duì)信任機(jī)制重構(gòu)、社會(huì)結(jié)構(gòu)動(dòng)態(tài)調(diào)整的深度哲學(xué)與社會(huì)學(xué)層面的反思。

      首先,從信任與依賴的理論維度看,生成式人工智能在信息處理的高精度、個(gè)性化服務(wù)定制及創(chuàng)意內(nèi)容自動(dòng)生成上的高效表現(xiàn),有效增強(qiáng)了用戶的信任基礎(chǔ)與長(zhǎng)期使用意愿,同時(shí),這也引發(fā)了圍繞技術(shù)自主權(quán)限、隱私權(quán)益保護(hù)以及人機(jī)協(xié)作責(zé)任歸屬的倫理與法理學(xué)爭(zhēng)議。這一系列復(fù)雜議題迫使我們重新評(píng)價(jià)科技進(jìn)步與個(gè)體自由、隱私權(quán)維護(hù)之間固有的緊張關(guān)系,并探索設(shè)計(jì)符合信息時(shí)代需求的法律框架與倫理規(guī)范體系,以協(xié)調(diào)技術(shù)發(fā)展與個(gè)體權(quán)利的和諧共存。

      其次,生成式AI對(duì)于勞動(dòng)市場(chǎng)結(jié)構(gòu)與職業(yè)生態(tài)存在潛在的顛覆性影響。自ChatGPT面世以來(lái),社會(huì)中對(duì)于文案創(chuàng)作、語(yǔ)言翻譯等職業(yè)領(lǐng)域的自動(dòng)化替代焦慮已初露端倪;而在Sora這類(lèi)文生視頻大問(wèn)世后,更是進(jìn)一步引發(fā)了影視制作、廣告創(chuàng)意等具備較高從業(yè)門(mén)檻的行業(yè)對(duì)自身未來(lái)角色定位的思考。隨著生成式人工智能技術(shù)應(yīng)用的廣泛鋪開(kāi),人機(jī)深度融合將成為未來(lái)勞動(dòng)形態(tài)的新常態(tài),這對(duì)社會(huì)個(gè)體迅速適應(yīng)技能更新提出了更高要求,同時(shí),在宏觀層面上,如何應(yīng)對(duì)AI對(duì)教育體系的重塑、職業(yè)發(fā)展路徑的重新規(guī)劃以及確保社會(huì)公平正義,成為亟待解決的重大課題。為緩解技術(shù)革新可能引起的就業(yè)結(jié)構(gòu)失衡,教育體系的前瞻性改革、終身學(xué)習(xí)理念的普及以及政策制定者的主動(dòng)介入或?qū)⒊蔀榫S護(hù)社會(huì)穩(wěn)定與進(jìn)步的關(guān)鍵環(huán)節(jié)。

      三、實(shí)踐追問(wèn):生成式人工智能涌現(xiàn)的困境遮蔽

      生成式人工智能技術(shù)的迅猛發(fā)展與快速迭代催生了涵蓋自然語(yǔ)言處理、藝術(shù)創(chuàng)作在內(nèi)的一系列創(chuàng)新應(yīng)用,其影響力已廣泛滲透至社會(huì)生活的各個(gè)角落。然而,在這股技術(shù)浪潮之下,為其所遮蔽的困境與挑戰(zhàn)亦亟待進(jìn)行深入而細(xì)致的反思與探討。

      (一)塌縮的世界想象

      利奧塔(Jean-Fran?ois Lyotard)在考察最發(fā)達(dá)社會(huì)(the most highly developed societies)中的知識(shí)傳遞這一話題時(shí)指出,知識(shí)可經(jīng)由計(jì)算機(jī)語(yǔ)言轉(zhuǎn)譯,并通過(guò)數(shù)據(jù)庫(kù)替代圖書(shū)館等傳統(tǒng)存儲(chǔ)器實(shí)現(xiàn)與學(xué)生使用的智能終端的連接,這些數(shù)據(jù)庫(kù)將成為后現(xiàn)代人的“自然”[12] 177-178。換言之,在高度發(fā)達(dá)的現(xiàn)代社會(huì)中,經(jīng)由二進(jìn)制轉(zhuǎn)換的數(shù)字“世界”將逐步侵占人們對(duì)于現(xiàn)實(shí)物理世界的關(guān)注,人類(lèi)的認(rèn)識(shí)活動(dòng)也將建立在同數(shù)據(jù)庫(kù)的對(duì)話之上。ChatGPT、Sora、Suno等生成式人工智能的普泛應(yīng)用逐漸構(gòu)建起涵蓋圖文、音視頻的多模態(tài)內(nèi)容生成矩陣,基于提示詞“喚起”的內(nèi)容生產(chǎn)模式已然成為數(shù)智社會(huì)的重要表征,這似乎在一定程度上印證了利奧塔的深刻洞見(jiàn)。即便內(nèi)容的生成仍很大程度上依賴于人類(lèi)的文字提示與描述,但AI實(shí)則基于自身對(duì)于世界及內(nèi)容的理解“接管”了內(nèi)容生產(chǎn)的最終走向,從而成為內(nèi)容生產(chǎn)的代理人和真正實(shí)踐者。在這種技術(shù)主導(dǎo)文化偏好和內(nèi)容創(chuàng)作方式的現(xiàn)實(shí)境遇下,“想象力塌縮”便成為一種悲劇性的可能。

      首先,就Sora這類(lèi)凝聚多模態(tài)生產(chǎn)能力的人工智能而言,尚未了解其運(yùn)作機(jī)理的普通用戶可以將其視為一個(gè)文字轉(zhuǎn)視頻的視覺(jué)裝置。但這一內(nèi)容模態(tài)的轉(zhuǎn)化過(guò)程并非簡(jiǎn)單的輸入與輸出,而是需要介入更為復(fù)雜的信息處理過(guò)程:人們首先需要將大腦中的視頻構(gòu)想抽象化為線性的、富有邏輯的文字,然后將其作為提示詞引導(dǎo)智能機(jī)器輸出對(duì)應(yīng)的內(nèi)容。然而,當(dāng)思想抽譯為文字,再經(jīng)過(guò)智能機(jī)器轉(zhuǎn)化為二進(jìn)制代碼,最后通過(guò)概率式的預(yù)測(cè)輸出具象的視頻內(nèi)容時(shí),原本自由流淌的想象力便逐漸淪為規(guī)范、嚴(yán)謹(jǐn)?shù)臄?shù)字比率,最后通過(guò)預(yù)測(cè)生成的文本或視頻無(wú)疑是對(duì)人類(lèi)想象力的一種侵吞與蠶食。

      除此之外,抽象的文字凝練本身是一種極具挑戰(zhàn)的認(rèn)知程式,并非所有人都具備將大腦中飄渺的想法凝結(jié)為文字的能力。因此在實(shí)際使用過(guò)程中輸出的內(nèi)容必然只能無(wú)限趨近于人們的顱內(nèi)想象,或者說(shuō)人們是在觀看生成的視頻后才逐漸將大腦中原本模糊的畫(huà)面進(jìn)一步明晰。由此便牽涉出文生視頻的二重想象折損:一方面,人們?cè)噲D通過(guò)高信息密度的文字轉(zhuǎn)譯大腦中尚未成型的畫(huà)面想象,但抽象文字實(shí)則無(wú)法將此類(lèi)想象完全統(tǒng)合歸納,由此便形成了想象力的第一重折損;而當(dāng)人們借助Sora這類(lèi)文生視頻模型將文字中介的大腦想象具象化為視頻后,受首因效應(yīng)、路徑依賴等心理機(jī)制的影響,AI生成的視頻會(huì)極大地影響人們后續(xù)的思考方式。也就是說(shuō)當(dāng)人們?cè)俅螁酒鹣嚓P(guān)的內(nèi)容想象時(shí),便會(huì)不自覺(jué)地代入最初由AI所生成的信息,進(jìn)而限制個(gè)體對(duì)于相關(guān)事物的想象。同時(shí),大模型訓(xùn)練過(guò)程中對(duì)于人類(lèi)已有數(shù)據(jù)的把握,也使AI生成內(nèi)容無(wú)法跳脫已有的認(rèn)知邊界,自然也無(wú)法精準(zhǔn)還原人類(lèi)天馬行空的無(wú)盡想象??梢?jiàn),如果Sora的應(yīng)用最終指向普通個(gè)體,那它必然會(huì)處于人類(lèi)想象力拉扯的舞臺(tái)中心,一邊是認(rèn)知經(jīng)驗(yàn)固化所帶來(lái)的想象塌縮,另一方則是浸潤(rùn)技術(shù)環(huán)境中人們對(duì)于AI還原想象的技術(shù)依賴,人類(lèi)獨(dú)有的、經(jīng)由沉浸式的思考所激活的創(chuàng)造力天賦也由此面臨被擱置的風(fēng)險(xiǎn)。

      (二)失語(yǔ)的資源消耗

      自ChatGPT觸發(fā)全球范圍內(nèi)的人工智能熱潮以來(lái),學(xué)界與業(yè)界的聚焦點(diǎn)多集中于該技術(shù)的應(yīng)用潛能、風(fēng)險(xiǎn)評(píng)估及相應(yīng)規(guī)制框架的構(gòu)建方面,卻相對(duì)忽視了其作為商業(yè)化產(chǎn)品的基本屬性。此現(xiàn)象揭示了一個(gè)值得深究的維度:人工智能,尤其是生成式人工智能,作為一種重度依賴數(shù)據(jù)與算力資源的創(chuàng)新產(chǎn)品,其資源消耗問(wèn)題是一個(gè)不容回避的議題。

      控制論先驅(qū)諾伯特·維納(Norbert Wiener)曾強(qiáng)調(diào)信息的傳遞是建立在能量消耗的基礎(chǔ)之上[13] 39。在生成式AI的實(shí)踐圖景中,這種消耗體現(xiàn)在兩個(gè)關(guān)鍵環(huán)節(jié):一是模型訓(xùn)練階段對(duì)既有數(shù)據(jù)集的深度學(xué)習(xí)與模式提煉;二是用戶交互時(shí)的即時(shí)反饋與個(gè)性化信息處理。前者重度依賴于GPU、NPU等核心運(yùn)算硬件,后者則在硬件依賴的基礎(chǔ)上強(qiáng)調(diào)云服務(wù)的接入,這種雙重信息傳遞機(jī)制無(wú)疑需要龐大的能源作為基礎(chǔ)設(shè)施支撐。相關(guān)產(chǎn)業(yè)報(bào)告顯示,前沿模型的訓(xùn)練成本已經(jīng)達(dá)到前所未有的水平。GPT-4預(yù)估使用了7800萬(wàn)美元的計(jì)算資源進(jìn)行訓(xùn)練,谷歌的Gemini Ultra計(jì)算成本更是高達(dá)1.91億美元[14]。相比之下,此前發(fā)布的Transformer模型(2017年)與RoBERTa Large(2019年)的訓(xùn)練成本則分別約為900美元與16萬(wàn)美元。雖然當(dāng)前生成式AI的供應(yīng)廠商已經(jīng)通過(guò)會(huì)員服務(wù)等方式實(shí)現(xiàn)部分盈利,但面對(duì)巨量的資源消耗,此類(lèi)收益顯然是杯水車(chē)薪。隨著技術(shù)向日常生活領(lǐng)域的加速滲透,遵循資本增值邏輯的企業(yè)勢(shì)必通過(guò)提高服務(wù)費(fèi)用等方式實(shí)現(xiàn)成本分?jǐn)?,進(jìn)而無(wú)形中構(gòu)筑起不同社會(huì)階層間技術(shù)可及性的新壁壘。

      此外,海量資源的投入直接映射于模型性能的顯著差異。OpenAI即憑借其在數(shù)據(jù)與算力上的大規(guī)模投資,不斷引領(lǐng)著人工智能領(lǐng)域發(fā)展方向,其ChatGPT模型在英語(yǔ)自然語(yǔ)言處理上的卓越表現(xiàn)便是明證。而中文領(lǐng)域尚存的發(fā)展空間,也為本土生成式人工智能的發(fā)展提供了追趕的契機(jī)。由此可見(jiàn),大型模型效能的提升高度依賴于海量數(shù)據(jù)的學(xué)習(xí),這一過(guò)程不僅需要海量文本、音視頻等多模態(tài)資源,更伴隨著巨額資本的注入。這使得人工智能的發(fā)展路徑不可避免地遭受資本主義經(jīng)濟(jì)邏輯的影響。OpenAI最初高調(diào)宣稱將借助通用人工智能造福全人類(lèi),但在資源消耗日益加劇的背景下,開(kāi)源的選擇不得不陷入兩難境地:一方面是個(gè)體企業(yè)成本回收的難題,另一方面則是閉源可能導(dǎo)致的社會(huì)資源重復(fù)配置與浪費(fèi)。在現(xiàn)行資本主義框架內(nèi),如何平衡這兩方面矛盾,短期內(nèi)似乎難以覓得理想解決方案。

      (三)速朽的內(nèi)容生成

      以ChatGPT與Sora為標(biāo)志的生成式人工智能大模型,其運(yùn)作核心在于持續(xù)的數(shù)據(jù)滋養(yǎng),旨在確保生成內(nèi)容與提示指令的高度契合。這意味著為滿足個(gè)體在人類(lèi)社會(huì)日益豐富多元的經(jīng)驗(yàn)背景與知識(shí)迭代中的需求變化,生成式人工智能的學(xué)習(xí)必須不斷獲取新興的數(shù)據(jù)資料。這一顯著的數(shù)據(jù)依賴性將Sora等AI的內(nèi)容創(chuàng)造置于矛盾的境地:一方面,AI內(nèi)容生成的本質(zhì)是對(duì)人類(lèi)想象力的模擬與回應(yīng),而想象與現(xiàn)實(shí)的固有差距,要求生成過(guò)程高度敏感于用戶提示的微妙調(diào)整,由此生成的內(nèi)容便展現(xiàn)出一種瞬時(shí)性特征,即永恒地在反映人類(lèi)想象的鏡像中徘徊,卻難以觸及持久的創(chuàng)造性深度。另一方面,伴隨用戶基數(shù)的增長(zhǎng),AI視頻在網(wǎng)絡(luò)空間的泛濫,以其超高的生成效率逐漸壓縮人類(lèi)原創(chuàng)內(nèi)容的生存空間,預(yù)示著人工視頻可能面臨邊緣化風(fēng)險(xiǎn)。更為關(guān)鍵的是,這些充斥網(wǎng)絡(luò)的AI產(chǎn)出物,最終將回饋至如OpenAI等技術(shù)公司的訓(xùn)練數(shù)據(jù)庫(kù),形成一種“數(shù)據(jù)反饋循環(huán)”,其中蘊(yùn)含的大量低質(zhì)或重復(fù)內(nèi)容如同“數(shù)據(jù)泔水”一般。依據(jù)“垃圾進(jìn),垃圾出”機(jī)器學(xué)習(xí)法則,不可避免地對(duì)AI的后續(xù)學(xué)習(xí)質(zhì)量構(gòu)成挑戰(zhàn),進(jìn)而同人類(lèi)所追求的高質(zhì)量智能發(fā)展的目標(biāo)背道而馳。

      此外,生成式AI對(duì)世界的理解,根植于算法邏輯與“0”“1”二進(jìn)制編碼構(gòu)建的數(shù)字化宇宙,是弗魯塞爾筆下點(diǎn)狀、零散分布的高度抽象產(chǎn)物。這意味著其所有的認(rèn)知活動(dòng)均通過(guò)編碼的中介進(jìn)行,與物理現(xiàn)實(shí)世界的直接接觸并非其本質(zhì)屬性。因此,AI所生成的內(nèi)容實(shí)質(zhì)上是對(duì)虛擬信息的解碼與再構(gòu)建,以及基于數(shù)字轉(zhuǎn)換的虛擬場(chǎng)景與敘事再造。盡管文本本身作為一種現(xiàn)實(shí)的抽象轉(zhuǎn)譯能夠幫助ChatGPT等對(duì)話式AI營(yíng)造出難以辨識(shí)真實(shí)與虛構(gòu)界限的交流體驗(yàn),但Sora等文生視頻技術(shù)的出現(xiàn)則更深層次地將現(xiàn)實(shí)世界抽象化、虛像化,數(shù)字比特重組拼接的內(nèi)容生成在一定程度上喪失了現(xiàn)實(shí)世界中經(jīng)驗(yàn)的直觀與真實(shí),僅留存數(shù)字化轉(zhuǎn)化的痕跡。同時(shí),這一過(guò)程亦凸顯出生成式AI在模擬現(xiàn)實(shí)與創(chuàng)造新知方面的局限性,以及其內(nèi)容生成背后版權(quán)所屬、責(zé)任界定等復(fù)雜的技術(shù)與社會(huì)倫理議題。

      四、人機(jī)協(xié)同:生成式人工智能的未來(lái)進(jìn)路

      海德格爾(Martin Heidegger)曾對(duì)技術(shù)中性的話語(yǔ)進(jìn)行批判,認(rèn)為這一論調(diào)使人類(lèi)對(duì)技術(shù)之本質(zhì)盲然無(wú)知[15] 3。美國(guó)技術(shù)哲學(xué)家蘭登·溫納(Langdon Winner)則將技術(shù)視為一種異質(zhì)性主體,指出其在發(fā)展過(guò)程中會(huì)逐漸進(jìn)化為一種自主、獨(dú)立的自主性力量[16] 13。人工智能內(nèi)在的價(jià)值負(fù)荷以及算法運(yùn)作中不可避免的黑箱也揭示其非價(jià)值無(wú)涉與中立的基本屬性,因而對(duì)生成式人工智能未來(lái)發(fā)展路徑的展望不應(yīng)單純聚焦于技術(shù)如何為人類(lèi)所用,而應(yīng)將其視為能動(dòng)的行動(dòng)者,進(jìn)而聚焦人與機(jī)器的協(xié)同進(jìn)化路徑。

      (一)價(jià)值對(duì)齊疏導(dǎo)人機(jī)潛在沖突

      能力日益增強(qiáng)、應(yīng)用場(chǎng)景不斷泛化的生成式人工智能已逐漸滲透至人類(lèi)社會(huì)生產(chǎn)的多個(gè)方面,但機(jī)器學(xué)習(xí)的不可控性、算法的黑箱特性等技術(shù)特質(zhì)使其在生成內(nèi)容上存在錯(cuò)誤信息(misinformation)、幻覺(jué)(hallucination)、不一致信息(inconsistency)等不準(zhǔn)確信息和偏見(jiàn)、隱私敏感內(nèi)容等不良信息以及諸如意識(shí)(Awareness)、欺騙(Deception)、權(quán)力尋求(Power-Seeking)等足以引發(fā)人機(jī)沖突的潛在隱患。這類(lèi)內(nèi)容的出現(xiàn)不僅限制了AI的應(yīng)用場(chǎng)景,更引發(fā)了社會(huì)對(duì)于人工智能潛在風(fēng)險(xiǎn)的憂慮,因而需要在人工智能發(fā)展的未來(lái)圖景中注入價(jià)值對(duì)齊的技術(shù)因子。

      諾伯特·維納(Norbert Wiener)曾在就人機(jī)關(guān)系的考察中指出,可通過(guò)確定機(jī)器中所輸入的目標(biāo)與行動(dòng)期望(desire)是否相符的方式在無(wú)法有效干預(yù)運(yùn)行的機(jī)器中達(dá)到特定目的(purpose)[17] 1355-1358。作為控制論之父,維納的深刻洞見(jiàn)在一定程度上奠定了人機(jī)價(jià)值對(duì)齊方法范式,即通過(guò)預(yù)先植入人類(lèi)標(biāo)準(zhǔn)的方式避免機(jī)器出現(xiàn)有悖于人類(lèi)期望的行動(dòng)偏向。在機(jī)器復(fù)雜程度日益提升的數(shù)智時(shí)代,價(jià)值對(duì)齊(Value Alignment)旨在使人工智能系統(tǒng)的行為與人類(lèi)的意圖和價(jià)值觀相一致,進(jìn)而確保其能夠捕捉到我們的規(guī)范和價(jià)值觀,理解我們的意圖并以我們想要的方式行事[18] 10,使其更好地融入人類(lèi)社會(huì)并促進(jìn)技術(shù)與社會(huì)的和諧共處[19] 415-418。實(shí)踐層面的價(jià)值對(duì)齊主要涵蓋前向?qū)R(Forward Alignment)與后向?qū)R(Backward Alignment)兩個(gè)維度。前者通過(guò)反饋學(xué)習(xí)、分布偏移學(xué)習(xí)等對(duì)齊訓(xùn)練實(shí)現(xiàn),后者則借由安全評(píng)估、生成測(cè)試用例(red teaming)等保險(xiǎn)(Assurance)方式以及政府法規(guī)、實(shí)驗(yàn)室自治等治理(Governance)方式實(shí)現(xiàn)對(duì)齊細(xì)化[20]。而通過(guò)技術(shù)設(shè)計(jì)實(shí)現(xiàn)人工物系統(tǒng)中“價(jià)值偏差”最小化的價(jià)值敏感性設(shè)計(jì)亦是價(jià)值對(duì)齊的可行路徑之一[21] 77-83。

      同時(shí),我們還應(yīng)注意到頭部AI產(chǎn)品對(duì)于價(jià)值對(duì)齊的“定義權(quán)”。漢娜·阿倫特(Hannah Arendt)曾在就“工具制造者”的反思中指出,技藝人所創(chuàng)造產(chǎn)品的“客觀”目的能夠決定器具的合用與精確程度[22] 111。這啟示我們?cè)谏婕叭藱C(jī)價(jià)值對(duì)齊的理性實(shí)踐中更應(yīng)關(guān)注作為人類(lèi)社會(huì)普遍遵循的“客觀”價(jià)值,不能因技術(shù)公司主導(dǎo)的AI產(chǎn)品的先進(jìn)程度而將這一重要的定義權(quán)讓渡,以此維系人類(lèi)社會(huì)中倫理、道德規(guī)范等價(jià)值的公共屬性,避免人機(jī)間的關(guān)系沖突。

      (二)黑箱稀釋構(gòu)筑人機(jī)信任紐帶

      信任是人機(jī)關(guān)系得以良性發(fā)展的重要依托,也是人工智能治理得以實(shí)施的前提和基礎(chǔ)。對(duì)于人工智能技術(shù)開(kāi)發(fā)、配置和使用的信賴不僅是技術(shù)的內(nèi)在屬性和要求,也是設(shè)計(jì)人工智能應(yīng)用技術(shù)-社會(huì)系統(tǒng)的屬性所指[23] 44-51。然而,作為生成式人工智能的底層技術(shù)之一,深度神經(jīng)網(wǎng)絡(luò)(DNNs)的“黑箱”本質(zhì)及其廣泛的參數(shù)化妨礙了自動(dòng)駕駛、醫(yī)療等關(guān)鍵應(yīng)用中所需的透明度的展示,從而引發(fā)了人們對(duì)于高風(fēng)險(xiǎn)環(huán)境下大模型可靠性的擔(dān)憂。即便能夠?qū)⒁?guī)模法則作為其智能快速迭代的理論參照,但其核心機(jī)理仍不為人們所知。因此在通往人機(jī)協(xié)同的通用人工智能道路上,對(duì)于人工智能技術(shù)黑箱的稀釋將成為其持續(xù)發(fā)展不可規(guī)避的技術(shù)使命與追求。

      在此背景下,可解釋人工智能(Explainable Artificial Intelligence,XAI)已然成為一條理想的技術(shù)路徑。其旨在為當(dāng)今強(qiáng)大但不透明的深度學(xué)習(xí)模型帶來(lái)透明度,局部解釋與全局解釋是當(dāng)前XAI研究中兩條主要的技術(shù)路線:前者以屬性圖(attribution map)的形式解釋單個(gè)預(yù)測(cè),后者則在可視化模型的過(guò)程中習(xí)得編碼概念[24] 1006-1019。除此之外,XAI包括三個(gè)核心范疇。一是深度模型的解釋,旨在同各闡明模型在每個(gè)實(shí)例基礎(chǔ)上的預(yù)測(cè)理由提升透明度和信任;二是聚焦訓(xùn)練數(shù)據(jù)的影響,通過(guò)準(zhǔn)確指出對(duì)模型輸出產(chǎn)生巨大影響的數(shù)據(jù)點(diǎn),促進(jìn)訓(xùn)練過(guò)程的改進(jìn)以及模型的簡(jiǎn)化;三是關(guān)注領(lǐng)域知識(shí)的洞察,進(jìn)而為其高風(fēng)險(xiǎn)領(lǐng)域中的應(yīng)用提供有益的指導(dǎo)[25]。目前,以O(shè)penAI為代表的頭部AI企業(yè)已投入到可解釋人工智能的研究進(jìn)程中。2024年6月,OpenAI在其新發(fā)布的技術(shù)論文中提出通過(guò)改進(jìn)稀疏自編碼器(Sparse Autoencoders,SAEs)提升GPT-4的可解釋性,這一方式通過(guò)識(shí)別神經(jīng)網(wǎng)絡(luò)中對(duì)輸出結(jié)果產(chǎn)生重要影響的“特征”來(lái)增進(jìn)模型的可解釋性,進(jìn)而提高模型整體的透明度和泛化能力。由是觀之,智能黑箱的破解不僅是人工智能發(fā)展的技術(shù)追求,也是借由信任紐帶提升人機(jī)協(xié)同進(jìn)化進(jìn)程的行動(dòng)所指。

      五、結(jié)語(yǔ)

      在關(guān)于后現(xiàn)代知識(shí)結(jié)構(gòu)及其性質(zhì)的考察中,利奧塔指出未來(lái)的教育將不再是內(nèi)容的撒播,而是傳授終端的使用,即“向哪里提出問(wèn)題?怎樣提出問(wèn)題才能避免錯(cuò)誤?”[13] 177-178。隨著生成式人工智能的迅速迭代以及于人類(lèi)日常生活的深入滲透,人類(lèi)似乎已經(jīng)步入利奧塔所預(yù)見(jiàn)的世界:人們懷揣特定的問(wèn)題向ChatGPT尋求答案;抑或是將自己的想象訴諸文字,然后經(jīng)由Sora等文生視頻模型予以具象呈現(xiàn)……生成式人工智能從多個(gè)維度為人類(lèi)的交往方式、知識(shí)生產(chǎn)注入新的可能,在此過(guò)程中人類(lèi)似乎也始終以主體性的姿態(tài)對(duì)智能體提出需求。但我們不應(yīng)就此忽視行動(dòng)網(wǎng)絡(luò)中智能體的能動(dòng)潛力以及技術(shù)生態(tài)的整體性,也不應(yīng)在技術(shù)迅猛迭代之時(shí)過(guò)分趨鶩于新興產(chǎn)品的嶄新特性,而是應(yīng)該嘗試用類(lèi)型學(xué)的方法觸碰伏脈其中的技術(shù)肌理,深入分析它們是如何嵌入社會(huì)系統(tǒng),如何影響人類(lèi)的認(rèn)知習(xí)慣、社會(huì)關(guān)系以及文化生產(chǎn),進(jìn)而為技術(shù)發(fā)展注入更為全面、深遠(yuǎn)的人文考量。

      對(duì)于生成式人工智能所觸發(fā)的生態(tài)變革可能性,目前雖未有定論,但其作為技術(shù)發(fā)展史中的關(guān)鍵節(jié)點(diǎn)儼然已成共識(shí)。在此背景下,研究者與決策者需超越對(duì)新興技術(shù)表層特性的追逐,轉(zhuǎn)而聚焦于長(zhǎng)遠(yuǎn)的技術(shù)-社會(huì)協(xié)同進(jìn)化路徑。這意味著在思考人機(jī)關(guān)系時(shí)應(yīng)摒棄二元對(duì)立的替代論調(diào),而應(yīng)通過(guò)價(jià)值對(duì)齊、黑箱稀釋等實(shí)踐舉措強(qiáng)調(diào)技術(shù)適應(yīng)性融合下的協(xié)同進(jìn)化。通過(guò)深入探討其在可預(yù)見(jiàn)歷史時(shí)段內(nèi)的發(fā)展趨勢(shì),以及如何在確保技術(shù)進(jìn)步與人類(lèi)價(jià)值體系和諧共生的框架下,推動(dòng)技術(shù)的負(fù)責(zé)任發(fā)展。

      [參考文獻(xiàn)]

      [1] 吉爾·德勒茲.褶子:萊布尼茨與巴洛克風(fēng)格(修訂譯本)[M].楊潔,譯.上海:上海人民出版社,2021.

      [2] J. Kaplan, Sam McCandlish, T. Henighan, et al. Scaling Laws for Neural Language Models[EB/OL]. ArXiv,https://arxiv.org/pdf/2001.08361.

      [3] Jason Wei, Yi Tay, Rishi Bommasani, et al. Emergent Abilities of Large Language Models[EB/OL]. ArXiv,https://arxiv.org/pdf/2206.07682.

      [4] Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton. ImageNet classification with deep convolutional neural networks[J]. Communications of the ACM,2017,(6).

      [5] C. Shannon. A mathematical theory of communication[J]. Bell Syst. Tech. J., 1948.

      [6] 威廉·弗魯塞爾.表象的禮贊:媒介現(xiàn)象學(xué)[M].周海寧,許凌波,周軒,譯.上海:復(fù)旦大學(xué)出版社,2023.

      [7] 保羅·維利里奧.視覺(jué)機(jī)器[M].張新木,魏舒,譯.南京:南京大學(xué)出版社,2014.

      [8] 喬姆斯基談ChatGPT:這是一種高科技剽竊[EB/OL].澎湃新聞,2023-02-25.https://www.thepaper.cn/newsDetail_forward_22066562.

      [9] 吉爾貝·西蒙東.論技術(shù)物的存在模式[M].許煜,譯.南京:南京大學(xué)出版社,2024.

      [10] OpenAI. Video generation models as world simulators[EB/OL].2024-02-15.https://openai.com/research/video-genera

      tion-models-as-world-simulators.

      [11] David Ha, Jürgen Schmidhuber. World Models[EB/OL].ArXiv,https://arxiv.org/pdf/1803.10122.

      [12] 讓-弗朗索瓦·利奧塔爾.后現(xiàn)代狀態(tài):關(guān)于知識(shí)的報(bào)告[M].車(chē)槿山,譯.南京:南京大學(xué)出版社,2011.

      [13] Norbert Wiener. The Human Use of Human Beings: Cybernetics and Society[M]. New York: Doubleday,1954.

      [14] Stanford HAI. 2024 AI Index Report[EB/OL]. https://hai.stanford.edu/research/ai-index-report.

      [15] 海德格爾.演講與論文集[M].孫周興,譯.上海:生活·讀書(shū)·新知三聯(lián)書(shū)店,2005.

      [16] 蘭登·溫納.自主性技術(shù):作為政治思想主題的失控技術(shù)[M].楊海燕,譯.北京:北京大學(xué)出版社,2014.

      [17] Norbert Wiener. Some Moral and Technical Consequences of Automation: As machines learn they may develop unforeseen strategies at rates that baffle their programmers.[J]. Science,1960,(3410).

      [18] 布萊恩·克里斯汀.人機(jī)對(duì)齊[M].唐璐,譯.長(zhǎng)沙:湖南科學(xué)技術(shù)出版社,2023.

      [19] Russell S , Hauert S , Altman R ,et al. Robotics: Ethics of artificial intelligence[J]. Nature, 2015, (7553).

      [20] Ji J, Qiu T, Chen B, et al. AI Alignment: A Comprehensive Survey[EB/OL]. AarXiv, https://arxiv.org/pdf/2310.19852.

      [21] 張浩鵬, 夏保華.價(jià)值敏感性設(shè)計(jì)透視:背景、現(xiàn)狀、問(wèn)題與未來(lái)[J].自然辯證法研究,2023,(4).

      [22] 漢娜·阿倫特.人的境況[M].王寅麗,譯.上海:上海人民出版社,2009.

      [23] 頓新國(guó).可解釋人工智能問(wèn)題[J].江蘇行政學(xué)院學(xué)報(bào),2023,(3).

      [24] Achtibat R, Dreyer M, Eisenbraun I, et al. From attribution maps to human-understandable explanations through Concept Relevance Propagation[J]. Nature Machine Intelligence, 2023,(9).

      [25] Xiong H, Li X, Zhang X, et al. Towards Explainable Artificial Intelligence (XAI): A Data Mining Perspective[M]. arXiv,2024.

      [責(zé)任編輯:胡 梁 實(shí)習(xí)生:秦 溢]

      时尚| 双桥区| 黎城县| 甘谷县| 柞水县| 通江县| 崇左市| 韶山市| 怀远县| 中阳县| 赣州市| 三原县| 定南县| 治多县| 来安县| 蓬莱市| 格尔木市| 辉南县| 资兴市| 巴林右旗| 青神县| 临漳县| 新乡县| 马龙县| 屯门区| 都昌县| 海南省| 淳化县| 信阳市| 上杭县| 威海市| 婺源县| 山东省| 莱西市| 东方市| 镇远县| 昆山市| 北安市| 大丰市| 黑山县| 安顺市|