喻國明?曾嘉怡?黃沁雅
【摘要】? 以ChatGPT為代表的生成式AI預(yù)訓(xùn)練語言大模型的豐富應(yīng)用,提供了具體有效的關(guān)于智能物聯(lián)時(shí)代的想象,而在現(xiàn)實(shí)世界、實(shí)體經(jīng)濟(jì)的“產(chǎn)業(yè)數(shù)智化”過程中,新興職業(yè)提示工程師走進(jìn)了人們的視野。隨著生成式AI語言大模型越來越復(fù)雜,其回答質(zhì)量不僅取決于底層算法和訓(xùn)練數(shù)據(jù),還取決于其接收的提示(問題表達(dá))的有效性。以生成式AI語言大模型的訓(xùn)練與應(yīng)用為例,闡述提示工程師作為數(shù)智產(chǎn)業(yè)化、智能傳播生態(tài)格局變化過程中的重要中介變量所起到的加速器價(jià)值與作用。
【關(guān)? 鍵? 詞】大模型;數(shù)智時(shí)代;提示工程;ChatGPT;生成式AI
【作者單位】喻國明,北京師范大學(xué)新聞傳播學(xué)院;曾嘉怡,北京師范大學(xué)新聞傳播學(xué)院;黃沁雅,北京師范大學(xué)新聞傳播學(xué)院。
【中圖分類號】G253【文獻(xiàn)標(biāo)識(shí)碼】A【DOI】10.16491/j.cnki.cn45-1216/g2.2023.11.005
生成式AI(生成式人工智能)浪潮極大地改變了內(nèi)容生產(chǎn)的傳統(tǒng)范式,以ChatGPT為代表的生成式AI將進(jìn)一步實(shí)現(xiàn)人類自由度的擴(kuò)張,將人類從繁雜的機(jī)械性、重復(fù)性的智力勞動(dòng)中釋放,實(shí)現(xiàn)真正意義上微?;瘋€(gè)體的激活。依托生成式AI的文案撰寫、插畫師、虛擬數(shù)字人、營銷策劃師等新興職業(yè)大量出現(xiàn)[1]。2023年4月12日,知名公關(guān)公司藍(lán)色光標(biāo)宣布無限期停止創(chuàng)意設(shè)計(jì)、方案撰寫、文案撰寫等相關(guān)外包支出,遏制核心能力空心化趨勢,全面擁抱AIGC[2]。這不禁引人深思:AIGC具備替代人類的完全或絕大部分能力嗎?答案顯然是否定的。就現(xiàn)狀而言,在沒有專業(yè)提示工程師(Prompt Engineer)幫助的情況下,AIGC只能滿足人們一般性、非結(jié)構(gòu)性、層次單一的提問需求,難以滿足針對特定領(lǐng)域、特定人群的高層次、結(jié)構(gòu)化、復(fù)雜專業(yè)的需求。提示工程師作為一種新職業(yè)應(yīng)運(yùn)而生,其憑借專業(yè)素養(yǎng)和數(shù)智素養(yǎng)彌合了人類高層次需求與AIGC之間能力溝的“最后一公里”,協(xié)同需求者實(shí)現(xiàn)生成式AI較為深層意義上對用戶的重大賦能賦權(quán)。
一、問題提出的背景
1.應(yīng)用之殤:預(yù)訓(xùn)練語言大模型與應(yīng)用之間的溝壑
“數(shù)智時(shí)代”勾勒出數(shù)字智能世界中各生產(chǎn)要素的升維融合與結(jié)構(gòu)化的重新連接能產(chǎn)生的巨大價(jià)值增值。這里的連接指的不僅僅是生產(chǎn)要素和知識(shí)的連接,更是各領(lǐng)域技術(shù)之間有機(jī)的連接與整合,從而呈現(xiàn)一種全新的文明狀態(tài)。當(dāng)前,ChatGPT為生成式AI預(yù)訓(xùn)練語言大模型應(yīng)用提供了具體有效的關(guān)于智能物聯(lián)時(shí)代的想象,而在現(xiàn)實(shí)世界、實(shí)體經(jīng)濟(jì)的“產(chǎn)業(yè)數(shù)智化”過程中,新興職業(yè)提示工程師走進(jìn)了我們的視野。
本文將以生成式AI語言大模型的訓(xùn)練與應(yīng)用為例,闡述提示工程師作為數(shù)智時(shí)代產(chǎn)業(yè)化、智能傳播生態(tài)格局變化過程中的重要變量所起到的加速作用。隨著ChatGPT等人工智能語言大模型越來越復(fù)雜,其回答質(zhì)量不僅取決于底層算法和訓(xùn)練數(shù)據(jù),還取決于其收到的提示問題的有效性。當(dāng)用戶提出的問題越來越具有挑戰(zhàn)性,人工智能也就需要更多的提示來理解問題,從而生成更準(zhǔn)確的答案。設(shè)計(jì)良好的提示可以引出有意義和信息豐富的回答,而構(gòu)造不良的提示可能導(dǎo)致不相關(guān)或無意義的輸出。
2.小成本方案:提示學(xué)習(xí)
有研究者提出以GPT-3、PET為首的一種基于預(yù)訓(xùn)練語言大模型的新范式——提示學(xué)習(xí)(prompt learning)[3],旨在通過添加模板的方法來避免引入額外參數(shù),讓語言大模型可以在小樣本場景下達(dá)到理想的任務(wù)效果。目前,提示學(xué)習(xí)已經(jīng)運(yùn)用到分類、信息抽取、問答、文本生成、多模態(tài)學(xué)習(xí)等多個(gè)NLP領(lǐng)域。
提示學(xué)習(xí)是讓各種下游任務(wù)“遷就”預(yù)訓(xùn)練語言大模型,需要對下游任務(wù)進(jìn)行重構(gòu),使其達(dá)到適配預(yù)訓(xùn)練語言大模型的效果。從本質(zhì)上看,提示工程是一門給AI語言大模型提供問題或命令的藝術(shù),并優(yōu)化模型性能來保證達(dá)到預(yù)期的結(jié)果。比如,文本情感分類任務(wù)中,輸入“我喜歡這部電影”,希望輸出的是“正面/負(fù)面”中的一個(gè)標(biāo)簽,可以設(shè)置一個(gè)提示模板如“這部電影是___”,然后讓大模型用表示情感狀態(tài)的標(biāo)簽,將空白部分補(bǔ)全預(yù)測進(jìn)行輸出。所以,給定合適的提示模板,可以無監(jiān)督的方式訓(xùn)練單個(gè)的語言模型,完成下游的訓(xùn)練任務(wù)。
3.階段性需求:AIGC從輔助生產(chǎn)到獨(dú)立生產(chǎn)的變革
百度創(chuàng)始人李彥宏提出AIGC經(jīng)歷的三個(gè)發(fā)展階段,即輔助人類進(jìn)行內(nèi)容生產(chǎn)的助手階段、以虛實(shí)并存的虛擬人形態(tài)出現(xiàn)的協(xié)作階段和獨(dú)立完成內(nèi)容創(chuàng)作的原創(chuàng)階段[4]。目前,AIGC正處在輔助用戶進(jìn)行內(nèi)容生產(chǎn)和部分人機(jī)協(xié)作的發(fā)展階段,要徹底實(shí)現(xiàn)虛實(shí)并存的內(nèi)容生產(chǎn)乃至完全獨(dú)立的AI內(nèi)容生產(chǎn)還需要一定的磨合和調(diào)整。
要實(shí)現(xiàn)對AI語言大模型進(jìn)行融合訓(xùn)練的目標(biāo),需要對大模型精調(diào)、提示工程、知識(shí)增強(qiáng)、檢索增強(qiáng)、人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)等大模型相關(guān)新技術(shù)進(jìn)行深入探索和綜合應(yīng)用,而提示工程則可能是貫穿所有技術(shù)學(xué)習(xí)過程,具有外部激發(fā)性和內(nèi)部驅(qū)動(dòng)性的重要任務(wù)。
二、提示工程師“立身之本”:AIGC用戶深度價(jià)值實(shí)現(xiàn)的服務(wù)者
AIGC作為一種革命性的技術(shù),要想真正發(fā)揮其社會(huì)價(jià)值,切實(shí)地服務(wù)用戶,就要主動(dòng)地尋找符合當(dāng)下用戶需求、適應(yīng)當(dāng)下用戶能力模型的切口,真正地做到社會(huì)性應(yīng)用。提示工程師承擔(dān)的正是這樣的角色:通過對用戶需求的洞察和整合,在對大型語言模型邏輯解析的基礎(chǔ)上反向調(diào)控語言模型,輸出更高效的模型能力調(diào)用方案,包括單語言模型內(nèi)的能力調(diào)用和多平臺(tái)的多維深度調(diào)用,提升用戶服務(wù)效率。
提示工程師對AIGC用戶的服務(wù)實(shí)現(xiàn)路徑主要通過模型理解和輸出兩方面的能力提升來完成。從技術(shù)角度看,像ChatGPT這樣的大型自然語言模型依靠兩個(gè)關(guān)鍵性步驟來完成內(nèi)容輸出:其一是以互聯(lián)網(wǎng)上的大型語料庫訓(xùn)練人工智能神經(jīng)元網(wǎng)絡(luò);其二是確保人工智能生成的內(nèi)容更符合用戶預(yù)期,即要為人工智能撰寫文本提示語。這就催生了一種新的職業(yè)類型——提示工程師。提示工程師可以訓(xùn)練大型語言模型,幫助AI更好地理解需求,完成專業(yè)任務(wù)。他們需要將復(fù)雜的任務(wù)拆分成簡單的自然語言,給出指令,以獲取更準(zhǔn)確的答案,從而讓人工智能發(fā)揮最大潛力,為AI服務(wù)于企業(yè)使用提供更多便利。Lo.Leo S提出用于提示工程的CLEAR框架,其為AI語言大模型編寫有效提示語提供一種標(biāo)準(zhǔn)方法,強(qiáng)調(diào)五個(gè)基本組成部分:簡明(Concise)、邏輯(Logical)、明確(Explicit)、可適應(yīng)(Adaptive)、可反思(Reflective)[5]。這就要求提示工程工作需要持續(xù)性地關(guān)注語言表達(dá)和方法調(diào)整,在人機(jī)互動(dòng)中實(shí)現(xiàn)兩者思維的同頻和共通,這也成為衡量提示工程師貢獻(xiàn)質(zhì)量的關(guān)鍵能力模型參考。
三、提示工程的服務(wù)邏輯與技術(shù)迭代
1.基本提問場景
在對提示學(xué)習(xí)的技術(shù)實(shí)現(xiàn)展開探討之前,首先要對大型自然語言模型的提問場景進(jìn)行基本的區(qū)分,以便對特定的提問場景進(jìn)行語言訓(xùn)練和調(diào)整。在此,本文的區(qū)分標(biāo)準(zhǔn)不取決于目前以ChatGPT為主的語言大模型在實(shí)際工作學(xué)習(xí)中的應(yīng)用場景(如學(xué)術(shù)論文、商業(yè)寫作、代碼撰寫等),而是對不同需求的基本場景加以區(qū)分。
(1)基本答疑
在這一場景中,可以分為基本問答、案例輔助回答以及思維推理三種情況。在基本問答場景中,語言大模型會(huì)根據(jù)使用者的問題直接給出答案;在案例輔助場景里,很難通過文字指令描述清楚答案需求的時(shí)候,可以通過使用者給出案例提示來輔助大模型回答問題;在強(qiáng)調(diào)邏輯思維的推理提問中,需要充分發(fā)揮提示的重要作用,引導(dǎo)大模型沿著特定的思考路徑進(jìn)行推理演算。
這一場景也是最基礎(chǔ)、當(dāng)前應(yīng)用最廣的AIGC服務(wù)場景,通常以大模型和用戶之間多輪、遞進(jìn)的“聊天”形式展開,是用戶體驗(yàn)獲取最直接廣泛的接口。不同的語言大模型擅長的問題領(lǐng)域也不盡相同,提示工程師需要針對大模型進(jìn)行內(nèi)容和形式的微調(diào)。提示工程在這一場景中往往能總結(jié)出一些重要的使用技巧,如在闡述指令時(shí)優(yōu)先告知大模型“能干什么”而非告知大模型“不能干什么”,以及增加示例等。更高階的提示工程則體現(xiàn)在對大模型推理能力的調(diào)用上,如對于應(yīng)用計(jì)算的推導(dǎo)等。
(2)導(dǎo)向型內(nèi)容生成
除了回答問題,另一個(gè)重要的場景是讓大模型根據(jù)使用者的要求完成一些內(nèi)容生成任務(wù),包括但不限于編寫代碼、撰寫腳本和創(chuàng)作故事等。提示工程在這類提問場景中的貢獻(xiàn)是提升目標(biāo)的明確性和引導(dǎo)詞的正確應(yīng)用。如在要求大模型提供一個(gè)宣傳文案時(shí),“需要包括兩條活動(dòng)亮點(diǎn)與一條標(biāo)語”“字?jǐn)?shù)在100字以內(nèi)”之類的明確提示能夠讓AI更直接而快速地給出需要的內(nèi)容;針對代碼生成的提問場景、引導(dǎo)詞(提示)的關(guān)鍵部分,在技術(shù)實(shí)現(xiàn)路徑里將進(jìn)一步細(xì)化。
(3)內(nèi)容簡化、升級與拓展
內(nèi)容升級與拓展的提問場景細(xì)化到具體工作上,主要是承擔(dān)內(nèi)容改寫和信息轉(zhuǎn)換的功能。在使用者給出一段內(nèi)容并加以提示后,大模型會(huì)對其進(jìn)行翻譯、轉(zhuǎn)碼、修改、潤色等改寫工作,或是將一段代碼的具體含義和運(yùn)行目的加以解釋。這其中對大模型的提示將更注重調(diào)整其最終呈現(xiàn)的語言風(fēng)格以迎合適應(yīng)性對象,減少基礎(chǔ)的語義錯(cuò)誤并增強(qiáng)內(nèi)容可讀性。
人們往往面對大量的文字材料和夾雜其中的任務(wù)要求不知所措,甚至對關(guān)鍵性信息的提取也常常存在誤差。在這一場景里,提示工程需要達(dá)成的訓(xùn)練目的是對內(nèi)容文本的轉(zhuǎn)換程度通過提示語來把握,即“我需要你要簡單到什么程度”“我需要你歸納成幾個(gè)部分”。提示工程工作涵蓋歸納、解釋、提取等,除了需要對一段內(nèi)容的核心信息、中心內(nèi)容進(jìn)行理解性濃縮,還要將復(fù)雜專業(yè)的內(nèi)容通俗化,輸出另一種更為基礎(chǔ)的、非專業(yè)人士能接受的解釋。
2.技術(shù)實(shí)現(xiàn)路徑
(1)提示元素(ICIO)
為了探索出一個(gè)更好的AI語言大模型提示框架,筆者在查閱了包括Github在內(nèi)的大量開源平臺(tái)后,發(fā)現(xiàn)一位獨(dú)立的機(jī)器學(xué)習(xí)和NLP研究人員Elvis Saravia總結(jié)了ChatGPT Prompt的四大元素[6],筆者將其概括為IOIC框架,并嘗試將此作為提示工程的底層架構(gòu)。Elvis Saravia認(rèn)為,一個(gè)最基本的提示語言里需包含四個(gè)元素,由一個(gè)必要元素和三個(gè)可選元素組成:必要元素Instruction(指令),即我們希望大模型執(zhí)行的具體任務(wù);可選元素Context(背景),即上下文信息,以引導(dǎo)大模型做出更好的反應(yīng);可選元素Input Data(數(shù)據(jù)輸入),即告知大模型需要處理的數(shù)據(jù)和文本;可選元素Output Indicator(輸出指示器),即告知大模型我們要輸出的類型或格式。
作為提示工程的底層架構(gòu),在撰寫提示時(shí)可以根據(jù)“必要元素+任意一個(gè)或多個(gè)可選元素”的基本框架來排列組合。以上文導(dǎo)向型內(nèi)容生成的提問場景為例,可以采用“指令+背景+輸出指示器”的形式來提問:“請幫我生成一篇運(yùn)動(dòng)員的介紹+他還沒有退役而且取得過世界冠軍+請分成三段論述并控制在500字以內(nèi)”。
(2)實(shí)踐原則(TESRS)
在問答場景里,為了讓AI語言大模型回答更加準(zhǔn)確,提示工程可以從以下幾個(gè)具體實(shí)踐原則出發(fā),根據(jù)其英文關(guān)鍵詞,本文用TESRS原則來概括。
第一,To do and Not to do(告訴大模型做什么&不能做什么)。在OpenAI提供的最佳實(shí)踐文檔里提到:與其告知大模型不能干什么,不妨告訴大模型能干什么。但在實(shí)際應(yīng)用中,當(dāng)已經(jīng)給予大模型很明確的提示點(diǎn),之后想進(jìn)一步縮小范圍,可以適當(dāng)增加一些Not To do(不要做什么),以提高效率。比如,第一問(To do):給我推薦一部流行的電影;第二問(Not to do):不要日本的電影。
第二,Example(給出示例)。在某些場景下,使用者能比較簡單地向AI語言大模型描述出什么能做、什么不能做。但有些場景和需求很難通過文字指令傳遞給大模型,即使描述出來也不能很好地讓人理解。例如,給寵物起英文名,可能會(huì)夾雜著一些所謂的名字風(fēng)格,相比于用“起一個(gè)帥氣的名字”提示,此時(shí)通過增加一些例子如“起一個(gè)像超人一樣的英雄風(fēng)格的名字”,更恰當(dāng)些。
第三,Select(使用Select等引導(dǎo)詞)。在代碼生成環(huán)境里,可以通過增加一個(gè)代碼的引導(dǎo),告知大模型已經(jīng)將條件描述完了,可以輸出代碼了。如使用Select可以提示大模型輸出SQL代碼,使用import可以提示大模型輸出Python代碼。
第四,Role(增加假設(shè)角色)。這個(gè)技巧強(qiáng)調(diào)在提示語中增加一些角色相關(guān)的內(nèi)容,讓大模型生成的內(nèi)容更符合人們的需求。例如,在改寫的提問場景可以在案例前加入一段提示語,讓大模型假設(shè)自己是一個(gè)小學(xué)老師,并且很擅長將復(fù)雜的內(nèi)容轉(zhuǎn)變成七八歲小朋友也能聽懂的話。
第五,Symbol(使用特殊符號分隔文字)。不管是信息總結(jié)還是信息提取,在輸入大段文字甚至多段文字時(shí),可以用"""或###將指令和文本分開。根據(jù)一些開發(fā)人員的測試,當(dāng)文本有多段時(shí),增加"""或###可提升AI反饋的準(zhǔn)確性。
3.大模型迭代反饋
傳統(tǒng)的自然語言處理技術(shù)通常需要在大量標(biāo)注數(shù)據(jù)上進(jìn)行有監(jiān)督的訓(xùn)練,以便大模型可以對特定任務(wù)或領(lǐng)域進(jìn)行準(zhǔn)確的預(yù)測或生成輸出。但如Zero-Shot Prompting、Few-Shot Prompting等自然語言處理技術(shù),往往可以通過預(yù)先訓(xùn)練的語言大模型和一些示例或提示,來幫助大模型實(shí)現(xiàn)推理和生成輸出,即在經(jīng)過提示工程師的訓(xùn)練后,計(jì)算機(jī)模型就能根據(jù)簡單的提示或指令進(jìn)行任務(wù)處理,不需要根據(jù)特定的任務(wù)范圍和領(lǐng)域加大訓(xùn)練。如向大模型提問關(guān)于一部電影的具體情節(jié),其不再需要就電影領(lǐng)域的相關(guān)知識(shí)提前進(jìn)行預(yù)測和訓(xùn)練即可輸出答案。
四、提示工程價(jià)值作用的關(guān)鍵性特征
1.生成性人本化
提示工程的關(guān)鍵性特征之一是對人工智能語言大模型生成性提升的全面加速,降低用戶使用門檻,提升技術(shù)服務(wù)效率。提示工程師將場景理解、話語表達(dá)的結(jié)構(gòu)以簡明扼要的形式快速輸入大模型中,力求高效地指導(dǎo)模型識(shí)別、學(xué)習(xí)和整合用戶的個(gè)性化要素并有機(jī)呈現(xiàn),彰顯當(dāng)下人工智能語言大模型將要素結(jié)構(gòu)化的能力特征,使人工智能語言大模型更好地理解更復(fù)雜、更專業(yè)的任務(wù)指令,并以一種用戶能聽懂、愿意聽的形式輸出結(jié)果。
人工智能的優(yōu)勢在于能夠通過結(jié)構(gòu)性的、跨領(lǐng)域的、無邊界限制的知識(shí)、技術(shù)間的連接重組突破人類認(rèn)知的新邊界,最終與人類相互耦合形成“具身關(guān)系”[7],成為人類能力的強(qiáng)大補(bǔ)充。這種狀態(tài)對AIGC的生成性提出了高要求:以一種和人類的語義表達(dá)習(xí)慣接近的結(jié)構(gòu)將海量的資料梳理整合并輸出。這就要求人工智能對文本,對與用戶、場景的關(guān)系有快速理解與高超的表達(dá)能力。而當(dāng)下的AIGC更多地以一種原始、共情、討好與知識(shí)提供的形式出現(xiàn)在傳播世界中,預(yù)訓(xùn)練語言大模型與實(shí)際的用戶應(yīng)用之間依然存在使用溝壑,用戶短期內(nèi)依然需要較大的學(xué)習(xí)成本來實(shí)現(xiàn)人工智能語言大模型的真正應(yīng)用。這實(shí)質(zhì)上就是在“教導(dǎo)”人工智能語言大模型完成用戶關(guān)系建立,從“聽懂”到“讓用戶聽懂”,在連續(xù)性對話中持續(xù)提升生成內(nèi)容和任務(wù)需求的匹配度,加速生成式AI語言大模型的生成性形成。
2.連接性升維
提示工程師極大地推動(dòng)人工智能的連接性提升,走向智能互聯(lián)時(shí)代。這種連接性的推動(dòng)可按中短期和長期兩個(gè)階段來討論。
在AIGC發(fā)展初期,提示工程師能夠?qū)崿F(xiàn)各個(gè)大模型功能性的深度調(diào)用,在充分理解剖析各大模型的優(yōu)劣基礎(chǔ)上按需調(diào)用,為用戶提供綜合性的AIGC需求解決方案,彌補(bǔ)AIGC技術(shù)發(fā)展初期各個(gè)獨(dú)立大模型之間的能力壁壘。在這個(gè)階段,提示工程師實(shí)現(xiàn)的是用戶和語言大模型之間以及不同模型之間的連接,是為大模型進(jìn)一步發(fā)展完善后的互聯(lián)互通搭建基礎(chǔ)能力。
當(dāng)提示工程師幫助人工智能完成對于個(gè)性要素識(shí)別、場景和關(guān)系的理解識(shí)別以及表達(dá)能力的提升后,生成式AI語言大模型能夠?qū)崿F(xiàn)海量的個(gè)性化需求定制,滿足“微價(jià)值”的實(shí)現(xiàn),以極大滿足長尾需求和邊緣價(jià)值要素重新連接的方式給社會(huì)提供更深層次的連接可供性,為全方位智能互聯(lián)時(shí)代的到來提供更完備的連接能力基礎(chǔ)。在此基礎(chǔ)上,人與人、人與物、物與物的連接也將進(jìn)一步升維,媒介能進(jìn)一步突破信息的有限邊界,進(jìn)一步挖掘并滿足用戶沒有感知到的、潛在的、隱性的需求,使人類憑借媒介的升級迭代不斷突破現(xiàn)實(shí)世界的限制,獲得更大的發(fā)展空間。
3.語言大模型“賦魂”
技術(shù)的社會(huì)化本質(zhì)是技術(shù)邏輯與社會(huì)互構(gòu)的結(jié)果[8]。技術(shù)落地的最終呈現(xiàn)形式并不僅僅取決于技術(shù)邏輯,還有在和社會(huì)的互動(dòng)中逐漸形成并展現(xiàn)的終態(tài)。在生成式AI語言大模型訓(xùn)練中,大模型投喂的廣泛語料與提示工程師重構(gòu)工作時(shí)投喂的語料與結(jié)構(gòu)模型都會(huì)對語言大模型理解和表達(dá)方式形成重要影響。
此時(shí),提示工程師區(qū)別于語言大模型“自投喂”訓(xùn)練模式的另一關(guān)鍵特征得以顯現(xiàn):來自人類必要的社會(huì)補(bǔ)充。這種社會(huì)價(jià)值補(bǔ)充包括人類常識(shí)性、直覺性知識(shí)結(jié)構(gòu)的輸入,更包括預(yù)防或解決算法失靈問題的人工干預(yù)。其中,圍繞倫理界限、道德規(guī)則等建立有效的、以人為本的“防火墻”機(jī)制尤為重要。
五、提示工程難以突破的困境
1.AIGC內(nèi)容知識(shí)產(chǎn)權(quán)界定存疑,制約產(chǎn)業(yè)應(yīng)用與發(fā)展
從著作權(quán)法角度來看,AIGC生成內(nèi)容屬于重組式內(nèi)容創(chuàng)新,AIGC目前主要進(jìn)行人機(jī)協(xié)作共創(chuàng),尚不具備真正的內(nèi)容自主創(chuàng)造能力。其不僅能夠進(jìn)行語言文字的自動(dòng)學(xué)習(xí)生成,AI多模型的圖像整合技術(shù)還能生成或修改圖像、視頻,讓人難以察覺。但AIGC引發(fā)的新型知識(shí)產(chǎn)權(quán)風(fēng)險(xiǎn)正成為知識(shí)生產(chǎn)相關(guān)行業(yè)領(lǐng)域面臨的迫切問題,尤其在教育、咨詢、藝術(shù)等行業(yè)產(chǎn)生極大的法律危機(jī)。目前我國現(xiàn)行著作權(quán)法中尚未對生成式內(nèi)容的知識(shí)產(chǎn)權(quán)進(jìn)行明確界定,這意味AIGC內(nèi)容生產(chǎn)始終游走在法律的邊緣,對內(nèi)容產(chǎn)業(yè)的合規(guī)化運(yùn)營和發(fā)展造成潛在的威脅,這也將打擊行業(yè)與AI技術(shù)融合發(fā)展的積極性和主動(dòng)性。
2.AIGC內(nèi)容質(zhì)量尚無保證,缺乏社會(huì)化傳播基礎(chǔ)
AIGC模型的內(nèi)容生成是以網(wǎng)絡(luò)中大量的現(xiàn)有數(shù)據(jù)為基礎(chǔ)的,通過捕捉上下文內(nèi)容的邏輯結(jié)構(gòu)進(jìn)行語言重組和表達(dá),但在此之外,AIGC本身會(huì)對許多其無法檢索到的信息及訓(xùn)練數(shù)據(jù)中不存在的內(nèi)容強(qiáng)行捏造,根據(jù)自身預(yù)設(shè)對后續(xù)詞語進(jìn)行連接擴(kuò)充,導(dǎo)致其內(nèi)容輸出在錯(cuò)誤的方向上越走越遠(yuǎn)。就像OpenAI團(tuán)隊(duì)發(fā)布自動(dòng)生成語言文本的ChatGPT在用戶的提示語下,會(huì)生成一定的虛假內(nèi)容,其隱藏在完美的邏輯和語言下,令人難以分辨。
同時(shí),虛擬世界倫理道德的問題也是AIGC發(fā)展的重要阻礙。在與AI技術(shù)有關(guān)的內(nèi)容生產(chǎn)中,所謂的道德準(zhǔn)則、潛在的偏見或歧視性內(nèi)容以及敏感話題和潛在傷害性內(nèi)容如何處理,所屬權(quán)或?qū)θ说闹黧w性、人腦“意識(shí)”定義的沖擊等問題在數(shù)智時(shí)代將愈加凸顯。
3.AIGC數(shù)據(jù)收集無序,隱私和數(shù)據(jù)安全隱憂
AIGC生成內(nèi)容所依賴的數(shù)據(jù)可能涉及用戶隱私,為了訓(xùn)練和改進(jìn)人工智能生成內(nèi)容的算法,大量的數(shù)據(jù)通常是必需的,這些數(shù)據(jù)可以包括用戶的個(gè)人信息、文本、圖像等。同時(shí),在人工智能生成內(nèi)容的領(lǐng)域,可能存在不同組織之間的數(shù)據(jù)共享和合作,這其中的傳輸過程如何保證數(shù)據(jù)不被泄漏或?qū)⒊蔀榱硪淮蠹夹g(shù)性問題。
六、媒介視角下的數(shù)智時(shí)代人機(jī)深度融合加速
1.提示工程師推動(dòng)人工智能媒介加速進(jìn)化
媒介進(jìn)化理論強(qiáng)調(diào)媒介對社會(huì)交流和知識(shí)傳播的影響,人在這一過程中持續(xù)發(fā)揮著主體性作用。隨著人工智能生成內(nèi)容技術(shù)的進(jìn)步,大型語言模型(如GPT-3)的出現(xiàn)可以使人工智能更好地理解自然語言,而提示工程師則利用這些語言大模型進(jìn)行訓(xùn)練,將復(fù)雜任務(wù)拆分為簡單的自然語言指令,在訓(xùn)練人工智能更準(zhǔn)確地理解人類用戶需求并提供更好答案的過程中,實(shí)現(xiàn)對人類工作生活的服務(wù)升級。智能媒介進(jìn)化帶來人類工作效率的提升和信息量邊界的擴(kuò)展,勢必會(huì)給人們帶來生活與傳播在方式、習(xí)慣以及理念上的變革[9],達(dá)成保羅·萊文森“服務(wù)和滿足人類的需求”這一媒介進(jìn)化的終極目標(biāo)。
2.新世界的擺渡者:提示工程師將降低數(shù)智時(shí)代的“門檻”
匹配數(shù)智時(shí)代的三大入口,具身入口是個(gè)體存在感的實(shí)現(xiàn)基礎(chǔ),空間入口與社交入口分別指涉空間存在感和社會(huì)存在感兩個(gè)維度[10]。從當(dāng)下現(xiàn)實(shí)到數(shù)智時(shí)代的虛實(shí)接口,需要AI、大數(shù)據(jù)等技術(shù)提供支撐,而提示工程師的出現(xiàn)不斷探索人工智能內(nèi)容生產(chǎn)如何更好地服務(wù)于人類需求,個(gè)人用戶在人工智能的實(shí)際應(yīng)用中獲得感、體驗(yàn)感、存在感都得到全面的升級。在未來的發(fā)展中,AIGC全方位融入數(shù)智時(shí)代入口的構(gòu)建過程,個(gè)體在技術(shù)嵌入與虛實(shí)融合下的延伸將感知到自身邊界的擴(kuò)張、身體再造下與萬物互通連接的升級。
概言之,伴隨生成式AI的崛起,生成式AI與新聞傳媒工作者,乃至未來新聞傳媒業(yè)的關(guān)系受到前所未有的關(guān)注。以ChatGPT為代表的生成式AI具備的強(qiáng)大文本生成能力究竟是造就新聞傳媒業(yè)還是顛覆新聞傳媒業(yè)?這是新聞傳媒工作者在生成式AI浪潮下不得不考慮的問題。對于傳媒組織而言,始終保持對新技術(shù)的關(guān)注,并不被其固有模式裹挾至關(guān)重要[11]。未來新聞傳媒工作者的重要角色之一就是扮演提示工程師的角色,成為自然語言和機(jī)器語言的積極中介,并通過中介機(jī)制的反饋為語言大模型“賦魂”——不斷注入人本要素。新聞傳媒工作者是客觀事實(shí)和新聞傳媒消費(fèi)者的中介,是以獨(dú)特的提示語言幫助新聞傳媒消費(fèi)者認(rèn)知和理解相關(guān)的世界。因此,新聞傳媒工作者在新形勢下的身份轉(zhuǎn)變和邏輯重構(gòu)不僅是順應(yīng)時(shí)代浪潮的選擇,也是媒介發(fā)展的必然。
|參考文獻(xiàn)|
[1]張智雄,曾建勛,夏翠娟,等. 回應(yīng)AIGC的信息資源管理學(xué)人思考[J]. 農(nóng)業(yè)圖書情報(bào)學(xué)報(bào),2023(1):4-28.
[2]科技圓桌派|藍(lán)色光標(biāo)全面停用文案外包 GPT開搶廣告行業(yè)飯碗?[EB/OL]. [2023-04-13](2023-06-12). https://baijiahao.baidu.com/s?id=1763062951314401808&wfr=spider&for=pc.
[3]曾慧玲,李琳,呂思洋,等. 提示學(xué)習(xí)驅(qū)動(dòng)的新聞輿情風(fēng)險(xiǎn)識(shí)別方法研究[J/OL]. 計(jì)算機(jī)工程與應(yīng)用,2022:1-8. https://kns.cnki.net/kcms2/article/abstract?v=3uoqIhG8C45S0n9fL2suRadTyEVl2pW9UrhTDCdPD652m6Nu8km6WbBXXhldTwCzfngMKlwCdm4xecfv0f_aNtAkNh3rRcZN&uniplatform=NZKPT.
[4]郭全中,袁柏林. AIGC與WEB3.0有機(jī)融合:
數(shù)智時(shí)代內(nèi)容生產(chǎn)的新范式[J]. 南方傳媒研究,2023(1):36-47.
[5]LO. LEO S. The CLEAR Path: A Framework for Enhancing Information Literacy through Prompt Engineering[J].The Journal of academic librarianship, 2023(4):102720.
[6]Prompting Introduction[EB/OL].[2023-06-12].https://github.com/dair-ai/Prompt-Engineering-Guide/blob/main/guides/prompts-intro.md.
[7]喻國明,蘇健威. 生成式人工智能浪潮下的傳播革命與媒介生態(tài):從ChatGPT到全面智能化時(shí)代的未來[J]. 新疆師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2023(5):81-90.
[8]喻國明. ChatGPT浪潮下的傳播革命與媒介生態(tài)重構(gòu)[J]. 探索與爭鳴,2023(3):9-12.
[9]郭婧一,喻國明. 數(shù)智時(shí)代新“入口”:智能網(wǎng)聯(lián)汽車作為未來媒體的新樣態(tài)[J]. 傳媒觀察,2022(6):17-21.
[10]喻國明,趙秀麗,譚馨. 具身方式、空間方式與社交方式:數(shù)智時(shí)代的三大入口研究:基于傳播學(xué)邏輯的近期、中期和遠(yuǎn)期發(fā)展分析[J]. 新聞界,2022(9):4-12.
[11]張建中,坎貝爾西莉亞. 面對ChatGPT,新聞?dòng)浾卟粦?yīng)該有身份危機(jī)[J]. 青年記者,2023(5):97-98.