張新新 黃如花
隨著ChatGPT躋身史上用戶增長(zhǎng)速度最快的互聯(lián)網(wǎng)應(yīng)用程序,生成式人工智能(Generative AI)技術(shù)以其卓越的算法、算力和數(shù)據(jù)優(yōu)勢(shì),迅速成為社會(huì)關(guān)注的焦點(diǎn)和熱點(diǎn),并將長(zhǎng)遠(yuǎn)而深刻地影響著傳媒、教育、營(yíng)銷、咨詢、翻譯等行業(yè)。
生成式AI技術(shù)作用于出版流程內(nèi)部,推動(dòng)著專業(yè)生成內(nèi)容(professional generated content, PGC)走向人工智能生成內(nèi)容(artificial intelligence generated content,AIGC),人工編校走向人機(jī)協(xié)同編校,按需印刷和智能印廠場(chǎng)景的進(jìn)一步豐富以及出版營(yíng)銷效率、動(dòng)力和質(zhì)量變革。生成式AI 技術(shù)作用于出版外部,將會(huì)催生一系列智能出版新產(chǎn)品、新業(yè)態(tài)和新模式,同時(shí)也面臨著數(shù)據(jù)、版權(quán)、價(jià)值等多方面的風(fēng)險(xiǎn)和挑戰(zhàn),因此需要在分析場(chǎng)景創(chuàng)新、識(shí)別風(fēng)險(xiǎn)挑戰(zhàn)的基礎(chǔ)上,進(jìn)一步提出生成式智能出版的調(diào)節(jié)路徑和治理路徑。
分析式AI主要發(fā)力于對(duì)現(xiàn)有事物的解釋、呈現(xiàn)、表達(dá)與推薦方面,能夠提高用戶的智能化體驗(yàn),目前應(yīng)用于新聞出版領(lǐng)域的AI技術(shù)多為分析式AI。生成式AI旨在生成新的信息、數(shù)據(jù)和知識(shí),可以生成文字、圖片、音頻、視頻、3D模型、虛擬環(huán)境等多模態(tài)內(nèi)容。較分析式AI,生成式AI在通往賦予機(jī)器智能化的道路上實(shí)質(zhì)性地邁出了一大步,使機(jī)器產(chǎn)生了智能化的自主思維與意識(shí)。
分析式AI技術(shù)已創(chuàng)造出諸多智能出版應(yīng)用場(chǎng)景,如出版大數(shù)據(jù)、智能知識(shí)服務(wù)、增強(qiáng)現(xiàn)實(shí)(augmented reality,AR)智能出版、虛擬現(xiàn)實(shí)(virtual reality,AR)智能出版、在線教育智能化[1]。隨著生成式AI技術(shù)的深層次應(yīng)用,這些智能出版場(chǎng)景將會(huì)得到進(jìn)一步的豐富、深化或拓新,并推動(dòng)眾多新的應(yīng)用場(chǎng)景出現(xiàn),如圖1所示。
圖1 生成式智能出版的多維應(yīng)用場(chǎng)景Fig.1 Multidimensional Application Scenarios of Generative Intelligent Publishing
缺乏數(shù)據(jù)的喂養(yǎng)和訓(xùn)練,再好的強(qiáng)化算法技術(shù)也無(wú)法催生ChatGPT等生成式AI產(chǎn)品,海量數(shù)據(jù)語(yǔ)料庫(kù)是生成式AI技術(shù)勃興的前提、基礎(chǔ)和底座。ChatGPT等生成式AI產(chǎn)品的研發(fā)過(guò)程,給予出版業(yè)的重要啟示首先在于重視數(shù)據(jù)建設(shè),把數(shù)據(jù)作為生產(chǎn)要素、作為新能源、作為推動(dòng)出版業(yè)高質(zhì)量發(fā)展的新動(dòng)能。
數(shù)據(jù)要素是指對(duì)客觀事物的性質(zhì)、狀態(tài)及關(guān)系進(jìn)行記錄的物理符號(hào)或符號(hào)組合,是未經(jīng)加工的數(shù)字和事實(shí),大數(shù)據(jù)語(yǔ)境下對(duì)數(shù)據(jù)的使用重在強(qiáng)調(diào)相關(guān)關(guān)系;信息則是指經(jīng)過(guò)處理、專題化的數(shù)據(jù),于出版業(yè)而言,信息服務(wù)也能構(gòu)成一種專業(yè)的出版知識(shí)服務(wù)模式;知識(shí)則是經(jīng)過(guò)實(shí)踐檢驗(yàn)被證明是正確的信息。隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)作為一種生產(chǎn)要素,其重要性越來(lái)越受到重視,但出版業(yè)對(duì)數(shù)據(jù)要素的認(rèn)知、理解和運(yùn)用還有較大的提升空間。正如《大數(shù)據(jù)時(shí)代》的作者所述,(西方國(guó)家)出版社“沒(méi)有把書籍的數(shù)據(jù)價(jià)值挖掘出來(lái),也不允許別人這樣做。他們沒(méi)有看到數(shù)據(jù)化的需求,也意識(shí)不到書籍的數(shù)據(jù)化潛力”[2]。同樣,我國(guó)出版業(yè)在數(shù)據(jù)要素配置方面也存在數(shù)據(jù)理念缺失、數(shù)據(jù)思維薄弱、數(shù)據(jù)價(jià)值挖掘不充分、數(shù)據(jù)產(chǎn)業(yè)鏈缺位、數(shù)據(jù)治理缺失等問(wèn)題。
基于生成式AI技術(shù),未來(lái)出版業(yè)的數(shù)據(jù)應(yīng)用場(chǎng)景至少包括:其一,出版內(nèi)部數(shù)據(jù)資料庫(kù)建設(shè),再造一個(gè)網(wǎng)絡(luò)版出版機(jī)構(gòu)。通過(guò)對(duì)出版社歷史上的每一本書、每一位作者、每一位用戶等進(jìn)行數(shù)據(jù)化處理,積累豐富的內(nèi)容數(shù)據(jù)、用戶數(shù)據(jù)和交互數(shù)據(jù);進(jìn)而通過(guò)數(shù)據(jù)的調(diào)取、識(shí)別、再現(xiàn),架構(gòu)出版社內(nèi)部的數(shù)據(jù)池,構(gòu)建起一個(gè)由內(nèi)容數(shù)據(jù)、用戶數(shù)據(jù)、交互數(shù)據(jù)構(gòu)成的數(shù)字化出版企業(yè)。其二,垂直型知識(shí)服務(wù)大數(shù)據(jù)建設(shè)。在完成出版社內(nèi)部數(shù)據(jù)建設(shè)的基礎(chǔ)上,通過(guò)數(shù)據(jù)交換、數(shù)據(jù)共享、增量數(shù)據(jù)建設(shè)等方式,不斷擴(kuò)充數(shù)據(jù)規(guī)模,逐步形成可以服務(wù)垂直領(lǐng)域的知識(shí)服務(wù)大數(shù)據(jù),如法院出版社的法信大數(shù)據(jù)、知識(shí)產(chǎn)權(quán)出版社的DI Inspiro大數(shù)據(jù)等。其三,面向出版領(lǐng)域的大規(guī)模語(yǔ)言模型(large language model, LLM)建設(shè)。對(duì)此,須充分發(fā)揮重大文化產(chǎn)業(yè)項(xiàng)目帶動(dòng)戰(zhàn)略,用好文化產(chǎn)業(yè)、出版業(yè)的宏觀調(diào)控體制優(yōu)勢(shì),從國(guó)家層面著手啟動(dòng)旨在維護(hù)意識(shí)形態(tài)陣地安全、文化安全和內(nèi)容安全的出版業(yè)LLM工程:一方面,籌建包含中文書籍、報(bào)刊、網(wǎng)絡(luò)百科等在內(nèi)的超大規(guī)模語(yǔ)料集,并聘請(qǐng)出版專家進(jìn)行少量、高質(zhì)量的人工標(biāo)記語(yǔ)料集建設(shè);另一方面,可在國(guó)內(nèi)LLM的基礎(chǔ)上,通過(guò)對(duì)出版語(yǔ)料集的訓(xùn)練,運(yùn)用基于人類反饋的強(qiáng)化學(xué)習(xí)算法,確保模型輸出內(nèi)容在表達(dá)方式、安全性、價(jià)值觀方面與主流意識(shí)形態(tài)相適應(yīng)。
此前筆者在《出版+人工智能: 未來(lái)出版的新模式與新形態(tài)》一文中提及“智能知識(shí)服務(wù)”,著重論及知識(shí)計(jì)算等關(guān)鍵技術(shù),以及涵蓋幾十億實(shí)體規(guī)模的跨領(lǐng)域、跨學(xué)科、跨媒體、多數(shù)據(jù)類型的知識(shí)圖譜構(gòu)建;后續(xù)筆者在國(guó)家標(biāo)準(zhǔn)《新聞出版 知識(shí)服務(wù) 知識(shí)資源建設(shè)與服務(wù)工作指南》最后一條專門提出“智能知識(shí)服務(wù)”,即“以人工智能技術(shù)為依托,借助大數(shù)據(jù)開展知識(shí)體系構(gòu)建、知識(shí)計(jì)算、知識(shí)圖譜構(gòu)建,開展機(jī)器撰稿、新聞推薦、智能選題策劃、智能審校、智能印刷、智能發(fā)行、智能機(jī)器人等服務(wù)方式”[3]。
不難看出,之前論述或規(guī)定的“智能知識(shí)服務(wù)”,主要強(qiáng)調(diào)基于分析式AI技術(shù)的應(yīng)用,如新聞推薦、知識(shí)體系構(gòu)建、知識(shí)計(jì)算等,以及基于淺層次的生成式AI技術(shù)應(yīng)用,如機(jī)器撰稿等。其所提供的知識(shí)服務(wù)主要是采取“提問(wèn)-檢索-適配-推送”的基本邏輯,沒(méi)有體現(xiàn)AI生成的邏輯;智能知識(shí)服務(wù)的“智能”也主要體現(xiàn)在基于知識(shí)計(jì)算的隱性知識(shí)推導(dǎo)和知識(shí)服務(wù),沒(méi)有觸及提供知識(shí)產(chǎn)品、信息服務(wù)和知識(shí)解決方案的機(jī)器本體“智能”問(wèn)題。一言以蔽之,其還停留在傳統(tǒng)知識(shí)服務(wù)的階段。
ChatGPT兼具人類自然加持和大規(guī)模復(fù)雜系統(tǒng)的涌現(xiàn)能力,重塑了知識(shí)服務(wù)的生命形態(tài),也對(duì)傳統(tǒng)知識(shí)服務(wù)造成降維式打擊[4]。作為知識(shí)服務(wù)提供商,與其被動(dòng)地被降維打擊,倒不如主動(dòng)擁抱新技術(shù)、積極應(yīng)用新技術(shù),做到知識(shí)服務(wù)的升維發(fā)展。在生成式AI技術(shù)的推動(dòng)、影響和啟發(fā)下,智能知識(shí)服務(wù)至少包含以下幾層含義。
一則,圍繞“知識(shí)體系”進(jìn)行邏輯建構(gòu)。知識(shí)體系的重要性越來(lái)越凸顯,宏觀來(lái)看,無(wú)論是哲學(xué)、自然科學(xué)抑或社會(huì)科學(xué),其學(xué)科體系、學(xué)術(shù)體系和話語(yǔ)體系的構(gòu)建歸根到底要推進(jìn)自主知識(shí)體系建設(shè),持續(xù)推動(dòng)理論、知識(shí)和方法的創(chuàng)新。從生成式AI視角進(jìn)行微觀分析,ChatGPT之所以獲得認(rèn)可,除了其采用了基于人類反饋的強(qiáng)化學(xué)習(xí)算法、更加適人化的輸出方式外,更重要的是發(fā)現(xiàn)了知識(shí)元之間的邏輯關(guān)系、形成了思維鏈,從而能夠?qū)崿F(xiàn)內(nèi)容的復(fù)雜推理。而知識(shí)元之間的邏輯關(guān)系,是知識(shí)體系構(gòu)建的核心內(nèi)容。因此,未來(lái)智能知識(shí)服務(wù)的中心任務(wù)便是構(gòu)建更為全面、更加科學(xué)、適用范圍更廣的知識(shí)體系,包括基于海量語(yǔ)料庫(kù)的歸納式構(gòu)建和基于書籍、百科網(wǎng)站的演繹式構(gòu)建。
二則,圍繞“智能”創(chuàng)設(shè)應(yīng)用場(chǎng)景。知識(shí)服務(wù)的“智能化”是未來(lái)知識(shí)服務(wù)發(fā)展的關(guān)鍵所在。知識(shí)體系的自動(dòng)構(gòu)建,數(shù)據(jù)、信息和知識(shí)的自動(dòng)生成,用戶知識(shí)問(wèn)題解決方案的集成式創(chuàng)新解答,圖文聲像影、3D模型、虛擬環(huán)境等多模態(tài)知識(shí)需求的全方位回應(yīng),視、聽、味、嗅、觸等聯(lián)覺體驗(yàn)的智能推送,等等,這些或可成為未來(lái)智能知識(shí)服務(wù)的努力方向和重要發(fā)力點(diǎn)。
三則,由“檢索推送”走向“生成解答”。根據(jù)用戶提問(wèn),在已有知識(shí)庫(kù)中進(jìn)行檢索,而后推送給用戶以解答知識(shí)問(wèn)題的“檢索推送”范式將成為歷史。取而代之的是根據(jù)用戶提問(wèn)、自主生成滿足用戶知識(shí)需求的“生成解答”范式。這也意味著以往基于感知智能的“產(chǎn)品驅(qū)動(dòng)型、信息驅(qū)動(dòng)型、政策驅(qū)動(dòng)型、技術(shù)驅(qū)動(dòng)型”[5]的知識(shí)服務(wù)模式將逐步被智慧驅(qū)動(dòng)型知識(shí)服務(wù)模式所取代,意味著人類智慧與AI的高度協(xié)同、深度融合,將推動(dòng)智慧驅(qū)動(dòng)型知識(shí)服務(wù)模式向生成式智能驅(qū)動(dòng)型知識(shí)服務(wù)的方向升級(jí)和邁進(jìn)。
四則,知識(shí)服務(wù)主體的人機(jī)協(xié)同。且不論法律或規(guī)則層面的主體含義,至少在事實(shí)層面,智能知識(shí)服務(wù)的主體不再限定在“人”“法人”的范圍內(nèi),而是延伸至AI或機(jī)器。解決用戶知識(shí)問(wèn)題的答案,即數(shù)據(jù)、信息或知識(shí),不再簡(jiǎn)單由人類直接提供,而是AI在語(yǔ)料庫(kù)的基礎(chǔ)上進(jìn)行集成式創(chuàng)新、整合式創(chuàng)新而予以提供的。簡(jiǎn)言之,即“AI生成答案以解決知識(shí)問(wèn)題需求”。由此,人類和機(jī)器共同作為知識(shí)服務(wù)主體,以人機(jī)協(xié)同、人機(jī)融合的方式提供知識(shí)服務(wù),滿足人們學(xué)習(xí)、求知、閱讀等需要,已然是不爭(zhēng)的事實(shí)。
智能機(jī)器人是行為智能的代表[6]。新聞出版業(yè)的智能機(jī)器人在機(jī)器人實(shí)體、傳感器、效應(yīng)器和執(zhí)行器層面都有其特殊性,須充分結(jié)合內(nèi)容產(chǎn)業(yè)的優(yōu)勢(shì)和特點(diǎn),重點(diǎn)在控制器的語(yǔ)音知識(shí)庫(kù)和交互功能方面發(fā)力[7]。
在以分析式AI為代表的時(shí)代,智能機(jī)器人以禮儀機(jī)器人、智能盤點(diǎn)機(jī)器人、智慧圖書館的智能管理機(jī)器人等形態(tài)在圖書館領(lǐng)域得到廣泛應(yīng)用。新聞?lì)I(lǐng)域主要以撰稿機(jī)器人形態(tài)出現(xiàn),如國(guó)外華盛頓郵報(bào)的Heliograf、美聯(lián)社的WordSmith以及紐約時(shí)報(bào)的blossom等;國(guó)內(nèi)新華社的“快筆小新”、騰訊的Dreamwriter(夢(mèng)幻寫手)、第一財(cái)經(jīng)的“DT稿王”、今日頭條的“張小明”等。出版領(lǐng)域的應(yīng)用,則包括智能銷售機(jī)器人、智能教育機(jī)器人和智能倉(cāng)儲(chǔ)機(jī)器人等[8]。
ChatGPT等生成式AI產(chǎn)品的推廣和普及,將智能出版由分析式智能出版推向生成式智能出版的發(fā)展階段,也使得新聞出版領(lǐng)域的智能機(jī)器人再次獲得難得的發(fā)展機(jī)遇。具體來(lái)講,生成式智能將推動(dòng)出版領(lǐng)域智能機(jī)器人實(shí)現(xiàn)以下兩方面的應(yīng)用場(chǎng)景創(chuàng)新:(1)控制器的決策功能將進(jìn)一步優(yōu)化??刂破髯鳛闄C(jī)器人的大腦,決定著機(jī)器人的自主行為,是機(jī)器人“思維”“決策”功能的主要承載儀器。較出版機(jī)構(gòu)以往主導(dǎo)研發(fā)的教育機(jī)器人、科普機(jī)器人,海量語(yǔ)料集、LLM的成功運(yùn)用,使出版領(lǐng)域的智能機(jī)器人可以在控制器層面有效調(diào)動(dòng)在線知識(shí)庫(kù),調(diào)用LLM的數(shù)據(jù)和算法,從而起到更好的人機(jī)交互效果,更好地滿足用戶的學(xué)習(xí)、教育、聽讀等方面的知識(shí)服務(wù)需求。由此也推動(dòng)出版領(lǐng)域智能機(jī)器人控制器的研發(fā)路徑由“內(nèi)置式知識(shí)庫(kù)”范式轉(zhuǎn)向“在線版LLM”范式。這種研發(fā)路徑的轉(zhuǎn)向,將極大地提升出版領(lǐng)域智能機(jī)器人的認(rèn)知、思維和決策能力,在質(zhì)的層面提高出版領(lǐng)域智能機(jī)器人的決策功能、交互功能和用戶體驗(yàn)感。(2)出版領(lǐng)域智能機(jī)器人應(yīng)用場(chǎng)景多元化、立體化拓展。眾人耳熟能詳?shù)氖?,繪本閱讀機(jī)器人、早教機(jī)器人、銷售機(jī)器人等多元智能機(jī)器人已在出版業(yè)嶄露頭角。但生成式AI技術(shù)到來(lái)之前的出版領(lǐng)域機(jī)器人,呈現(xiàn)出千篇一律、虛有其表的短板,往往側(cè)重于簡(jiǎn)單的故事、兒歌、詩(shī)歌等內(nèi)容的普及以及較低程度的語(yǔ)音交互功能應(yīng)用。今后,隨著前述出版大數(shù)據(jù)和出版領(lǐng)域LLM的建設(shè)與發(fā)展,智能教育機(jī)器人的語(yǔ)音知識(shí)庫(kù)將會(huì)以LLM的身份出現(xiàn),知識(shí)問(wèn)答、課程資源查詢、高水平人機(jī)交互等功能將會(huì)更上一層樓。知識(shí)服務(wù)機(jī)器人將成為出版領(lǐng)域智能機(jī)器人應(yīng)用的下一個(gè)風(fēng)口,垂直領(lǐng)域的海量語(yǔ)料庫(kù)+LLM,將實(shí)質(zhì)性推動(dòng)知識(shí)服務(wù)機(jī)器人提供數(shù)量更多、服務(wù)更專業(yè)、獲取更便捷的知識(shí)問(wèn)答與檢索服務(wù),從而使得知識(shí)服務(wù)機(jī)器人成為智能出版的新產(chǎn)品和新業(yè)態(tài)。此外,智能銷售機(jī)器人,可以根據(jù)讀者個(gè)性化、定制化的圖書需求,基于語(yǔ)料庫(kù)和LLM,生成更加專業(yè)、更有針對(duì)性的圖書情報(bào)、宣傳廣告,從而為讀者提供體驗(yàn)感更佳的圖書推薦和營(yíng)銷服務(wù)。
生成式智能出版物,是指應(yīng)用生成式AI技術(shù)的出版產(chǎn)品,是融合AI和人類智慧的出版產(chǎn)品。生成式智能出版物,一方面是指基于AIGC的智能出版產(chǎn)品或服務(wù),如世界上首本由AI創(chuàng)作而成的實(shí)驗(yàn)小說(shuō)——1 The Road,再如前述由微軟小冰、ChatGPT和其他AIGC應(yīng)用所創(chuàng)作的詩(shī)歌、論文、專著、繪畫、音樂(lè)作品等;另一方面,也指人機(jī)共生、人機(jī)協(xié)同語(yǔ)境下研發(fā)的智能出版產(chǎn)品服務(wù),如法院社的《智慧辦案手冊(cè)》,有道AI機(jī)器翻譯、人工團(tuán)隊(duì)審核修訂的《極簡(jiǎn)區(qū)塊鏈》圖書等。生成式智能出版物的創(chuàng)作、生成由AI全部完成、主要完成或參與完成。但是,后續(xù)的編校印發(fā)各環(huán)節(jié)仍然離不開人類智慧,離不開出版編輯的時(shí)間、精力和智慧付出。
鑒于AIGC集成性創(chuàng)新特征突出、語(yǔ)料庫(kù)的價(jià)值觀烙印以及自然人用戶個(gè)性化服務(wù)的優(yōu)勢(shì),從未來(lái)發(fā)展趨勢(shì)來(lái)看,生成式智能出版物,可在以下幾個(gè)方向發(fā)力。
1.4.1 翻譯類出版物
ChatGPT等生成式AI產(chǎn)品往往擁有多種語(yǔ)言的海量語(yǔ)料庫(kù),由此,多語(yǔ)種之間翻譯、轉(zhuǎn)換、生成和輸出優(yōu)勢(shì)極為明顯。據(jù)悉AI翻譯一本20萬(wàn)字的圖書僅需花費(fèi)數(shù)十秒的時(shí)間。未來(lái)的出版業(yè)態(tài)之中,翻譯作品可先經(jīng)由生成式AI翻譯,再輔以人工審核校對(duì),這樣便可大大提高翻譯質(zhì)量和效率,甚至可以做到圖書原著和翻譯作品的同步出版、同時(shí)上線。
1.4.2 匯編類出版物
某種程度來(lái)講,就特定專業(yè)、特定學(xué)科、特定領(lǐng)域的具體知識(shí)問(wèn)題而言,AIGC所能提供的信息、數(shù)據(jù)、知識(shí)或解決方案,其質(zhì)量、規(guī)模、數(shù)量和效率遠(yuǎn)遠(yuǎn)高于大部分人類專家。換言之,ChatGPT等生成式AI產(chǎn)品,能夠根據(jù)目標(biāo)用戶的知識(shí)需求,基于海量語(yǔ)料集的數(shù)據(jù)優(yōu)勢(shì),運(yùn)用強(qiáng)化學(xué)習(xí)算法,輔以超強(qiáng)算力支持,圍繞特定知識(shí)點(diǎn)或知識(shí)體系在最短的時(shí)間內(nèi)形成遠(yuǎn)超人類的集合性、整合性輸出內(nèi)容,且這些輸出內(nèi)容是經(jīng)過(guò)AI的學(xué)習(xí)、理解、推理而得出的,不只是簡(jiǎn)單的材料堆砌、知識(shí)羅列。由此,文獻(xiàn)綜述、知識(shí)點(diǎn)集成、百科出版等匯編類出版物將成為生成式AI技術(shù)的重要發(fā)力點(diǎn),成為生成式智能出版物的示范性場(chǎng)景。
1.4.3 大眾出版物
文學(xué)、詩(shī)歌、小說(shuō)等大眾出版已然成為AI創(chuàng)作的先行領(lǐng)域。通過(guò)自然語(yǔ)言理解、自然語(yǔ)言生成以及基于人類反饋的強(qiáng)化學(xué)習(xí)等技術(shù)運(yùn)用,AI已經(jīng)可以圍繞給定主題,在寫作風(fēng)格、語(yǔ)法結(jié)構(gòu)、格式韻律等方面實(shí)現(xiàn)自由調(diào)度,并開展想象式、開創(chuàng)性的創(chuàng)作。可以遐想的是,為數(shù)更多的、飽含人類情感的AI文學(xué)、小說(shuō)、詩(shī)歌等文藝類大眾作品將以生成式智能出版物的面貌展現(xiàn)在世人面前。
此外,值得一提的是,生成式智能出版還無(wú)法在短時(shí)期內(nèi)覆蓋所有出版領(lǐng)域。鑒于ChatGPT等由國(guó)外主導(dǎo)研發(fā)的AIGC產(chǎn)品容易引起“意識(shí)形態(tài)偏見、意識(shí)形態(tài)滲透、文化價(jià)值觀認(rèn)同危機(jī)以及出版意識(shí)形態(tài)把握危機(jī)”[9],教育出版類圖書、主題出版類圖書,暫不宜采用AIGC,即使應(yīng)用AIGC,也需要進(jìn)行嚴(yán)格的審核和把關(guān),確保以人類智慧駕馭AI、以主流價(jià)值駕馭算法數(shù)據(jù)。
元宇宙出版,是指元宇宙系統(tǒng)中的出版,即由數(shù)字孿生人、虛擬出版業(yè)、虛實(shí)融合出版、腦機(jī)知識(shí)服務(wù)等所構(gòu)成的數(shù)字世界的出版[10]。在元宇宙中,或曰元宇宙出版系統(tǒng)中,孿生數(shù)字人是主體性力量,數(shù)據(jù)、信息、知識(shí)是運(yùn)行基質(zhì),數(shù)字技術(shù)是建構(gòu)和運(yùn)行邏輯[11]。
AIGC的出現(xiàn)和普及,為元宇宙出版新業(yè)態(tài)提供了必需的數(shù)據(jù)、信息、知識(shí)等基質(zhì),提供了孿生數(shù)字人的“思維”“決策”能力,還進(jìn)一步提供了作為元宇宙出版動(dòng)能、運(yùn)行邏輯的智能化數(shù)字技術(shù)。
在運(yùn)行基質(zhì)方面,生成式預(yù)訓(xùn)練轉(zhuǎn)換模型(generative pre-trained transformer,GPT)等LLM可為元宇宙出版源源不斷地輸入期刊、書籍、百科等萬(wàn)億級(jí)的單詞語(yǔ)料,經(jīng)過(guò)數(shù)據(jù)清洗后,可進(jìn)一步形成數(shù)萬(wàn)億級(jí)甚至百萬(wàn)億級(jí)的無(wú)標(biāo)注文本數(shù)據(jù)。這些海量的數(shù)據(jù)、信息和知識(shí),為元宇宙的構(gòu)建、運(yùn)行提供了必備的生產(chǎn)要素和基礎(chǔ)設(shè)施,并且基于海量語(yǔ)料和強(qiáng)化學(xué)習(xí)技術(shù),AI可進(jìn)一步生成新的內(nèi)容,由此形成數(shù)據(jù)、信息和知識(shí)的再生產(chǎn)、循環(huán)生產(chǎn)機(jī)制,為元宇宙出版持續(xù)、穩(wěn)定、健康地運(yùn)行奠定數(shù)據(jù)基礎(chǔ)。
在運(yùn)行主體方面,虛擬數(shù)字人或?qū)\生數(shù)字人的感知、認(rèn)知、決策、執(zhí)行和控制能力將進(jìn)一步增強(qiáng)。GPT4等LLM較為成功地解決了感知智能上升到認(rèn)知智能的難題,是通往通用人工智能(artificial general intelligence,AGI)的關(guān)鍵,也實(shí)質(zhì)性地為數(shù)字人的智能問(wèn)題提供了技術(shù)解決方案。同時(shí),基于人類反饋的強(qiáng)化學(xué)習(xí)算法的成功運(yùn)用,為自然人和數(shù)字人之間的數(shù)據(jù)同步、表達(dá)同步、輸出同步難題提供了更有效率的攻克之道。
在運(yùn)行動(dòng)能方面,GPT4的超強(qiáng)算力為元宇宙出版的實(shí)質(zhì)運(yùn)行提供了基本支撐和維系動(dòng)力。GPT作為一種基于互聯(lián)網(wǎng)可用數(shù)據(jù)訓(xùn)練的文本生成深度學(xué)習(xí)模型,能夠有效地支撐“海量數(shù)據(jù)—強(qiáng)化學(xué)習(xí)—適人化生成內(nèi)容”的系統(tǒng)運(yùn)行,從而為構(gòu)建元宇宙出版虛擬空間數(shù)字人“感知—認(rèn)知—決策(生成)—行為”的運(yùn)行模式提供有益借鑒。
生成式智能出版新業(yè)態(tài)的出現(xiàn)無(wú)疑擴(kuò)充了出版的應(yīng)用場(chǎng)景和發(fā)展可能,也不斷為數(shù)字出版的創(chuàng)新發(fā)展輸入了強(qiáng)大的驅(qū)動(dòng)力。然而,這并不意味著生成式智能出版總是能發(fā)揮正向的賦能作用。事實(shí)上,其在應(yīng)用過(guò)程中不可避免地面臨著諸多風(fēng)險(xiǎn)和挑戰(zhàn),這是生成式AI技術(shù)在設(shè)計(jì)、開發(fā)、應(yīng)用過(guò)程中受諸多因素綜合影響所致。對(duì)這些風(fēng)險(xiǎn)的準(zhǔn)確識(shí)別和挑戰(zhàn)的及時(shí)應(yīng)對(duì),是發(fā)揮生成式智能出版應(yīng)用場(chǎng)景正價(jià)值賦能的應(yīng)有之義,也是技術(shù)向善理念在出版領(lǐng)域的必然要求。
數(shù)據(jù)風(fēng)險(xiǎn)是生成式AI技術(shù)應(yīng)用到各行各業(yè)都會(huì)遇到的風(fēng)險(xiǎn),這種風(fēng)險(xiǎn)涵蓋了數(shù)據(jù)來(lái)源、訓(xùn)練、組織和輸出的整個(gè)環(huán)節(jié),既包括數(shù)據(jù)來(lái)源風(fēng)險(xiǎn)、數(shù)據(jù)訓(xùn)練風(fēng)險(xiǎn),也存在數(shù)據(jù)輸出環(huán)節(jié)的風(fēng)險(xiǎn)。囿于篇幅限制,本文僅就來(lái)源、輸出兩個(gè)環(huán)節(jié)的風(fēng)險(xiǎn)予以分析。
數(shù)據(jù)來(lái)源的風(fēng)險(xiǎn),是指構(gòu)成ChatGPT訓(xùn)練集的數(shù)據(jù)類型、規(guī)模、語(yǔ)種等本身對(duì)輸出結(jié)果的科學(xué)性、合理性、權(quán)威性的基礎(chǔ)性、根本性風(fēng)險(xiǎn)。數(shù)據(jù)來(lái)源風(fēng)險(xiǎn)具體可細(xì)化為以下幾個(gè)方面。
(1)“數(shù)據(jù)獲取侵權(quán)、數(shù)據(jù)內(nèi)容違法、虛假信息吸收”[12]影響最終輸出結(jié)果的真實(shí)性和合法性,例如語(yǔ)料集涉及個(gè)人隱私、商業(yè)秘密等方面的數(shù)據(jù)如被惡意使用或過(guò)度使用,則容易引起內(nèi)容生成違法性的問(wèn)題。
(2)數(shù)據(jù)挖掘不受限,通過(guò)深層次推理和思維鏈技術(shù),推導(dǎo)出數(shù)據(jù)背后的信息可能關(guān)系國(guó)家安全。事實(shí)上,當(dāng)前技術(shù)“無(wú)法完全過(guò)濾種族歧視或仇恨言論,同樣埋下國(guó)家安全隱患”[13]。同時(shí),關(guān)鍵領(lǐng)域公開出版物的數(shù)據(jù)化,如對(duì)重要能源礦床、礦產(chǎn)地等圖書知識(shí)進(jìn)行標(biāo)注、計(jì)算和輸出,存在泄漏國(guó)家能源安全的風(fēng)險(xiǎn)。
(3)LLM語(yǔ)料庫(kù)在語(yǔ)種、國(guó)家、類型等方面的不均衡分布,將導(dǎo)致輸出內(nèi)容存在偏見、偏差,如ChatGPT所使用的語(yǔ)料集主要是英語(yǔ)語(yǔ)種,所輸出內(nèi)容的西式價(jià)值觀烙印很深。
(4)數(shù)據(jù)時(shí)效性不強(qiáng),所訓(xùn)練和輸出的主要是過(guò)時(shí)數(shù)據(jù),也會(huì)影響輸出內(nèi)容的真實(shí)性、準(zhǔn)確性和科學(xué)性。如ChatGPT所使用的數(shù)據(jù)主要是2021年以前的數(shù)據(jù),而對(duì)于最新的數(shù)據(jù)、信息和知識(shí)的攝入則處于缺失、缺位狀態(tài),故而無(wú)法解答時(shí)效性的問(wèn)題。
(5)在LLM的使用過(guò)程中,客戶故意做出錯(cuò)誤、誤導(dǎo)性或有傾向性的提問(wèn)或提示,“提示語(yǔ)混入惡意指令,會(huì)繞過(guò)安全機(jī)制,執(zhí)行預(yù)想外指令”[14],導(dǎo)致泄露信息數(shù)據(jù)、輸出有毒有害內(nèi)容等。
在數(shù)據(jù)輸出環(huán)節(jié),LLM容易生成不良信息、有害信息、虛假信息或違法信息,進(jìn)而引起“技術(shù)及倫理風(fēng)險(xiǎn)、虛假信息風(fēng)險(xiǎn)、版權(quán)爭(zhēng)議”[15]等通用風(fēng)險(xiǎn)。同時(shí),受到群體傾向性的影響,會(huì)輸出“政治正確”話語(yǔ)[16],如對(duì)特定人物、事件的數(shù)據(jù)分布不均致使產(chǎn)生輿論誤導(dǎo)、傾向性內(nèi)容輸出的風(fēng)險(xiǎn),一個(gè)有意思的例子是ChatGPT愿意為拜登作詩(shī)頌揚(yáng),但拒絕為特朗普撰寫。
實(shí)踐中已經(jīng)出現(xiàn)了學(xué)生使用ChatGPT撰寫學(xué)術(shù)論文、完成課程作業(yè)的案例,由此衍生出隱蔽型的學(xué)術(shù)不端問(wèn)題,并對(duì)學(xué)術(shù)倫理和學(xué)術(shù)道德規(guī)范產(chǎn)生影響。“此類違反學(xué)術(shù)道德的行為不僅會(huì)侵蝕學(xué)生獨(dú)立的科研能力,而且會(huì)影響學(xué)術(shù)界整體的公平公正性,因此ChatGPT已受到了多所教育機(jī)構(gòu)的明文限制”[17]。
對(duì)論文投機(jī)者而言,AIGC無(wú)疑降低了論文炮制、抄襲的成本,并提供了更多便利。通過(guò)所謂的“整合性”創(chuàng)新所輸出的內(nèi)容,需借助多位作者的聯(lián)合鑒別,且無(wú)法做到阻止隱蔽型學(xué)術(shù)不端行為的發(fā)生。這種對(duì)學(xué)術(shù)倫理規(guī)范行為的挑戰(zhàn),需要引起高度重視,并及時(shí)進(jìn)行建章立制予以規(guī)范。教育界、學(xué)術(shù)界、教師和學(xué)生則需協(xié)同協(xié)作,應(yīng)用“機(jī)器審核機(jī)器”等更高水平AI審核技術(shù)加以監(jiān)督、杜絕。
前述AIGC數(shù)據(jù)來(lái)源和輸出的風(fēng)險(xiǎn)、對(duì)學(xué)術(shù)倫理規(guī)范的挑戰(zhàn),尚且屬于淺層次的風(fēng)險(xiǎn)挑戰(zhàn)。長(zhǎng)期使用AIGC,尤其是ChatGPT等國(guó)外LLM,其深層次的風(fēng)險(xiǎn)是沖擊、削弱或混淆主流意識(shí)形態(tài)和價(jià)值觀念,最終引起核心公共價(jià)值失靈的風(fēng)險(xiǎn)?!叭绻诵墓矁r(jià)值由于政策制定過(guò)程中的缺陷而被限制,或者沒(méi)有足夠的手段確保核心價(jià)值觀的銜接和有效的溝通,或者由于聚合價(jià)值的過(guò)程出現(xiàn)扭曲,那么公共價(jià)值失靈就有可能產(chǎn)生”[18]。
盡管當(dāng)被問(wèn)及“ChatGPT堅(jiān)持什么樣的價(jià)值判斷?有無(wú)自己的核心價(jià)值觀”時(shí),它給出的回答是:ChatGPT是一個(gè)純粹的語(yǔ)言模型,它并沒(méi)有自己的價(jià)值觀,也不會(huì)主動(dòng)進(jìn)行價(jià)值判斷。ChatGPT生成的回答是基于大量的文本數(shù)據(jù)訓(xùn)練得出的統(tǒng)計(jì)規(guī)律,它只是根據(jù)給定的輸入生成對(duì)應(yīng)的輸出,并不會(huì)對(duì)文化安全、意識(shí)形態(tài)安全造成威脅。但是,筆者仍然認(rèn)為使用國(guó)外LLM,其致使核心公共價(jià)值失靈的風(fēng)險(xiǎn)是客觀存在的,且這種風(fēng)險(xiǎn)的發(fā)生是一個(gè)長(zhǎng)期的、潛移默化的過(guò)程:一則,ChatGPT語(yǔ)料庫(kù)多數(shù)為西方數(shù)據(jù)庫(kù),英語(yǔ)語(yǔ)料占比最大,其中新聞報(bào)道、圖書期刊等語(yǔ)料資源不可避免地帶有意識(shí)形態(tài)偏見,含有誤導(dǎo)、詆毀甚至是抹黑我國(guó)主流意識(shí)形態(tài)的內(nèi)容。二則,基于人類反饋的強(qiáng)化學(xué)習(xí)算法的運(yùn)用,目標(biāo)是輸出和人類的認(rèn)知、需求和價(jià)值觀相一致的內(nèi)容。而這里的“價(jià)值觀”對(duì)ChatGPT來(lái)講,默認(rèn)是西式價(jià)值觀,而非社會(huì)主義核心價(jià)值觀。三則,正因?yàn)镃hatGPT生成的回答是基于大量的文本數(shù)據(jù)訓(xùn)練得出的“統(tǒng)計(jì)規(guī)律”,而這個(gè)“統(tǒng)計(jì)規(guī)律”恰恰是建立在西方語(yǔ)料、西方價(jià)值基礎(chǔ)之上,喂養(yǎng)、訓(xùn)練的數(shù)據(jù)是帶有西式價(jià)值觀烙印的,其輸出的內(nèi)容也不可避免地含有意識(shí)形態(tài)偏見或傾向,無(wú)論用戶是否發(fā)現(xiàn),也無(wú)論ChatGPT是否正面回應(yīng)。
AI對(duì)人類職業(yè)的替代是一個(gè)長(zhǎng)期存在的隱憂,幾乎每次在AI取得里程碑式的進(jìn)步時(shí),與之相關(guān)的各行各業(yè)都會(huì)思考這個(gè)問(wèn)題。
簡(jiǎn)言之,ChatGPT將會(huì)直接影響文本相關(guān)工作的職業(yè),如文字編輯、翻譯、新聞?dòng)浾叩???陀^地講,簡(jiǎn)單的文本處理職業(yè)將會(huì)消失,交由生成式AI應(yīng)用來(lái)完成,如郵件自動(dòng)回復(fù)、客觀事實(shí)報(bào)道、客服咨詢和電話熱線解答等。但是,AI無(wú)法勝任原創(chuàng)性特征明顯、原始性創(chuàng)新起主導(dǎo)作用的復(fù)雜文本處理工作,也因此無(wú)法取代人類完成該類工作。
未來(lái)職業(yè)的替代性問(wèn)題,需轉(zhuǎn)換視角,以共生視角去思考可能更為適宜。相當(dāng)多的職業(yè),更有可能會(huì)以人機(jī)協(xié)同、人機(jī)融合、人機(jī)共生的方式出現(xiàn),人類智慧和AI的有機(jī)融合模式,或是以人類為主、機(jī)器協(xié)助,或是以機(jī)器為主、人類協(xié)助。
面對(duì)上述風(fēng)險(xiǎn)與挑戰(zhàn),生成式智能出版無(wú)疑需從調(diào)節(jié)和治理兩個(gè)路徑出發(fā)加以防范與應(yīng)對(duì)。
數(shù)字出版調(diào)節(jié),是指出版系統(tǒng)吸收內(nèi)化數(shù)字技術(shù),調(diào)整自身產(chǎn)業(yè)鏈各環(huán)節(jié)及相關(guān)領(lǐng)域,以形成有序或高級(jí)有序的結(jié)構(gòu)或狀態(tài),包括產(chǎn)業(yè)鏈調(diào)節(jié)、主體調(diào)節(jié)、項(xiàng)目調(diào)節(jié)和制度調(diào)節(jié)等基本范疇[19]。生成式智能出版的調(diào)節(jié)路徑亦可從上述基本范疇出發(fā)加以思考。
其中,生成式智能出版的產(chǎn)業(yè)鏈調(diào)節(jié)是由產(chǎn)品調(diào)節(jié)、技術(shù)調(diào)節(jié)和運(yùn)維調(diào)節(jié)所構(gòu)成的調(diào)節(jié)體系。具體而言:
生成式智能出版產(chǎn)品調(diào)節(jié),須以內(nèi)容建設(shè)為根本,充分發(fā)揮出版業(yè)內(nèi)容資源優(yōu)勢(shì),將出版內(nèi)容與生成式AI技術(shù)有機(jī)融合,研發(fā)出適銷對(duì)路的生成式智能出版產(chǎn)品,如前所述的出版大數(shù)據(jù)、智能知識(shí)服務(wù)、智能機(jī)器人、生成式智能出版物以及元宇宙出版產(chǎn)品等。為適應(yīng)生成式智能出版的發(fā)展趨勢(shì),數(shù)字出版產(chǎn)品調(diào)節(jié)須主動(dòng)推進(jìn)數(shù)字化、數(shù)據(jù)化、智能化建設(shè)。其中,數(shù)字化是前提,數(shù)據(jù)化是關(guān)鍵,智能化是結(jié)果。歷經(jīng)二十余年的發(fā)展,我國(guó)數(shù)字出版產(chǎn)品的分析式智能化取得了階段性成果,如AR/VR出版物強(qiáng)化了內(nèi)容呈現(xiàn)的臨場(chǎng)感,再如出版大數(shù)據(jù)根據(jù)用戶畫像對(duì)出版物進(jìn)行精準(zhǔn)營(yíng)銷和算法推薦等。未來(lái)數(shù)字出版產(chǎn)品的生成式智能化發(fā)展,人機(jī)協(xié)同研發(fā)數(shù)字出版產(chǎn)品,人類智慧與AI的融合,是不可逆的趨勢(shì)。
生成式智能出版的技術(shù)調(diào)節(jié),是數(shù)字出版、智能出版產(chǎn)業(yè)鏈調(diào)節(jié)的重中之重,是生成式智能出版能否成為數(shù)字出版新業(yè)態(tài)、新模式的關(guān)鍵所在。具體而言,生成式智能出版的技術(shù)調(diào)節(jié),須在數(shù)據(jù)、算法和算力三方面著力:
其一,確立出版數(shù)據(jù)生產(chǎn)要素的地位,夯實(shí)出版數(shù)據(jù)底座。出版業(yè)的智能化發(fā)展,離不開對(duì)數(shù)據(jù)要素市場(chǎng)的培育,離不開對(duì)出版業(yè)數(shù)據(jù)服務(wù)系統(tǒng)的構(gòu)建,離不開包含數(shù)據(jù)建設(shè)、共享、開發(fā)、應(yīng)用、維護(hù)在內(nèi)的一體化數(shù)據(jù)治理體系的建立。提高出版業(yè)數(shù)據(jù)要素生產(chǎn)效率,可從以下幾個(gè)方面推進(jìn):(1)確立數(shù)據(jù)理念。將數(shù)據(jù)視為生產(chǎn)要素,制定并落實(shí)“以數(shù)據(jù)為關(guān)鍵要素,以數(shù)據(jù)賦能為主線,以價(jià)值釋放和創(chuàng)造為核心,對(duì)產(chǎn)業(yè)鏈上下游的全要素?cái)?shù)字化轉(zhuǎn)型、升級(jí)、重塑和再造”[20]的出版業(yè)數(shù)字化戰(zhàn)略。(2)推動(dòng)數(shù)據(jù)賦能。建構(gòu)和踐行出版業(yè)數(shù)據(jù)價(jià)值體系,挖掘和實(shí)現(xiàn)出版業(yè)“圖書價(jià)值、數(shù)字化價(jià)值、數(shù)據(jù)化價(jià)值”[21]三位一體的價(jià)值功能。(3)完善數(shù)據(jù)流程。根據(jù)數(shù)據(jù)采集、數(shù)據(jù)清洗、知識(shí)標(biāo)引、數(shù)據(jù)計(jì)算、數(shù)據(jù)建模、知識(shí)圖譜、二次數(shù)據(jù)挖掘等數(shù)據(jù)服務(wù)流程,建立和優(yōu)化出版業(yè)、出版社數(shù)據(jù)服務(wù)體系。這方面,人民法院出版社的“法信”大數(shù)據(jù)平臺(tái)堪稱典范。(4)建立健全出版語(yǔ)料庫(kù)。在無(wú)標(biāo)注文本數(shù)據(jù)方面,構(gòu)建萬(wàn)億級(jí)超大規(guī)模、超高質(zhì)量、門類齊全的語(yǔ)料庫(kù)和數(shù)據(jù)池,涵蓋各行業(yè)、各學(xué)科和各領(lǐng)域;組織出版專家開展高質(zhì)量的有標(biāo)注的文本數(shù)據(jù)建設(shè),至少建立數(shù)萬(wàn)條符合人類偏好的標(biāo)注數(shù)據(jù)。
其二,引入深度學(xué)習(xí)算法技術(shù),探索LLM應(yīng)用。第三次AI熱潮的興起,AlphaGo、元宇宙、ChatGPT等成為AI的里程碑,是大數(shù)據(jù)、深度學(xué)習(xí)算法以及超強(qiáng)算力綜合作用的結(jié)果。因此,要深入推進(jìn)智能出版,健全生成式智能出版產(chǎn)業(yè)鏈,就需要重視并應(yīng)用深度學(xué)習(xí)技術(shù)。在深度學(xué)習(xí)技術(shù)采納、應(yīng)用和創(chuàng)新流程方面,出版企業(yè)宜:(1)基于長(zhǎng)期主義理念,遵循技術(shù)轉(zhuǎn)換式創(chuàng)新規(guī)律,制定科學(xué)合理的技術(shù)創(chuàng)新戰(zhàn)略,引進(jìn)強(qiáng)化學(xué)習(xí)、遷移學(xué)習(xí)等突破性技術(shù)資源。(2)構(gòu)建企業(yè)內(nèi)部高新技術(shù)跨越動(dòng)力體系,保持出版企業(yè)在技術(shù)應(yīng)用和創(chuàng)新方面的戰(zhàn)略定力和韌性,通過(guò)項(xiàng)目申請(qǐng)或自主投入等方式給予耐久性、持續(xù)性財(cái)務(wù)承諾,推動(dòng)出版企業(yè)穿越深度學(xué)習(xí)技術(shù)基礎(chǔ)研究和商業(yè)應(yīng)用之間的“死亡之谷”。(3)抓住技術(shù)跨越的機(jī)會(huì)窗口,形成長(zhǎng)期、合理、穩(wěn)定、可持續(xù)的商業(yè)模式,將路徑轉(zhuǎn)換式創(chuàng)新所得來(lái)的深度學(xué)習(xí)技術(shù)應(yīng)用轉(zhuǎn)化為新的路徑依賴式創(chuàng)新,從而順利完成深度學(xué)習(xí)技術(shù)的路徑轉(zhuǎn)化式技術(shù)蛙跳。在LLM應(yīng)用方面,科研實(shí)力較強(qiáng)、資金雄厚的大型出版集團(tuán),可以考慮聯(lián)合計(jì)算機(jī)、出版領(lǐng)域的科研單位,構(gòu)建中文為主、涵蓋多國(guó)語(yǔ)言的預(yù)訓(xùn)練語(yǔ)料集,輔以人工標(biāo)注數(shù)據(jù),通過(guò)預(yù)訓(xùn)練語(yǔ)言模型的訓(xùn)練、獎(jiǎng)懲模型的訓(xùn)練以及基于強(qiáng)化學(xué)習(xí)進(jìn)行語(yǔ)言模型優(yōu)化,最終形成服務(wù)于宣傳思想文化、服務(wù)于出版業(yè)的LLM。
其三,樹立算力意識(shí),提升智能出版新的生產(chǎn)力。算力,即計(jì)算能力,是指數(shù)據(jù)采集、傳輸、標(biāo)引、關(guān)聯(lián)、計(jì)算和存儲(chǔ)等能力。算力是數(shù)字化、智能化服務(wù)的核心,是數(shù)字經(jīng)濟(jì)、數(shù)字出版、智能出版發(fā)展的新動(dòng)能和新引擎。整體而言,出版業(yè)算力意識(shí)較為薄弱,還沒(méi)有意識(shí)到智能出版時(shí)代算力如同電力一樣,將成為數(shù)據(jù)挖掘、模型訓(xùn)練的基礎(chǔ)支撐和核心引擎。大多數(shù)出版企業(yè)對(duì)算力的理解尚且停留在服務(wù)器購(gòu)置、機(jī)房建設(shè)、云服務(wù)等具體事宜層面,沒(méi)有對(duì)算力的內(nèi)涵、構(gòu)成、應(yīng)用和影響形成全面、科學(xué)的認(rèn)知。生成式智能出版的發(fā)展,迫切要求出版業(yè)確立算力意識(shí),提升計(jì)算能力和存儲(chǔ)能力,認(rèn)知、理解并及時(shí)應(yīng)用云計(jì)算、邊緣計(jì)算、終端計(jì)算等技術(shù),以進(jìn)一步夯實(shí)出版業(yè)數(shù)智化轉(zhuǎn)型的基礎(chǔ)。
生成式智能出版的運(yùn)維調(diào)節(jié),需在智能出版的運(yùn)營(yíng)和維護(hù)環(huán)節(jié),積極應(yīng)用生成式AI技術(shù),以提升智能出版產(chǎn)品服務(wù)的營(yíng)銷效能和維護(hù)質(zhì)量。具體而言,出版營(yíng)銷的征訂單、宣傳文案、新書發(fā)布會(huì)方案等,可首先借助AI加以生成,輔之以出版營(yíng)銷編輯的審核、修改和確定,從而起到減少人力資源投入、提高出版營(yíng)銷效能的積極作用。出版客服、售后等運(yùn)維工作,尤其是數(shù)字出版等線上客服工作,可交由生成式AI來(lái)優(yōu)先承擔(dān),在智能語(yǔ)音解答不能滿足用戶需求時(shí),再轉(zhuǎn)交出版營(yíng)銷編輯來(lái)接手;或在非工作時(shí)間交由生成式AI承擔(dān),以發(fā)揮生成式AI技術(shù)的新生產(chǎn)力作用,保障勞動(dòng)者的工作權(quán)、休息權(quán)等合法權(quán)益。另外,還可結(jié)合虛擬數(shù)字人技術(shù),研發(fā)承擔(dān)出版營(yíng)銷推廣任務(wù)的孿生數(shù)字人或虛擬數(shù)字人,自動(dòng)生成、播放或講述出版營(yíng)銷的AIGC文案,實(shí)時(shí)進(jìn)行人機(jī)語(yǔ)音交互,在元宇宙、云展覽、云演藝等場(chǎng)景實(shí)施出版產(chǎn)品和品牌的營(yíng)銷推廣。
生成式智能出版的主體調(diào)節(jié),是指數(shù)字出版編輯在原有的政治素質(zhì)、出版專業(yè)能力之外,自覺提升自身數(shù)字素養(yǎng)與技能,形成“由數(shù)字化適應(yīng)力、數(shù)字化勝任力、數(shù)字化創(chuàng)造力所構(gòu)成的三位一體的編輯數(shù)字素養(yǎng)體系和數(shù)字技能體系”[22],以適應(yīng)生成式智能出版發(fā)展的需要,適應(yīng)出版業(yè)智能化、高質(zhì)量發(fā)展的需要??傮w而言,數(shù)字出版編輯應(yīng)自覺提升數(shù)字素養(yǎng)與技能,培養(yǎng)數(shù)字意識(shí)、計(jì)算思維、終身學(xué)習(xí)能力、網(wǎng)絡(luò)文明與道德修養(yǎng)以及社會(huì)責(zé)任感,使自身成為合格的數(shù)字公民。具體來(lái)講,應(yīng)提高自身的數(shù)字化適應(yīng)力,主動(dòng)確立數(shù)字化理念,強(qiáng)化數(shù)字化思維,適應(yīng)數(shù)字化工作崗位,掌握和運(yùn)用數(shù)字知識(shí)尤其是AI相關(guān)知識(shí)和技術(shù);應(yīng)不斷增強(qiáng)自身的數(shù)字化勝任力,在學(xué)習(xí)、理解、運(yùn)用生成式AI技術(shù)的基礎(chǔ)之上,勝任生成式智能出版產(chǎn)品服務(wù)策劃、研發(fā)等技術(shù)應(yīng)用以及基于生成式AI的出版營(yíng)銷工作;應(yīng)培養(yǎng)和鍛造自身的數(shù)字化創(chuàng)造力,基于數(shù)字知識(shí)、技術(shù)和智慧,著力推動(dòng)出版領(lǐng)域的生成式AI技術(shù)的創(chuàng)新應(yīng)用,引領(lǐng)和帶動(dòng)生成式智能出版產(chǎn)品、運(yùn)營(yíng)、模式、業(yè)態(tài)和管理等全方位的創(chuàng)新。
此外,生成式智能出版調(diào)節(jié)路徑還包括積極申報(bào)和實(shí)施重大文化產(chǎn)業(yè)項(xiàng)目,以重大項(xiàng)目、重大工程為抓手、為杠桿,切實(shí)推進(jìn)生成式AI技術(shù)在出版業(yè)的落地、應(yīng)用和推廣;還包括建立健全生成式AI技術(shù)應(yīng)用的制度體系,營(yíng)造鼓勵(lì)、支持和包容生成式智能出版發(fā)展的氛圍和環(huán)境。
上述調(diào)節(jié)路徑,旨在從市場(chǎng)一側(cè)推動(dòng)生成式智能出版的發(fā)展,推動(dòng)生成式智能出版新產(chǎn)品、新業(yè)態(tài)、新模式不斷涌現(xiàn),推動(dòng)AIGC技術(shù)原理與出版業(yè)的應(yīng)用場(chǎng)景深度融合。而治理路徑,則旨在發(fā)揮保障和規(guī)制作用,應(yīng)對(duì)生成式AI技術(shù)的風(fēng)險(xiǎn)與挑戰(zhàn),確保生成式AI技術(shù)發(fā)揮正價(jià)值,堅(jiān)持技術(shù)向善,確保生成式智能出版在健康、穩(wěn)步、可持續(xù)、高質(zhì)量發(fā)展的道路上不斷前行。具體而言,包括以下幾個(gè)方面。
維護(hù)意識(shí)形態(tài)安全,堅(jiān)持以主流價(jià)值導(dǎo)向駕馭算法程序。如前所述,ChatGPT等AIGC產(chǎn)品深層次的風(fēng)險(xiǎn)挑戰(zhàn)是沖擊、削弱或混淆主流意識(shí)形態(tài)和價(jià)值觀念。因此,生成式智能出版的首要治理路徑在于堅(jiān)守意識(shí)形態(tài)陣地,確保意識(shí)形態(tài)安全,堅(jiān)持以核心價(jià)值觀引領(lǐng)生成式AI出版產(chǎn)品和服務(wù)行為,確保生成式智能出版產(chǎn)品和服務(wù)蘊(yùn)含正確的核心價(jià)值觀,以起到潛移默化、春風(fēng)化雨式的培養(yǎng)、教育和踐行效果。出版主管部門宜在相關(guān)的部委規(guī)章或管理辦法中明確提出符合主流意識(shí)形態(tài)、體現(xiàn)核心價(jià)值觀的相關(guān)規(guī)定。同時(shí),在具體行政行為方面,可在新媒體采編、報(bào)紙、期刊、圖書質(zhì)量檢查中,增加關(guān)于生成式AI服務(wù)監(jiān)督和檢查的規(guī)定,確保所提供的生成式智能服務(wù)符合主流意識(shí)形態(tài),與核心價(jià)值觀保持一致。
推進(jìn)法律治理,確保生成式智能出版在法律規(guī)則內(nèi)運(yùn)行。在立法層面,主管部門宜根據(jù)《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》《出版管理?xiàng)l例》等法律和行政法規(guī),制定部委規(guī)章、地方政府規(guī)章或規(guī)范性文件,以指導(dǎo)生成式AI出版服務(wù)。在執(zhí)法和司法層面,對(duì)利用生成式AI提供服務(wù),但危害國(guó)家安全、意識(shí)形態(tài)安全、文化安全、侵害知識(shí)產(chǎn)權(quán)、損害人格權(quán)等違法犯罪行為,要堅(jiān)決予以懲處。在守法層面,提供生成式AI服務(wù)的平臺(tái)和個(gè)人,要遵守相關(guān)法律規(guī)定,堅(jiān)持技術(shù)向善,發(fā)揮技術(shù)正價(jià)值,做負(fù)責(zé)任的創(chuàng)新主體。同時(shí),廣大用戶、版權(quán)協(xié)會(huì)、出版協(xié)會(huì)等發(fā)現(xiàn)AIGC有違反法律規(guī)定、社會(huì)公德、商業(yè)道德的情形時(shí),可行使監(jiān)督權(quán),向有關(guān)部門予以舉報(bào),以確保網(wǎng)絡(luò)空間的風(fēng)清氣正,確保生成式智能出版服務(wù)健康有序發(fā)展。
有效實(shí)施重大文化產(chǎn)業(yè)項(xiàng)目帶動(dòng)戰(zhàn)略,適時(shí)研發(fā)中文知識(shí)本體為主的LLM。實(shí)施宏觀調(diào)控舉措,發(fā)揮重大文化產(chǎn)業(yè)項(xiàng)目帶動(dòng)效應(yīng),有助于從舉國(guó)體制的高度來(lái)解決生成式AI的經(jīng)營(yíng)和管理問(wèn)題。構(gòu)建中文知識(shí)本體為主的語(yǔ)料集和LLM,是化解意識(shí)形態(tài)和文化安全風(fēng)險(xiǎn),應(yīng)對(duì)國(guó)外生成式AI服務(wù)挑戰(zhàn)的有效舉措和“國(guó)之大者”。對(duì)構(gòu)建生成式智能出版的語(yǔ)料集、LLM等關(guān)鍵難題,可通過(guò)文化產(chǎn)業(yè)發(fā)展專項(xiàng)資金、國(guó)有資本經(jīng)營(yíng)預(yù)算金、國(guó)家出版基金等渠道設(shè)立重大項(xiàng)目或重大工程來(lái)予以攻克。
堅(jiān)持標(biāo)準(zhǔn)先行,建立、健全、宣貫和落實(shí)生成式智能出版標(biāo)準(zhǔn)。一如《出版物AR技術(shù)應(yīng)用規(guī)范》《出版物VR技術(shù)應(yīng)用要求》對(duì)出版業(yè)AR/VR技術(shù)應(yīng)用的規(guī)制,《出版物AIGC應(yīng)用要求》等行業(yè)標(biāo)準(zhǔn)、團(tuán)體標(biāo)準(zhǔn)和企業(yè)標(biāo)準(zhǔn)體系也亟待建立和完善。在內(nèi)容上,該類標(biāo)準(zhǔn)宜包含AIGC的建議性規(guī)定、禁止性規(guī)定,明確利用生成式AI技術(shù)開展智能出版產(chǎn)品服務(wù)的流程、角色和職責(zé),規(guī)范用戶、平臺(tái)、社會(huì)組織在生成式智能出版服務(wù)提供過(guò)程中的行為等。同時(shí),生成式智能出版標(biāo)準(zhǔn)體系的宣傳貫徹、落地培訓(xùn)和反饋考評(píng)機(jī)制也有待建立并迫切需要在出版業(yè)落地實(shí)踐。
最后,提升數(shù)字治理能力,以數(shù)字治理提升出版治理效能。數(shù)字治理是數(shù)字出版治理的一項(xiàng)基本原則,是一種新型治理方式和手段,也是數(shù)字社會(huì)的全新治理范式,其治理要點(diǎn)在于以數(shù)據(jù)治理為重點(diǎn),善用數(shù)字技術(shù)工具,不斷提升企業(yè)微觀治理效率和行業(yè)宏觀治理效能。生成式智能出版的數(shù)據(jù)治理,包含對(duì)語(yǔ)料集、LLM中的數(shù)據(jù)內(nèi)容、數(shù)據(jù)類型、數(shù)據(jù)時(shí)效等全方位的管理和監(jiān)督,也包含對(duì)內(nèi)容數(shù)據(jù)、用戶數(shù)據(jù)和交互數(shù)據(jù)的建設(shè)與使用。同時(shí),行業(yè)級(jí)的數(shù)據(jù)治理平臺(tái)和企業(yè)級(jí)的數(shù)據(jù)治理平臺(tái)也有待建立,以切實(shí)在出版治理實(shí)踐中發(fā)揮應(yīng)有作用和價(jià)值。
或許,當(dāng)筆者提及生成式智能出版這一概念時(shí),尚有部分學(xué)界或業(yè)界同仁覺得為時(shí)過(guò)早。但回首2017年底左右發(fā)表的《出版+人工智能:未來(lái)出版的新模式與形態(tài)》《出版+人工智能:智能出版流程再造》兩篇文章,其中提到的AR出版、VR出版、知識(shí)服務(wù)、出版大數(shù)據(jù)等智能出版場(chǎng)景均已落地并在產(chǎn)品、技術(shù)、標(biāo)準(zhǔn)等方面取得了一系列成果,成為新興出版最有活力、最具潛力的組成部分。
抱以未來(lái)學(xué)的視角,生成式智能出版會(huì)在出版大數(shù)據(jù)、LLM、高維度智能知識(shí)服務(wù)、出版+智能機(jī)器人、生成式智能出版物以及元宇宙出版等新產(chǎn)品、新業(yè)態(tài)和新場(chǎng)景方面取得實(shí)質(zhì)性突破。在硬幣的另一面,生成式智能出版也同樣面臨著數(shù)據(jù)來(lái)源和使用風(fēng)險(xiǎn)、學(xué)術(shù)倫理挑戰(zhàn)、核心價(jià)值觀堅(jiān)守挑戰(zhàn)甚至是人類職業(yè)的替代性隱憂。為此,本文提出了確立出版數(shù)據(jù)生產(chǎn)要素地位、探索LLM應(yīng)用、樹立算力意識(shí),以及強(qiáng)化數(shù)字出版編輯素養(yǎng)和技能等數(shù)字出版調(diào)節(jié)路徑,指出了以主流價(jià)值駕馭算法程序、推進(jìn)法律治理、實(shí)施重大項(xiàng)目帶動(dòng)、研制應(yīng)用生成式智能出版標(biāo)準(zhǔn)以及提升數(shù)字治理效能等數(shù)字出版治理路徑。
作者貢獻(xiàn)說(shuō)明
張新新:總體框架設(shè)計(jì),論文撰寫;
黃如花:論文修改。