生成式智能出版的應(yīng)用場(chǎng)景、風(fēng)險(xiǎn)挑戰(zhàn)與調(diào)治路徑

2023-10-28 13:40:40張新新黃如花

圖書情報(bào)知識(shí) 2023年5期

張新新黃如花

隨著ChatGPT躋身史上用戶增長(zhǎng)速度最快的互聯(lián)網(wǎng)應(yīng)用程序，生成式人工智能（Generative AI）技術(shù)以其卓越的算法、算力和數(shù)據(jù)優(yōu)勢(shì)，迅速成為社會(huì)關(guān)注的焦點(diǎn)和熱點(diǎn)，并將長(zhǎng)遠(yuǎn)而深刻地影響著傳媒、教育、營(yíng)銷、咨詢、翻譯等行業(yè)。

生成式AI技術(shù)作用于出版流程內(nèi)部，推動(dòng)著專業(yè)生成內(nèi)容（professional generated content, PGC）走向人工智能生成內(nèi)容（artificial intelligence generated content,AIGC），人工編校走向人機(jī)協(xié)同編校，按需印刷和智能印廠場(chǎng)景的進(jìn)一步豐富以及出版營(yíng)銷效率、動(dòng)力和質(zhì)量變革。生成式AI 技術(shù)作用于出版外部，將會(huì)催生一系列智能出版新產(chǎn)品、新業(yè)態(tài)和新模式，同時(shí)也面臨著數(shù)據(jù)、版權(quán)、價(jià)值等多方面的風(fēng)險(xiǎn)和挑戰(zhàn)，因此需要在分析場(chǎng)景創(chuàng)新、識(shí)別風(fēng)險(xiǎn)挑戰(zhàn)的基礎(chǔ)上，進(jìn)一步提出生成式智能出版的調(diào)節(jié)路徑和治理路徑。

1 生成式智能出版的多維應(yīng)用場(chǎng)景

分析式AI主要發(fā)力于對(duì)現(xiàn)有事物的解釋、呈現(xiàn)、表達(dá)與推薦方面，能夠提高用戶的智能化體驗(yàn)，目前應(yīng)用于新聞出版領(lǐng)域的AI技術(shù)多為分析式AI。生成式AI旨在生成新的信息、數(shù)據(jù)和知識(shí)，可以生成文字、圖片、音頻、視頻、3D模型、虛擬環(huán)境等多模態(tài)內(nèi)容。較分析式AI，生成式AI在通往賦予機(jī)器智能化的道路上實(shí)質(zhì)性地邁出了一大步，使機(jī)器產(chǎn)生了智能化的自主思維與意識(shí)。

分析式AI技術(shù)已創(chuàng)造出諸多智能出版應(yīng)用場(chǎng)景，如出版大數(shù)據(jù)、智能知識(shí)服務(wù)、增強(qiáng)現(xiàn)實(shí)（augmented reality，AR）智能出版、虛擬現(xiàn)實(shí)（virtual reality，AR）智能出版、在線教育智能化[1]。隨著生成式AI技術(shù)的深層次應(yīng)用，這些智能出版場(chǎng)景將會(huì)得到進(jìn)一步的豐富、深化或拓新，并推動(dòng)眾多新的應(yīng)用場(chǎng)景出現(xiàn)，如圖1所示。

圖1 生成式智能出版的多維應(yīng)用場(chǎng)景Fig.1 Multidimensional Application Scenarios of Generative Intelligent Publishing

1.1 出版大數(shù)據(jù)與大規(guī)模語(yǔ)言模型

缺乏數(shù)據(jù)的喂養(yǎng)和訓(xùn)練，再好的強(qiáng)化算法技術(shù)也無(wú)法催生ChatGPT等生成式AI產(chǎn)品，海量數(shù)據(jù)語(yǔ)料庫(kù)是生成式AI技術(shù)勃興的前提、基礎(chǔ)和底座。ChatGPT等生成式AI產(chǎn)品的研發(fā)過(guò)程，給予出版業(yè)的重要啟示首先在于重視數(shù)據(jù)建設(shè)，把數(shù)據(jù)作為生產(chǎn)要素、作為新能源、作為推動(dòng)出版業(yè)高質(zhì)量發(fā)展的新動(dòng)能。

數(shù)據(jù)要素是指對(duì)客觀事物的性質(zhì)、狀態(tài)及關(guān)系進(jìn)行記錄的物理符號(hào)或符號(hào)組合，是未經(jīng)加工的數(shù)字和事實(shí)，大數(shù)據(jù)語(yǔ)境下對(duì)數(shù)據(jù)的使用重在強(qiáng)調(diào)相關(guān)關(guān)系；信息則是指經(jīng)過(guò)處理、專題化的數(shù)據(jù)，于出版業(yè)而言，信息服務(wù)也能構(gòu)成一種專業(yè)的出版知識(shí)服務(wù)模式；知識(shí)則是經(jīng)過(guò)實(shí)踐檢驗(yàn)被證明是正確的信息。隨著大數(shù)據(jù)時(shí)代的到來(lái)，數(shù)據(jù)作為一種生產(chǎn)要素，其重要性越來(lái)越受到重視，但出版業(yè)對(duì)數(shù)據(jù)要素的認(rèn)知、理解和運(yùn)用還有較大的提升空間。正如《大數(shù)據(jù)時(shí)代》的作者所述，（西方國(guó)家）出版社“沒(méi)有把書籍的數(shù)據(jù)價(jià)值挖掘出來(lái)，也不允許別人這樣做。他們沒(méi)有看到數(shù)據(jù)化的需求，也意識(shí)不到書籍的數(shù)據(jù)化潛力”[2]。同樣，我國(guó)出版業(yè)在數(shù)據(jù)要素配置方面也存在數(shù)據(jù)理念缺失、數(shù)據(jù)思維薄弱、數(shù)據(jù)價(jià)值挖掘不充分、數(shù)據(jù)產(chǎn)業(yè)鏈缺位、數(shù)據(jù)治理缺失等問(wèn)題。

基于生成式AI技術(shù)，未來(lái)出版業(yè)的數(shù)據(jù)應(yīng)用場(chǎng)景至少包括：其一，出版內(nèi)部數(shù)據(jù)資料庫(kù)建設(shè)，再造一個(gè)網(wǎng)絡(luò)版出版機(jī)構(gòu)。通過(guò)對(duì)出版社歷史上的每一本書、每一位作者、每一位用戶等進(jìn)行數(shù)據(jù)化處理，積累豐富的內(nèi)容數(shù)據(jù)、用戶數(shù)據(jù)和交互數(shù)據(jù)；進(jìn)而通過(guò)數(shù)據(jù)的調(diào)取、識(shí)別、再現(xiàn)，架構(gòu)出版社內(nèi)部的數(shù)據(jù)池，構(gòu)建起一個(gè)由內(nèi)容數(shù)據(jù)、用戶數(shù)據(jù)、交互數(shù)據(jù)構(gòu)成的數(shù)字化出版企業(yè)。其二，垂直型知識(shí)服務(wù)大數(shù)據(jù)建設(shè)。在完成出版社內(nèi)部數(shù)據(jù)建設(shè)的基礎(chǔ)上，通過(guò)數(shù)據(jù)交換、數(shù)據(jù)共享、增量數(shù)據(jù)建設(shè)等方式，不斷擴(kuò)充數(shù)據(jù)規(guī)模，逐步形成可以服務(wù)垂直領(lǐng)域的知識(shí)服務(wù)大數(shù)據(jù)，如法院出版社的法信大數(shù)據(jù)、知識(shí)產(chǎn)權(quán)出版社的DI Inspiro大數(shù)據(jù)等。其三，面向出版領(lǐng)域的大規(guī)模語(yǔ)言模型（large language model, LLM）建設(shè)。對(duì)此，須充分發(fā)揮重大文化產(chǎn)業(yè)項(xiàng)目帶動(dòng)戰(zhàn)略，用好文化產(chǎn)業(yè)、出版業(yè)的宏觀調(diào)控體制優(yōu)勢(shì)，從國(guó)家層面著手啟動(dòng)旨在維護(hù)意識(shí)形態(tài)陣地安全、文化安全和內(nèi)容安全的出版業(yè)LLM工程：一方面，籌建包含中文書籍、報(bào)刊、網(wǎng)絡(luò)百科等在內(nèi)的超大規(guī)模語(yǔ)料集，并聘請(qǐng)出版專家進(jìn)行少量、高質(zhì)量的人工標(biāo)記語(yǔ)料集建設(shè)；另一方面，可在國(guó)內(nèi)LLM的基礎(chǔ)上，通過(guò)對(duì)出版語(yǔ)料集的訓(xùn)練，運(yùn)用基于人類反饋的強(qiáng)化學(xué)習(xí)算法，確保模型輸出內(nèi)容在表達(dá)方式、安全性、價(jià)值觀方面與主流意識(shí)形態(tài)相適應(yīng)。

1.2 升維發(fā)展的智能知識(shí)服務(wù)

此前筆者在《出版+人工智能: 未來(lái)出版的新模式與新形態(tài)》一文中提及“智能知識(shí)服務(wù)”，著重論及知識(shí)計(jì)算等關(guān)鍵技術(shù)，以及涵蓋幾十億實(shí)體規(guī)模的跨領(lǐng)域、跨學(xué)科、跨媒體、多數(shù)據(jù)類型的知識(shí)圖譜構(gòu)建；后續(xù)筆者在國(guó)家標(biāo)準(zhǔn)《新聞出版知識(shí)服務(wù) 知識(shí)資源建設(shè)與服務(wù)工作指南》最后一條專門提出“智能知識(shí)服務(wù)”，即“以人工智能技術(shù)為依托，借助大數(shù)據(jù)開展知識(shí)體系構(gòu)建、知識(shí)計(jì)算、知識(shí)圖譜構(gòu)建，開展機(jī)器撰稿、新聞推薦、智能選題策劃、智能審校、智能印刷、智能發(fā)行、智能機(jī)器人等服務(wù)方式”[3]。

不難看出，之前論述或規(guī)定的“智能知識(shí)服務(wù)”，主要強(qiáng)調(diào)基于分析式AI技術(shù)的應(yīng)用，如新聞推薦、知識(shí)體系構(gòu)建、知識(shí)計(jì)算等，以及基于淺層次的生成式AI技術(shù)應(yīng)用，如機(jī)器撰稿等。其所提供的知識(shí)服務(wù)主要是采取“提問(wèn)-檢索-適配-推送”的基本邏輯，沒(méi)有體現(xiàn)AI生成的邏輯；智能知識(shí)服務(wù)的“智能”也主要體現(xiàn)在基于知識(shí)計(jì)算的隱性知識(shí)推導(dǎo)和知識(shí)服務(wù)，沒(méi)有觸及提供知識(shí)產(chǎn)品、信息服務(wù)和知識(shí)解決方案的機(jī)器本體“智能”問(wèn)題。一言以蔽之，其還停留在傳統(tǒng)知識(shí)服務(wù)的階段。

ChatGPT兼具人類自然加持和大規(guī)模復(fù)雜系統(tǒng)的涌現(xiàn)能力，重塑了知識(shí)服務(wù)的生命形態(tài)，也對(duì)傳統(tǒng)知識(shí)服務(wù)造成降維式打擊[4]。作為知識(shí)服務(wù)提供商，與其被動(dòng)地被降維打擊，倒不如主動(dòng)擁抱新技術(shù)、積極應(yīng)用新技術(shù)，做到知識(shí)服務(wù)的升維發(fā)展。在生成式AI技術(shù)的推動(dòng)、影響和啟發(fā)下，智能知識(shí)服務(wù)至少包含以下幾層含義。

一則，圍繞“知識(shí)體系”進(jìn)行邏輯建構(gòu)。知識(shí)體系的重要性越來(lái)越凸顯，宏觀來(lái)看，無(wú)論是哲學(xué)、自然科學(xué)抑或社會(huì)科學(xué)，其學(xué)科體系、學(xué)術(shù)體系和話語(yǔ)體系的構(gòu)建歸根到底要推進(jìn)自主知識(shí)體系建設(shè)，持續(xù)推動(dòng)理論、知識(shí)和方法的創(chuàng)新。從生成式AI視角進(jìn)行微觀分析，ChatGPT之所以獲得認(rèn)可，除了其采用了基于人類反饋的強(qiáng)化學(xué)習(xí)算法、更加適人化的輸出方式外，更重要的是發(fā)現(xiàn)了知識(shí)元之間的邏輯關(guān)系、形成了思維鏈，從而能夠?qū)崿F(xiàn)內(nèi)容的復(fù)雜推理。而知識(shí)元之間的邏輯關(guān)系，是知識(shí)體系構(gòu)建的核心內(nèi)容。因此，未來(lái)智能知識(shí)服務(wù)的中心任務(wù)便是構(gòu)建更為全面、更加科學(xué)、適用范圍更廣的知識(shí)體系，包括基于海量語(yǔ)料庫(kù)的歸納式構(gòu)建和基于書籍、百科網(wǎng)站的演繹式構(gòu)建。

二則，圍繞“智能”創(chuàng)設(shè)應(yīng)用場(chǎng)景。知識(shí)服務(wù)的“智能化”是未來(lái)知識(shí)服務(wù)發(fā)展的關(guān)鍵所在。知識(shí)體系的自動(dòng)構(gòu)建，數(shù)據(jù)、信息和知識(shí)的自動(dòng)生成，用戶知識(shí)問(wèn)題解決方案的集成式創(chuàng)新解答，圖文聲像影、3D模型、虛擬環(huán)境等多模態(tài)知識(shí)需求的全方位回應(yīng)，視、聽、味、嗅、觸等聯(lián)覺體驗(yàn)的智能推送，等等，這些或可成為未來(lái)智能知識(shí)服務(wù)的努力方向和重要發(fā)力點(diǎn)。

三則，由“檢索推送”走向“生成解答”。根據(jù)用戶提問(wèn)，在已有知識(shí)庫(kù)中進(jìn)行檢索，而后推送給用戶以解答知識(shí)問(wèn)題的“檢索推送”范式將成為歷史。取而代之的是根據(jù)用戶提問(wèn)、自主生成滿足用戶知識(shí)需求的“生成解答”范式。這也意味著以往基于感知智能的“產(chǎn)品驅(qū)動(dòng)型、信息驅(qū)動(dòng)型、政策驅(qū)動(dòng)型、技術(shù)驅(qū)動(dòng)型”[5]的知識(shí)服務(wù)模式將逐步被智慧驅(qū)動(dòng)型知識(shí)服務(wù)模式所取代，意味著人類智慧與AI的高度協(xié)同、深度融合，將推動(dòng)智慧驅(qū)動(dòng)型知識(shí)服務(wù)模式向生成式智能驅(qū)動(dòng)型知識(shí)服務(wù)的方向升級(jí)和邁進(jìn)。

四則，知識(shí)服務(wù)主體的人機(jī)協(xié)同。且不論法律或規(guī)則層面的主體含義，至少在事實(shí)層面，智能知識(shí)服務(wù)的主體不再限定在“人”“法人”的范圍內(nèi)，而是延伸至AI或機(jī)器。解決用戶知識(shí)問(wèn)題的答案，即數(shù)據(jù)、信息或知識(shí)，不再簡(jiǎn)單由人類直接提供，而是AI在語(yǔ)料庫(kù)的基礎(chǔ)上進(jìn)行集成式創(chuàng)新、整合式創(chuàng)新而予以提供的。簡(jiǎn)言之，即“AI生成答案以解決知識(shí)問(wèn)題需求”。由此，人類和機(jī)器共同作為知識(shí)服務(wù)主體，以人機(jī)協(xié)同、人機(jī)融合的方式提供知識(shí)服務(wù)，滿足人們學(xué)習(xí)、求知、閱讀等需要，已然是不爭(zhēng)的事實(shí)。

1.3 智能決策的出版領(lǐng)域智能機(jī)器人

智能機(jī)器人是行為智能的代表[6]。新聞出版業(yè)的智能機(jī)器人在機(jī)器人實(shí)體、傳感器、效應(yīng)器和執(zhí)行器層面都有其特殊性，須充分結(jié)合內(nèi)容產(chǎn)業(yè)的優(yōu)勢(shì)和特點(diǎn)，重點(diǎn)在控制器的語(yǔ)音知識(shí)庫(kù)和交互功能方面發(fā)力[7]。

在以分析式AI為代表的時(shí)代，智能機(jī)器人以禮儀機(jī)器人、智能盤點(diǎn)機(jī)器人、智慧圖書館的智能管理機(jī)器人等形態(tài)在圖書館領(lǐng)域得到廣泛應(yīng)用。新聞?lì)I(lǐng)域主要以撰稿機(jī)器人形態(tài)出現(xiàn)，如國(guó)外華盛頓郵報(bào)的Heliograf、美聯(lián)社的WordSmith以及紐約時(shí)報(bào)的blossom等；國(guó)內(nèi)新華社的“快筆小新”、騰訊的Dreamwriter（夢(mèng)幻寫手）、第一財(cái)經(jīng)的“DT稿王”、今日頭條的“張小明”等。出版領(lǐng)域的應(yīng)用，則包括智能銷售機(jī)器人、智能教育機(jī)器人和智能倉(cāng)儲(chǔ)機(jī)器人等[8]。

ChatGPT等生成式AI產(chǎn)品的推廣和普及，將智能出版由分析式智能出版推向生成式智能出版的發(fā)展階段，也使得新聞出版領(lǐng)域的智能機(jī)器人再次獲得難得的發(fā)展機(jī)遇。具體來(lái)講，生成式智能將推動(dòng)出版領(lǐng)域智能機(jī)器人實(shí)現(xiàn)以下兩方面的應(yīng)用場(chǎng)景創(chuàng)新：（1）控制器的決策功能將進(jìn)一步優(yōu)化?？刂破髯鳛闄C(jī)器人的大腦，決定著機(jī)器人的自主行為，是機(jī)器人“思維”“決策”功能的主要承載儀器。較出版機(jī)構(gòu)以往主導(dǎo)研發(fā)的教育機(jī)器人、科普機(jī)器人，海量語(yǔ)料集、LLM的成功運(yùn)用，使出版領(lǐng)域的智能機(jī)器人可以在控制器層面有效調(diào)動(dòng)在線知識(shí)庫(kù)，調(diào)用LLM的數(shù)據(jù)和算法，從而起到更好的人機(jī)交互效果，更好地滿足用戶的學(xué)習(xí)、教育、聽讀等方面的知識(shí)服務(wù)需求。由此也推動(dòng)出版領(lǐng)域智能機(jī)器人控制器的研發(fā)路徑由“內(nèi)置式知識(shí)庫(kù)”范式轉(zhuǎn)向“在線版LLM”范式。這種研發(fā)路徑的轉(zhuǎn)向，將極大地提升出版領(lǐng)域智能機(jī)器人的認(rèn)知、思維和決策能力，在質(zhì)的層面提高出版領(lǐng)域智能機(jī)器人的決策功能、交互功能和用戶體驗(yàn)感。（2）出版領(lǐng)域智能機(jī)器人應(yīng)用場(chǎng)景多元化、立體化拓展。眾人耳熟能詳?shù)氖?，繪本閱讀機(jī)器人、早教機(jī)器人、銷售機(jī)器人等多元智能機(jī)器人已在出版業(yè)嶄露頭角。但生成式AI技術(shù)到來(lái)之前的出版領(lǐng)域機(jī)器人，呈現(xiàn)出千篇一律、虛有其表的短板，往往側(cè)重于簡(jiǎn)單的故事、兒歌、詩(shī)歌等內(nèi)容的普及以及較低程度的語(yǔ)音交互功能應(yīng)用。今后，隨著前述出版大數(shù)據(jù)和出版領(lǐng)域LLM的建設(shè)與發(fā)展，智能教育機(jī)器人的語(yǔ)音知識(shí)庫(kù)將會(huì)以LLM的身份出現(xiàn)，知識(shí)問(wèn)答、課程資源查詢、高水平人機(jī)交互等功能將會(huì)更上一層樓。知識(shí)服務(wù)機(jī)器人將成為出版領(lǐng)域智能機(jī)器人應(yīng)用的下一個(gè)風(fēng)口，垂直領(lǐng)域的海量語(yǔ)料庫(kù)+LLM，將實(shí)質(zhì)性推動(dòng)知識(shí)服務(wù)機(jī)器人提供數(shù)量更多、服務(wù)更專業(yè)、獲取更便捷的知識(shí)問(wèn)答與檢索服務(wù)，從而使得知識(shí)服務(wù)機(jī)器人成為智能出版的新產(chǎn)品和新業(yè)態(tài)。此外，智能銷售機(jī)器人，可以根據(jù)讀者個(gè)性化、定制化的圖書需求，基于語(yǔ)料庫(kù)和LLM，生成更加專業(yè)、更有針對(duì)性的圖書情報(bào)、宣傳廣告，從而為讀者提供體驗(yàn)感更佳的圖書推薦和營(yíng)銷服務(wù)。

1.4 生成式智能出版物

生成式智能出版物，是指應(yīng)用生成式AI技術(shù)的出版產(chǎn)品，是融合AI和人類智慧的出版產(chǎn)品。生成式智能出版物，一方面是指基于AIGC的智能出版產(chǎn)品或服務(wù)，如世界上首本由AI創(chuàng)作而成的實(shí)驗(yàn)小說(shuō)——1 The Road，再如前述由微軟小冰、ChatGPT和其他AIGC應(yīng)用所創(chuàng)作的詩(shī)歌、論文、專著、繪畫、音樂(lè)作品等；另一方面，也指人機(jī)共生、人機(jī)協(xié)同語(yǔ)境下研發(fā)的智能出版產(chǎn)品服務(wù)，如法院社的《智慧辦案手冊(cè)》，有道AI機(jī)器翻譯、人工團(tuán)隊(duì)審核修訂的《極簡(jiǎn)區(qū)塊鏈》圖書等。生成式智能出版物的創(chuàng)作、生成由AI全部完成、主要完成或參與完成。但是，后續(xù)的編校印發(fā)各環(huán)節(jié)仍然離不開人類智慧，離不開出版編輯的時(shí)間、精力和智慧付出。

鑒于AIGC集成性創(chuàng)新特征突出、語(yǔ)料庫(kù)的價(jià)值觀烙印以及自然人用戶個(gè)性化服務(wù)的優(yōu)勢(shì)，從未來(lái)發(fā)展趨勢(shì)來(lái)看，生成式智能出版物，可在以下幾個(gè)方向發(fā)力。

1.4.1 翻譯類出版物

ChatGPT等生成式AI產(chǎn)品往往擁有多種語(yǔ)言的海量語(yǔ)料庫(kù)，由此，多語(yǔ)種之間翻譯、轉(zhuǎn)換、生成和輸出優(yōu)勢(shì)極為明顯。據(jù)悉AI翻譯一本20萬(wàn)字的圖書僅需花費(fèi)數(shù)十秒的時(shí)間。未來(lái)的出版業(yè)態(tài)之中，翻譯作品可先經(jīng)由生成式AI翻譯，再輔以人工審核校對(duì)，這樣便可大大提高翻譯質(zhì)量和效率，甚至可以做到圖書原著和翻譯作品的同步出版、同時(shí)上線。

1.4.2 匯編類出版物

某種程度來(lái)講，就特定專業(yè)、特定學(xué)科、特定領(lǐng)域的具體知識(shí)問(wèn)題而言，AIGC所能提供的信息、數(shù)據(jù)、知識(shí)或解決方案，其質(zhì)量、規(guī)模、數(shù)量和效率遠(yuǎn)遠(yuǎn)高于大部分人類專家。換言之，ChatGPT等生成式AI產(chǎn)品，能夠根據(jù)目標(biāo)用戶的知識(shí)需求，基于海量語(yǔ)料集的數(shù)據(jù)優(yōu)勢(shì)，運(yùn)用強(qiáng)化學(xué)習(xí)算法，輔以超強(qiáng)算力支持，圍繞特定知識(shí)點(diǎn)或知識(shí)體系在最短的時(shí)間內(nèi)形成遠(yuǎn)超人類的集合性、整合性輸出內(nèi)容，且這些輸出內(nèi)容是經(jīng)過(guò)AI的學(xué)習(xí)、理解、推理而得出的，不只是簡(jiǎn)單的材料堆砌、知識(shí)羅列。由此，文獻(xiàn)綜述、知識(shí)點(diǎn)集成、百科出版等匯編類出版物將成為生成式AI技術(shù)的重要發(fā)力點(diǎn)，成為生成式智能出版物的示范性場(chǎng)景。

1.4.3 大眾出版物

文學(xué)、詩(shī)歌、小說(shuō)等大眾出版已然成為AI創(chuàng)作的先行領(lǐng)域。通過(guò)自然語(yǔ)言理解、自然語(yǔ)言生成以及基于人類反饋的強(qiáng)化學(xué)習(xí)等技術(shù)運(yùn)用，AI已經(jīng)可以圍繞給定主題，在寫作風(fēng)格、語(yǔ)法結(jié)構(gòu)、格式韻律等方面實(shí)現(xiàn)自由調(diào)度，并開展想象式、開創(chuàng)性的創(chuàng)作。可以遐想的是，為數(shù)更多的、飽含人類情感的AI文學(xué)、小說(shuō)、詩(shī)歌等文藝類大眾作品將以生成式智能出版物的面貌展現(xiàn)在世人面前。

此外，值得一提的是，生成式智能出版還無(wú)法在短時(shí)期內(nèi)覆蓋所有出版領(lǐng)域。鑒于ChatGPT等由國(guó)外主導(dǎo)研發(fā)的AIGC產(chǎn)品容易引起“意識(shí)形態(tài)偏見、意識(shí)形態(tài)滲透、文化價(jià)值觀認(rèn)同危機(jī)以及出版意識(shí)形態(tài)把握危機(jī)”[9]，教育出版類圖書、主題出版類圖書，暫不宜采用AIGC，即使應(yīng)用AIGC，也需要進(jìn)行嚴(yán)格的審核和把關(guān)，確保以人類智慧駕馭AI、以主流價(jià)值駕馭算法數(shù)據(jù)。

1.5 元宇宙出版新業(yè)態(tài)

元宇宙出版，是指元宇宙系統(tǒng)中的出版，即由數(shù)字孿生人、虛擬出版業(yè)、虛實(shí)融合出版、腦機(jī)知識(shí)服務(wù)等所構(gòu)成的數(shù)字世界的出版[10]。在元宇宙中，或曰元宇宙出版系統(tǒng)中，孿生數(shù)字人是主體性力量，數(shù)據(jù)、信息、知識(shí)是運(yùn)行基質(zhì)，數(shù)字技術(shù)是建構(gòu)和運(yùn)行邏輯[11]。

AIGC的出現(xiàn)和普及，為元宇宙出版新業(yè)態(tài)提供了必需的數(shù)據(jù)、信息、知識(shí)等基質(zhì)，提供了孿生數(shù)字人的“思維”“決策”能力，還進(jìn)一步提供了作為元宇宙出版動(dòng)能、運(yùn)行邏輯的智能化數(shù)字技術(shù)。

在運(yùn)行基質(zhì)方面，生成式預(yù)訓(xùn)練轉(zhuǎn)換模型（generative pre-trained transformer，GPT）等LLM可為元宇宙出版源源不斷地輸入期刊、書籍、百科等萬(wàn)億級(jí)的單詞語(yǔ)料，經(jīng)過(guò)數(shù)據(jù)清洗后，可進(jìn)一步形成數(shù)萬(wàn)億級(jí)甚至百萬(wàn)億級(jí)的無(wú)標(biāo)注文本數(shù)據(jù)。這些海量的數(shù)據(jù)、信息和知識(shí)，為元宇宙的構(gòu)建、運(yùn)行提供了必備的生產(chǎn)要素和基礎(chǔ)設(shè)施，并且基于海量語(yǔ)料和強(qiáng)化學(xué)習(xí)技術(shù)，AI可進(jìn)一步生成新的內(nèi)容，由此形成數(shù)據(jù)、信息和知識(shí)的再生產(chǎn)、循環(huán)生產(chǎn)機(jī)制，為元宇宙出版持續(xù)、穩(wěn)定、健康地運(yùn)行奠定數(shù)據(jù)基礎(chǔ)。

在運(yùn)行主體方面，虛擬數(shù)字人或?qū)\生數(shù)字人的感知、認(rèn)知、決策、執(zhí)行和控制能力將進(jìn)一步增強(qiáng)。GPT4等LLM較為成功地解決了感知智能上升到認(rèn)知智能的難題，是通往通用人工智能（artificial general intelligence，AGI）的關(guān)鍵，也實(shí)質(zhì)性地為數(shù)字人的智能問(wèn)題提供了技術(shù)解決方案。同時(shí)，基于人類反饋的強(qiáng)化學(xué)習(xí)算法的成功運(yùn)用，為自然人和數(shù)字人之間的數(shù)據(jù)同步、表達(dá)同步、輸出同步難題提供了更有效率的攻克之道。

在運(yùn)行動(dòng)能方面，GPT4的超強(qiáng)算力為元宇宙出版的實(shí)質(zhì)運(yùn)行提供了基本支撐和維系動(dòng)力。GPT作為一種基于互聯(lián)網(wǎng)可用數(shù)據(jù)訓(xùn)練的文本生成深度學(xué)習(xí)模型，能夠有效地支撐“海量數(shù)據(jù)—強(qiáng)化學(xué)習(xí)—適人化生成內(nèi)容”的系統(tǒng)運(yùn)行，從而為構(gòu)建元宇宙出版虛擬空間數(shù)字人“感知—認(rèn)知—決策（生成）—行為”的運(yùn)行模式提供有益借鑒。

2 生成式智能出版面臨的風(fēng)險(xiǎn)挑戰(zhàn)

生成式智能出版新業(yè)態(tài)的出現(xiàn)無(wú)疑擴(kuò)充了出版的應(yīng)用場(chǎng)景和發(fā)展可能，也不斷為數(shù)字出版的創(chuàng)新發(fā)展輸入了強(qiáng)大的驅(qū)動(dòng)力。然而，這并不意味著生成式智能出版總是能發(fā)揮正向的賦能作用。事實(shí)上，其在應(yīng)用過(guò)程中不可避免地面臨著諸多風(fēng)險(xiǎn)和挑戰(zhàn)，這是生成式AI技術(shù)在設(shè)計(jì)、開發(fā)、應(yīng)用過(guò)程中受諸多因素綜合影響所致。對(duì)這些風(fēng)險(xiǎn)的準(zhǔn)確識(shí)別和挑戰(zhàn)的及時(shí)應(yīng)對(duì)，是發(fā)揮生成式智能出版應(yīng)用場(chǎng)景正價(jià)值賦能的應(yīng)有之義，也是技術(shù)向善理念在出版領(lǐng)域的必然要求。

2.1 數(shù)據(jù)來(lái)源和輸出風(fēng)險(xiǎn)

數(shù)據(jù)風(fēng)險(xiǎn)是生成式AI技術(shù)應(yīng)用到各行各業(yè)都會(huì)遇到的風(fēng)險(xiǎn)，這種風(fēng)險(xiǎn)涵蓋了數(shù)據(jù)來(lái)源、訓(xùn)練、組織和輸出的整個(gè)環(huán)節(jié)，既包括數(shù)據(jù)來(lái)源風(fēng)險(xiǎn)、數(shù)據(jù)訓(xùn)練風(fēng)險(xiǎn)，也存在數(shù)據(jù)輸出環(huán)節(jié)的風(fēng)險(xiǎn)。囿于篇幅限制，本文僅就來(lái)源、輸出兩個(gè)環(huán)節(jié)的風(fēng)險(xiǎn)予以分析。

數(shù)據(jù)來(lái)源的風(fēng)險(xiǎn)，是指構(gòu)成ChatGPT訓(xùn)練集的數(shù)據(jù)類型、規(guī)模、語(yǔ)種等本身對(duì)輸出結(jié)果的科學(xué)性、合理性、權(quán)威性的基礎(chǔ)性、根本性風(fēng)險(xiǎn)。數(shù)據(jù)來(lái)源風(fēng)險(xiǎn)具體可細(xì)化為以下幾個(gè)方面。

（1）“數(shù)據(jù)獲取侵權(quán)、數(shù)據(jù)內(nèi)容違法、虛假信息吸收”[12]影響最終輸出結(jié)果的真實(shí)性和合法性，例如語(yǔ)料集涉及個(gè)人隱私、商業(yè)秘密等方面的數(shù)據(jù)如被惡意使用或過(guò)度使用，則容易引起內(nèi)容生成違法性的問(wèn)題。

（2）數(shù)據(jù)挖掘不受限，通過(guò)深層次推理和思維鏈技術(shù)，推導(dǎo)出數(shù)據(jù)背后的信息可能關(guān)系國(guó)家安全。事實(shí)上，當(dāng)前技術(shù)“無(wú)法完全過(guò)濾種族歧視或仇恨言論，同樣埋下國(guó)家安全隱患”[13]。同時(shí)，關(guān)鍵領(lǐng)域公開出版物的數(shù)據(jù)化，如對(duì)重要能源礦床、礦產(chǎn)地等圖書知識(shí)進(jìn)行標(biāo)注、計(jì)算和輸出，存在泄漏國(guó)家能源安全的風(fēng)險(xiǎn)。

（3）LLM語(yǔ)料庫(kù)在語(yǔ)種、國(guó)家、類型等方面的不均衡分布，將導(dǎo)致輸出內(nèi)容存在偏見、偏差，如ChatGPT所使用的語(yǔ)料集主要是英語(yǔ)語(yǔ)種，所輸出內(nèi)容的西式價(jià)值觀烙印很深。

（4）數(shù)據(jù)時(shí)效性不強(qiáng)，所訓(xùn)練和輸出的主要是過(guò)時(shí)數(shù)據(jù)，也會(huì)影響輸出內(nèi)容的真實(shí)性、準(zhǔn)確性和科學(xué)性。如ChatGPT所使用的數(shù)據(jù)主要是2021年以前的數(shù)據(jù)，而對(duì)于最新的數(shù)據(jù)、信息和知識(shí)的攝入則處于缺失、缺位狀態(tài)，故而無(wú)法解答時(shí)效性的問(wèn)題。

（5）在LLM的使用過(guò)程中，客戶故意做出錯(cuò)誤、誤導(dǎo)性或有傾向性的提問(wèn)或提示，“提示語(yǔ)混入惡意指令，會(huì)繞過(guò)安全機(jī)制，執(zhí)行預(yù)想外指令”[14]，導(dǎo)致泄露信息數(shù)據(jù)、輸出有毒有害內(nèi)容等。

在數(shù)據(jù)輸出環(huán)節(jié)，LLM容易生成不良信息、有害信息、虛假信息或違法信息，進(jìn)而引起“技術(shù)及倫理風(fēng)險(xiǎn)、虛假信息風(fēng)險(xiǎn)、版權(quán)爭(zhēng)議”[15]等通用風(fēng)險(xiǎn)。同時(shí)，受到群體傾向性的影響，會(huì)輸出“政治正確”話語(yǔ)[16]，如對(duì)特定人物、事件的數(shù)據(jù)分布不均致使產(chǎn)生輿論誤導(dǎo)、傾向性內(nèi)容輸出的風(fēng)險(xiǎn)，一個(gè)有意思的例子是ChatGPT愿意為拜登作詩(shī)頌揚(yáng)，但拒絕為特朗普撰寫。

2.2 學(xué)術(shù)倫理規(guī)范的挑戰(zhàn)

實(shí)踐中已經(jīng)出現(xiàn)了學(xué)生使用ChatGPT撰寫學(xué)術(shù)論文、完成課程作業(yè)的案例，由此衍生出隱蔽型的學(xué)術(shù)不端問(wèn)題，并對(duì)學(xué)術(shù)倫理和學(xué)術(shù)道德規(guī)范產(chǎn)生影響。“此類違反學(xué)術(shù)道德的行為不僅會(huì)侵蝕學(xué)生獨(dú)立的科研能力，而且會(huì)影響學(xué)術(shù)界整體的公平公正性，因此ChatGPT已受到了多所教育機(jī)構(gòu)的明文限制”[17]。

對(duì)論文投機(jī)者而言，AIGC無(wú)疑降低了論文炮制、抄襲的成本，并提供了更多便利。通過(guò)所謂的“整合性”創(chuàng)新所輸出的內(nèi)容，需借助多位作者的聯(lián)合鑒別，且無(wú)法做到阻止隱蔽型學(xué)術(shù)不端行為的發(fā)生。這種對(duì)學(xué)術(shù)倫理規(guī)范行為的挑戰(zhàn)，需要引起高度重視，并及時(shí)進(jìn)行建章立制予以規(guī)范。教育界、學(xué)術(shù)界、教師和學(xué)生則需協(xié)同協(xié)作，應(yīng)用“機(jī)器審核機(jī)器”等更高水平AI審核技術(shù)加以監(jiān)督、杜絕。

2.3 核心價(jià)值堅(jiān)守的挑戰(zhàn)

前述AIGC數(shù)據(jù)來(lái)源和輸出的風(fēng)險(xiǎn)、對(duì)學(xué)術(shù)倫理規(guī)范的挑戰(zhàn)，尚且屬于淺層次的風(fēng)險(xiǎn)挑戰(zhàn)。長(zhǎng)期使用AIGC，尤其是ChatGPT等國(guó)外LLM，其深層次的風(fēng)險(xiǎn)是沖擊、削弱或混淆主流意識(shí)形態(tài)和價(jià)值觀念，最終引起核心公共價(jià)值失靈的風(fēng)險(xiǎn)?！叭绻诵墓矁r(jià)值由于政策制定過(guò)程中的缺陷而被限制，或者沒(méi)有足夠的手段確保核心價(jià)值觀的銜接和有效的溝通，或者由于聚合價(jià)值的過(guò)程出現(xiàn)扭曲，那么公共價(jià)值失靈就有可能產(chǎn)生”[18]。

盡管當(dāng)被問(wèn)及“ChatGPT堅(jiān)持什么樣的價(jià)值判斷？有無(wú)自己的核心價(jià)值觀”時(shí)，它給出的回答是：ChatGPT是一個(gè)純粹的語(yǔ)言模型，它并沒(méi)有自己的價(jià)值觀，也不會(huì)主動(dòng)進(jìn)行價(jià)值判斷。ChatGPT生成的回答是基于大量的文本數(shù)據(jù)訓(xùn)練得出的統(tǒng)計(jì)規(guī)律，它只是根據(jù)給定的輸入生成對(duì)應(yīng)的輸出，并不會(huì)對(duì)文化安全、意識(shí)形態(tài)安全造成威脅。但是，筆者仍然認(rèn)為使用國(guó)外LLM，其致使核心公共價(jià)值失靈的風(fēng)險(xiǎn)是客觀存在的，且這種風(fēng)險(xiǎn)的發(fā)生是一個(gè)長(zhǎng)期的、潛移默化的過(guò)程：一則，ChatGPT語(yǔ)料庫(kù)多數(shù)為西方數(shù)據(jù)庫(kù)，英語(yǔ)語(yǔ)料占比最大，其中新聞報(bào)道、圖書期刊等語(yǔ)料資源不可避免地帶有意識(shí)形態(tài)偏見，含有誤導(dǎo)、詆毀甚至是抹黑我國(guó)主流意識(shí)形態(tài)的內(nèi)容。二則，基于人類反饋的強(qiáng)化學(xué)習(xí)算法的運(yùn)用，目標(biāo)是輸出和人類的認(rèn)知、需求和價(jià)值觀相一致的內(nèi)容。而這里的“價(jià)值觀”對(duì)ChatGPT來(lái)講，默認(rèn)是西式價(jià)值觀，而非社會(huì)主義核心價(jià)值觀。三則，正因?yàn)镃hatGPT生成的回答是基于大量的文本數(shù)據(jù)訓(xùn)練得出的“統(tǒng)計(jì)規(guī)律”，而這個(gè)“統(tǒng)計(jì)規(guī)律”恰恰是建立在西方語(yǔ)料、西方價(jià)值基礎(chǔ)之上，喂養(yǎng)、訓(xùn)練的數(shù)據(jù)是帶有西式價(jià)值觀烙印的，其輸出的內(nèi)容也不可避免地含有意識(shí)形態(tài)偏見或傾向，無(wú)論用戶是否發(fā)現(xiàn)，也無(wú)論ChatGPT是否正面回應(yīng)。

2.4 人類職業(yè)的替代性隱憂

AI對(duì)人類職業(yè)的替代是一個(gè)長(zhǎng)期存在的隱憂，幾乎每次在AI取得里程碑式的進(jìn)步時(shí)，與之相關(guān)的各行各業(yè)都會(huì)思考這個(gè)問(wèn)題。

簡(jiǎn)言之，ChatGPT將會(huì)直接影響文本相關(guān)工作的職業(yè)，如文字編輯、翻譯、新聞?dòng)浾叩??？陀^地講，簡(jiǎn)單的文本處理職業(yè)將會(huì)消失，交由生成式AI應(yīng)用來(lái)完成，如郵件自動(dòng)回復(fù)、客觀事實(shí)報(bào)道、客服咨詢和電話熱線解答等。但是，AI無(wú)法勝任原創(chuàng)性特征明顯、原始性創(chuàng)新起主導(dǎo)作用的復(fù)雜文本處理工作，也因此無(wú)法取代人類完成該類工作。

未來(lái)職業(yè)的替代性問(wèn)題，需轉(zhuǎn)換視角，以共生視角去思考可能更為適宜。相當(dāng)多的職業(yè)，更有可能會(huì)以人機(jī)協(xié)同、人機(jī)融合、人機(jī)共生的方式出現(xiàn)，人類智慧和AI的有機(jī)融合模式，或是以人類為主、機(jī)器協(xié)助，或是以機(jī)器為主、人類協(xié)助。

3 生成式智能出版的調(diào)治路徑分析

面對(duì)上述風(fēng)險(xiǎn)與挑戰(zhàn)，生成式智能出版無(wú)疑需從調(diào)節(jié)和治理兩個(gè)路徑出發(fā)加以防范與應(yīng)對(duì)。

3.1 生成式智能出版的調(diào)節(jié)路徑

數(shù)字出版調(diào)節(jié)，是指出版系統(tǒng)吸收內(nèi)化數(shù)字技術(shù)，調(diào)整自身產(chǎn)業(yè)鏈各環(huán)節(jié)及相關(guān)領(lǐng)域，以形成有序或高級(jí)有序的結(jié)構(gòu)或狀態(tài)，包括產(chǎn)業(yè)鏈調(diào)節(jié)、主體調(diào)節(jié)、項(xiàng)目調(diào)節(jié)和制度調(diào)節(jié)等基本范疇[19]。生成式智能出版的調(diào)節(jié)路徑亦可從上述基本范疇出發(fā)加以思考。

其中，生成式智能出版的產(chǎn)業(yè)鏈調(diào)節(jié)是由產(chǎn)品調(diào)節(jié)、技術(shù)調(diào)節(jié)和運(yùn)維調(diào)節(jié)所構(gòu)成的調(diào)節(jié)體系。具體而言：

生成式智能出版產(chǎn)品調(diào)節(jié)，須以內(nèi)容建設(shè)為根本，充分發(fā)揮出版業(yè)內(nèi)容資源優(yōu)勢(shì)，將出版內(nèi)容與生成式AI技術(shù)有機(jī)融合，研發(fā)出適銷對(duì)路的生成式智能出版產(chǎn)品，如前所述的出版大數(shù)據(jù)、智能知識(shí)服務(wù)、智能機(jī)器人、生成式智能出版物以及元宇宙出版產(chǎn)品等。為適應(yīng)生成式智能出版的發(fā)展趨勢(shì)，數(shù)字出版產(chǎn)品調(diào)節(jié)須主動(dòng)推進(jìn)數(shù)字化、數(shù)據(jù)化、智能化建設(shè)。其中，數(shù)字化是前提，數(shù)據(jù)化是關(guān)鍵，智能化是結(jié)果。歷經(jīng)二十余年的發(fā)展，我國(guó)數(shù)字出版產(chǎn)品的分析式智能化取得了階段性成果，如AR/VR出版物強(qiáng)化了內(nèi)容呈現(xiàn)的臨場(chǎng)感，再如出版大數(shù)據(jù)根據(jù)用戶畫像對(duì)出版物進(jìn)行精準(zhǔn)營(yíng)銷和算法推薦等。未來(lái)數(shù)字出版產(chǎn)品的生成式智能化發(fā)展，人機(jī)協(xié)同研發(fā)數(shù)字出版產(chǎn)品，人類智慧與AI的融合，是不可逆的趨勢(shì)。

生成式智能出版的技術(shù)調(diào)節(jié)，是數(shù)字出版、智能出版產(chǎn)業(yè)鏈調(diào)節(jié)的重中之重，是生成式智能出版能否成為數(shù)字出版新業(yè)態(tài)、新模式的關(guān)鍵所在。具體而言，生成式智能出版的技術(shù)調(diào)節(jié)，須在數(shù)據(jù)、算法和算力三方面著力：

其一，確立出版數(shù)據(jù)生產(chǎn)要素的地位，夯實(shí)出版數(shù)據(jù)底座。出版業(yè)的智能化發(fā)展，離不開對(duì)數(shù)據(jù)要素市場(chǎng)的培育，離不開對(duì)出版業(yè)數(shù)據(jù)服務(wù)系統(tǒng)的構(gòu)建，離不開包含數(shù)據(jù)建設(shè)、共享、開發(fā)、應(yīng)用、維護(hù)在內(nèi)的一體化數(shù)據(jù)治理體系的建立。提高出版業(yè)數(shù)據(jù)要素生產(chǎn)效率，可從以下幾個(gè)方面推進(jìn)：（1）確立數(shù)據(jù)理念。將數(shù)據(jù)視為生產(chǎn)要素，制定并落實(shí)“以數(shù)據(jù)為關(guān)鍵要素，以數(shù)據(jù)賦能為主線，以價(jià)值釋放和創(chuàng)造為核心，對(duì)產(chǎn)業(yè)鏈上下游的全要素?cái)?shù)字化轉(zhuǎn)型、升級(jí)、重塑和再造”[20]的出版業(yè)數(shù)字化戰(zhàn)略。（2）推動(dòng)數(shù)據(jù)賦能。建構(gòu)和踐行出版業(yè)數(shù)據(jù)價(jià)值體系，挖掘和實(shí)現(xiàn)出版業(yè)“圖書價(jià)值、數(shù)字化價(jià)值、數(shù)據(jù)化價(jià)值”[21]三位一體的價(jià)值功能。（3）完善數(shù)據(jù)流程。根據(jù)數(shù)據(jù)采集、數(shù)據(jù)清洗、知識(shí)標(biāo)引、數(shù)據(jù)計(jì)算、數(shù)據(jù)建模、知識(shí)圖譜、二次數(shù)據(jù)挖掘等數(shù)據(jù)服務(wù)流程，建立和優(yōu)化出版業(yè)、出版社數(shù)據(jù)服務(wù)體系。這方面，人民法院出版社的“法信”大數(shù)據(jù)平臺(tái)堪稱典范。（4）建立健全出版語(yǔ)料庫(kù)。在無(wú)標(biāo)注文本數(shù)據(jù)方面，構(gòu)建萬(wàn)億級(jí)超大規(guī)模、超高質(zhì)量、門類齊全的語(yǔ)料庫(kù)和數(shù)據(jù)池，涵蓋各行業(yè)、各學(xué)科和各領(lǐng)域；組織出版專家開展高質(zhì)量的有標(biāo)注的文本數(shù)據(jù)建設(shè)，至少建立數(shù)萬(wàn)條符合人類偏好的標(biāo)注數(shù)據(jù)。

其二，引入深度學(xué)習(xí)算法技術(shù)，探索LLM應(yīng)用。第三次AI熱潮的興起，AlphaGo、元宇宙、ChatGPT等成為AI的里程碑，是大數(shù)據(jù)、深度學(xué)習(xí)算法以及超強(qiáng)算力綜合作用的結(jié)果。因此，要深入推進(jìn)智能出版，健全生成式智能出版產(chǎn)業(yè)鏈，就需要重視并應(yīng)用深度學(xué)習(xí)技術(shù)。在深度學(xué)習(xí)技術(shù)采納、應(yīng)用和創(chuàng)新流程方面，出版企業(yè)宜：（1）基于長(zhǎng)期主義理念，遵循技術(shù)轉(zhuǎn)換式創(chuàng)新規(guī)律，制定科學(xué)合理的技術(shù)創(chuàng)新戰(zhàn)略，引進(jìn)強(qiáng)化學(xué)習(xí)、遷移學(xué)習(xí)等突破性技術(shù)資源。（2）構(gòu)建企業(yè)內(nèi)部高新技術(shù)跨越動(dòng)力體系，保持出版企業(yè)在技術(shù)應(yīng)用和創(chuàng)新方面的戰(zhàn)略定力和韌性，通過(guò)項(xiàng)目申請(qǐng)或自主投入等方式給予耐久性、持續(xù)性財(cái)務(wù)承諾，推動(dòng)出版企業(yè)穿越深度學(xué)習(xí)技術(shù)基礎(chǔ)研究和商業(yè)應(yīng)用之間的“死亡之谷”。（3）抓住技術(shù)跨越的機(jī)會(huì)窗口，形成長(zhǎng)期、合理、穩(wěn)定、可持續(xù)的商業(yè)模式，將路徑轉(zhuǎn)換式創(chuàng)新所得來(lái)的深度學(xué)習(xí)技術(shù)應(yīng)用轉(zhuǎn)化為新的路徑依賴式創(chuàng)新，從而順利完成深度學(xué)習(xí)技術(shù)的路徑轉(zhuǎn)化式技術(shù)蛙跳。在LLM應(yīng)用方面，科研實(shí)力較強(qiáng)、資金雄厚的大型出版集團(tuán)，可以考慮聯(lián)合計(jì)算機(jī)、出版領(lǐng)域的科研單位，構(gòu)建中文為主、涵蓋多國(guó)語(yǔ)言的預(yù)訓(xùn)練語(yǔ)料集，輔以人工標(biāo)注數(shù)據(jù)，通過(guò)預(yù)訓(xùn)練語(yǔ)言模型的訓(xùn)練、獎(jiǎng)懲模型的訓(xùn)練以及基于強(qiáng)化學(xué)習(xí)進(jìn)行語(yǔ)言模型優(yōu)化，最終形成服務(wù)于宣傳思想文化、服務(wù)于出版業(yè)的LLM。

其三，樹立算力意識(shí)，提升智能出版新的生產(chǎn)力。算力，即計(jì)算能力，是指數(shù)據(jù)采集、傳輸、標(biāo)引、關(guān)聯(lián)、計(jì)算和存儲(chǔ)等能力。算力是數(shù)字化、智能化服務(wù)的核心，是數(shù)字經(jīng)濟(jì)、數(shù)字出版、智能出版發(fā)展的新動(dòng)能和新引擎。整體而言，出版業(yè)算力意識(shí)較為薄弱，還沒(méi)有意識(shí)到智能出版時(shí)代算力如同電力一樣，將成為數(shù)據(jù)挖掘、模型訓(xùn)練的基礎(chǔ)支撐和核心引擎。大多數(shù)出版企業(yè)對(duì)算力的理解尚且停留在服務(wù)器購(gòu)置、機(jī)房建設(shè)、云服務(wù)等具體事宜層面，沒(méi)有對(duì)算力的內(nèi)涵、構(gòu)成、應(yīng)用和影響形成全面、科學(xué)的認(rèn)知。生成式智能出版的發(fā)展，迫切要求出版業(yè)確立算力意識(shí)，提升計(jì)算能力和存儲(chǔ)能力，認(rèn)知、理解并及時(shí)應(yīng)用云計(jì)算、邊緣計(jì)算、終端計(jì)算等技術(shù)，以進(jìn)一步夯實(shí)出版業(yè)數(shù)智化轉(zhuǎn)型的基礎(chǔ)。

生成式智能出版的運(yùn)維調(diào)節(jié)，需在智能出版的運(yùn)營(yíng)和維護(hù)環(huán)節(jié)，積極應(yīng)用生成式AI技術(shù)，以提升智能出版產(chǎn)品服務(wù)的營(yíng)銷效能和維護(hù)質(zhì)量。具體而言，出版營(yíng)銷的征訂單、宣傳文案、新書發(fā)布會(huì)方案等，可首先借助AI加以生成，輔之以出版營(yíng)銷編輯的審核、修改和確定，從而起到減少人力資源投入、提高出版營(yíng)銷效能的積極作用。出版客服、售后等運(yùn)維工作，尤其是數(shù)字出版等線上客服工作，可交由生成式AI來(lái)優(yōu)先承擔(dān)，在智能語(yǔ)音解答不能滿足用戶需求時(shí)，再轉(zhuǎn)交出版營(yíng)銷編輯來(lái)接手；或在非工作時(shí)間交由生成式AI承擔(dān)，以發(fā)揮生成式AI技術(shù)的新生產(chǎn)力作用，保障勞動(dòng)者的工作權(quán)、休息權(quán)等合法權(quán)益。另外，還可結(jié)合虛擬數(shù)字人技術(shù)，研發(fā)承擔(dān)出版營(yíng)銷推廣任務(wù)的孿生數(shù)字人或虛擬數(shù)字人，自動(dòng)生成、播放或講述出版營(yíng)銷的AIGC文案，實(shí)時(shí)進(jìn)行人機(jī)語(yǔ)音交互，在元宇宙、云展覽、云演藝等場(chǎng)景實(shí)施出版產(chǎn)品和品牌的營(yíng)銷推廣。

生成式智能出版的主體調(diào)節(jié)，是指數(shù)字出版編輯在原有的政治素質(zhì)、出版專業(yè)能力之外，自覺提升自身數(shù)字素養(yǎng)與技能，形成“由數(shù)字化適應(yīng)力、數(shù)字化勝任力、數(shù)字化創(chuàng)造力所構(gòu)成的三位一體的編輯數(shù)字素養(yǎng)體系和數(shù)字技能體系”[22]，以適應(yīng)生成式智能出版發(fā)展的需要，適應(yīng)出版業(yè)智能化、高質(zhì)量發(fā)展的需要?？傮w而言，數(shù)字出版編輯應(yīng)自覺提升數(shù)字素養(yǎng)與技能，培養(yǎng)數(shù)字意識(shí)、計(jì)算思維、終身學(xué)習(xí)能力、網(wǎng)絡(luò)文明與道德修養(yǎng)以及社會(huì)責(zé)任感，使自身成為合格的數(shù)字公民。具體來(lái)講，應(yīng)提高自身的數(shù)字化適應(yīng)力，主動(dòng)確立數(shù)字化理念，強(qiáng)化數(shù)字化思維，適應(yīng)數(shù)字化工作崗位，掌握和運(yùn)用數(shù)字知識(shí)尤其是AI相關(guān)知識(shí)和技術(shù)；應(yīng)不斷增強(qiáng)自身的數(shù)字化勝任力，在學(xué)習(xí)、理解、運(yùn)用生成式AI技術(shù)的基礎(chǔ)之上，勝任生成式智能出版產(chǎn)品服務(wù)策劃、研發(fā)等技術(shù)應(yīng)用以及基于生成式AI的出版營(yíng)銷工作；應(yīng)培養(yǎng)和鍛造自身的數(shù)字化創(chuàng)造力，基于數(shù)字知識(shí)、技術(shù)和智慧，著力推動(dòng)出版領(lǐng)域的生成式AI技術(shù)的創(chuàng)新應(yīng)用，引領(lǐng)和帶動(dòng)生成式智能出版產(chǎn)品、運(yùn)營(yíng)、模式、業(yè)態(tài)和管理等全方位的創(chuàng)新。

此外，生成式智能出版調(diào)節(jié)路徑還包括積極申報(bào)和實(shí)施重大文化產(chǎn)業(yè)項(xiàng)目，以重大項(xiàng)目、重大工程為抓手、為杠桿，切實(shí)推進(jìn)生成式AI技術(shù)在出版業(yè)的落地、應(yīng)用和推廣；還包括建立健全生成式AI技術(shù)應(yīng)用的制度體系，營(yíng)造鼓勵(lì)、支持和包容生成式智能出版發(fā)展的氛圍和環(huán)境。

3.2 生成式智能出版的治理路徑

上述調(diào)節(jié)路徑，旨在從市場(chǎng)一側(cè)推動(dòng)生成式智能出版的發(fā)展，推動(dòng)生成式智能出版新產(chǎn)品、新業(yè)態(tài)、新模式不斷涌現(xiàn)，推動(dòng)AIGC技術(shù)原理與出版業(yè)的應(yīng)用場(chǎng)景深度融合。而治理路徑，則旨在發(fā)揮保障和規(guī)制作用，應(yīng)對(duì)生成式AI技術(shù)的風(fēng)險(xiǎn)與挑戰(zhàn)，確保生成式AI技術(shù)發(fā)揮正價(jià)值，堅(jiān)持技術(shù)向善，確保生成式智能出版在健康、穩(wěn)步、可持續(xù)、高質(zhì)量發(fā)展的道路上不斷前行。具體而言，包括以下幾個(gè)方面。

維護(hù)意識(shí)形態(tài)安全，堅(jiān)持以主流價(jià)值導(dǎo)向駕馭算法程序。如前所述，ChatGPT等AIGC產(chǎn)品深層次的風(fēng)險(xiǎn)挑戰(zhàn)是沖擊、削弱或混淆主流意識(shí)形態(tài)和價(jià)值觀念。因此，生成式智能出版的首要治理路徑在于堅(jiān)守意識(shí)形態(tài)陣地，確保意識(shí)形態(tài)安全，堅(jiān)持以核心價(jià)值觀引領(lǐng)生成式AI出版產(chǎn)品和服務(wù)行為，確保生成式智能出版產(chǎn)品和服務(wù)蘊(yùn)含正確的核心價(jià)值觀，以起到潛移默化、春風(fēng)化雨式的培養(yǎng)、教育和踐行效果。出版主管部門宜在相關(guān)的部委規(guī)章或管理辦法中明確提出符合主流意識(shí)形態(tài)、體現(xiàn)核心價(jià)值觀的相關(guān)規(guī)定。同時(shí)，在具體行政行為方面，可在新媒體采編、報(bào)紙、期刊、圖書質(zhì)量檢查中，增加關(guān)于生成式AI服務(wù)監(jiān)督和檢查的規(guī)定，確保所提供的生成式智能服務(wù)符合主流意識(shí)形態(tài)，與核心價(jià)值觀保持一致。

推進(jìn)法律治理，確保生成式智能出版在法律規(guī)則內(nèi)運(yùn)行。在立法層面，主管部門宜根據(jù)《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》《出版管理?xiàng)l例》等法律和行政法規(guī)，制定部委規(guī)章、地方政府規(guī)章或規(guī)范性文件，以指導(dǎo)生成式AI出版服務(wù)。在執(zhí)法和司法層面，對(duì)利用生成式AI提供服務(wù)，但危害國(guó)家安全、意識(shí)形態(tài)安全、文化安全、侵害知識(shí)產(chǎn)權(quán)、損害人格權(quán)等違法犯罪行為，要堅(jiān)決予以懲處。在守法層面，提供生成式AI服務(wù)的平臺(tái)和個(gè)人，要遵守相關(guān)法律規(guī)定，堅(jiān)持技術(shù)向善，發(fā)揮技術(shù)正價(jià)值，做負(fù)責(zé)任的創(chuàng)新主體。同時(shí)，廣大用戶、版權(quán)協(xié)會(huì)、出版協(xié)會(huì)等發(fā)現(xiàn)AIGC有違反法律規(guī)定、社會(huì)公德、商業(yè)道德的情形時(shí)，可行使監(jiān)督權(quán)，向有關(guān)部門予以舉報(bào)，以確保網(wǎng)絡(luò)空間的風(fēng)清氣正，確保生成式智能出版服務(wù)健康有序發(fā)展。

有效實(shí)施重大文化產(chǎn)業(yè)項(xiàng)目帶動(dòng)戰(zhàn)略，適時(shí)研發(fā)中文知識(shí)本體為主的LLM。實(shí)施宏觀調(diào)控舉措，發(fā)揮重大文化產(chǎn)業(yè)項(xiàng)目帶動(dòng)效應(yīng)，有助于從舉國(guó)體制的高度來(lái)解決生成式AI的經(jīng)營(yíng)和管理問(wèn)題。構(gòu)建中文知識(shí)本體為主的語(yǔ)料集和LLM，是化解意識(shí)形態(tài)和文化安全風(fēng)險(xiǎn)，應(yīng)對(duì)國(guó)外生成式AI服務(wù)挑戰(zhàn)的有效舉措和“國(guó)之大者”。對(duì)構(gòu)建生成式智能出版的語(yǔ)料集、LLM等關(guān)鍵難題，可通過(guò)文化產(chǎn)業(yè)發(fā)展專項(xiàng)資金、國(guó)有資本經(jīng)營(yíng)預(yù)算金、國(guó)家出版基金等渠道設(shè)立重大項(xiàng)目或重大工程來(lái)予以攻克。

堅(jiān)持標(biāo)準(zhǔn)先行，建立、健全、宣貫和落實(shí)生成式智能出版標(biāo)準(zhǔn)。一如《出版物AR技術(shù)應(yīng)用規(guī)范》《出版物VR技術(shù)應(yīng)用要求》對(duì)出版業(yè)AR/VR技術(shù)應(yīng)用的規(guī)制，《出版物AIGC應(yīng)用要求》等行業(yè)標(biāo)準(zhǔn)、團(tuán)體標(biāo)準(zhǔn)和企業(yè)標(biāo)準(zhǔn)體系也亟待建立和完善。在內(nèi)容上，該類標(biāo)準(zhǔn)宜包含AIGC的建議性規(guī)定、禁止性規(guī)定，明確利用生成式AI技術(shù)開展智能出版產(chǎn)品服務(wù)的流程、角色和職責(zé)，規(guī)范用戶、平臺(tái)、社會(huì)組織在生成式智能出版服務(wù)提供過(guò)程中的行為等。同時(shí)，生成式智能出版標(biāo)準(zhǔn)體系的宣傳貫徹、落地培訓(xùn)和反饋考評(píng)機(jī)制也有待建立并迫切需要在出版業(yè)落地實(shí)踐。

最后，提升數(shù)字治理能力，以數(shù)字治理提升出版治理效能。數(shù)字治理是數(shù)字出版治理的一項(xiàng)基本原則，是一種新型治理方式和手段，也是數(shù)字社會(huì)的全新治理范式，其治理要點(diǎn)在于以數(shù)據(jù)治理為重點(diǎn)，善用數(shù)字技術(shù)工具，不斷提升企業(yè)微觀治理效率和行業(yè)宏觀治理效能。生成式智能出版的數(shù)據(jù)治理，包含對(duì)語(yǔ)料集、LLM中的數(shù)據(jù)內(nèi)容、數(shù)據(jù)類型、數(shù)據(jù)時(shí)效等全方位的管理和監(jiān)督，也包含對(duì)內(nèi)容數(shù)據(jù)、用戶數(shù)據(jù)和交互數(shù)據(jù)的建設(shè)與使用。同時(shí)，行業(yè)級(jí)的數(shù)據(jù)治理平臺(tái)和企業(yè)級(jí)的數(shù)據(jù)治理平臺(tái)也有待建立，以切實(shí)在出版治理實(shí)踐中發(fā)揮應(yīng)有作用和價(jià)值。

4 結(jié)語(yǔ)

或許，當(dāng)筆者提及生成式智能出版這一概念時(shí)，尚有部分學(xué)界或業(yè)界同仁覺得為時(shí)過(guò)早。但回首2017年底左右發(fā)表的《出版+人工智能：未來(lái)出版的新模式與形態(tài)》《出版+人工智能：智能出版流程再造》兩篇文章，其中提到的AR出版、VR出版、知識(shí)服務(wù)、出版大數(shù)據(jù)等智能出版場(chǎng)景均已落地并在產(chǎn)品、技術(shù)、標(biāo)準(zhǔn)等方面取得了一系列成果，成為新興出版最有活力、最具潛力的組成部分。

抱以未來(lái)學(xué)的視角，生成式智能出版會(huì)在出版大數(shù)據(jù)、LLM、高維度智能知識(shí)服務(wù)、出版+智能機(jī)器人、生成式智能出版物以及元宇宙出版等新產(chǎn)品、新業(yè)態(tài)和新場(chǎng)景方面取得實(shí)質(zhì)性突破。在硬幣的另一面，生成式智能出版也同樣面臨著數(shù)據(jù)來(lái)源和使用風(fēng)險(xiǎn)、學(xué)術(shù)倫理挑戰(zhàn)、核心價(jià)值觀堅(jiān)守挑戰(zhàn)甚至是人類職業(yè)的替代性隱憂。為此，本文提出了確立出版數(shù)據(jù)生產(chǎn)要素地位、探索LLM應(yīng)用、樹立算力意識(shí)，以及強(qiáng)化數(shù)字出版編輯素養(yǎng)和技能等數(shù)字出版調(diào)節(jié)路徑，指出了以主流價(jià)值駕馭算法程序、推進(jìn)法律治理、實(shí)施重大項(xiàng)目帶動(dòng)、研制應(yīng)用生成式智能出版標(biāo)準(zhǔn)以及提升數(shù)字治理效能等數(shù)字出版治理路徑。

作者貢獻(xiàn)說(shuō)明

張新新：總體框架設(shè)計(jì)，論文撰寫；

黃如花：論文修改。

生成式智能出版的應(yīng)用場(chǎng)景、風(fēng)險(xiǎn)挑戰(zhàn)與調(diào)治路徑