生成式智能出版的技術(shù)原理與流程革新

2023-10-28 13:40:40張新新丁靖佳

圖書情報(bào)知識(shí) 2023年5期

張新新丁靖佳

2022年11月，美國(guó)OpenAI公司發(fā)布大型語(yǔ)言模型（large language model，LLM）ChatGPT，其在推出5天后注冊(cè)用戶量超百萬，2個(gè)月后的月活用戶量突破1億，成為“史上用戶增長(zhǎng)速度最快的消費(fèi)級(jí)應(yīng)用程序”[1]，成功引爆科技圈并持續(xù)“火出圈”，引發(fā)了國(guó)內(nèi)外不同領(lǐng)域?qū)θ斯ぶ悄埽ˋrtificial Intelligent, AI）的關(guān)注、思考和討論?；贑hatGPT的自述（詢問于2023年4月26日），其能夠“處理和生成超過25種編程語(yǔ)言和超過100種自然語(yǔ)言文本，且這個(gè)數(shù)字還將因不斷更新和改進(jìn)的訓(xùn)練數(shù)據(jù)和模型而有所變化”，提供“語(yǔ)言生成、語(yǔ)言理解、語(yǔ)言翻譯、文本摘要生成、代碼生成、情報(bào)分析、學(xué)術(shù)論文自動(dòng)撰寫、新聞報(bào)道自動(dòng)撰寫”等多項(xiàng)服務(wù)。無疑，ChatGPT是繼“深藍(lán)”、Watson、Alpha Go之后，AI領(lǐng)域的又一“明星級(jí)代言”應(yīng)用，推動(dòng)了AI技術(shù)和應(yīng)用的縱深發(fā)展。

就ChatGPT的本質(zhì)來看，其具有以下幾個(gè)屬性或特征：（1）生成式AI。在分析式AI和生成式AI這一組范疇中，ChatGPT屬于生成式AI，即是基于算法、模型、數(shù)據(jù)、算力和規(guī)則等生成不同類型文本內(nèi)容的LLM。2022年之前，新聞出版業(yè)所接觸和應(yīng)用的多為分析式AI，旨在通過海量數(shù)據(jù)發(fā)現(xiàn)固定模式，以實(shí)現(xiàn)內(nèi)容推薦、智能檢索、圖像識(shí)別、機(jī)器翻譯等。（2）認(rèn)知智能。AI的發(fā)展路徑[2]大致遵循“感知智能→認(rèn)知智能→情感智能→行為智能”的邏輯，分別對(duì)應(yīng)AI1.0、2.0、3.0和4.0階段。感知智能[3]主要指機(jī)器通過各種傳感器及技術(shù)模擬人的視覺、聽覺、觸覺等感知能力，從而進(jìn)行語(yǔ)音、圖像識(shí)別等。隨著AI的高速增長(zhǎng)和全面擴(kuò)張，能聽、會(huì)說、會(huì)看的“感知智能”正逐漸向具有理解和表達(dá)能力的“認(rèn)知智能”轉(zhuǎn)變[4]。ChatGPT所表現(xiàn)出來的智能，便是具有類人的學(xué)習(xí)、語(yǔ)言、理解、推理和決策能力的高級(jí)智能，是認(rèn)知智能的具體化。其核心算法，即基于人類反饋的強(qiáng)化學(xué)習(xí)Instruct模型，能夠解決內(nèi)容輸出的適人化問題，使生成內(nèi)容符合人類表達(dá)和語(yǔ)言邏輯，并盡可能的與人類認(rèn)知、需求、價(jià)值觀等相一致。（3）通用人工智能（artificial general intelligence, AGI）。限制領(lǐng)域人工智能（artificial narrow intelligence, ANI），通常指專注于完成單項(xiàng)特定任務(wù)、解決具體領(lǐng)域問題的AI，而AGI則可以勝任人類所有工作，是能夠像人類一樣感知、認(rèn)知、決策、執(zhí)行和負(fù)責(zé)的AI。在這方面，ChatGPT更多具有AGI的屬性和特征，基本能夠像人一樣完成問答、撰文、創(chuàng)作等任務(wù)，但又不完全是AGI。準(zhǔn)確地說，ChatGPT是將AI從單一領(lǐng)域擴(kuò)展到若干領(lǐng)域，但還未覆蓋全領(lǐng)域，是從ANI向AGI過渡的AI模型，也是未來強(qiáng)AI實(shí)現(xiàn)的一個(gè)雛形。

因此，在AI領(lǐng)域，ChatGPT屬于創(chuàng)造性更強(qiáng)、自主性更大、智能化程度更高的生成式智能和認(rèn)知智能，并具有AGI的性質(zhì)和特征。以ChatGPT為代表的生成式AI，也將深刻影響新聞、出版、圖書情報(bào)等領(lǐng)域，在為其帶來發(fā)展機(jī)遇的同時(shí)也提出了一系列挑戰(zhàn)。就出版而言，這些挑戰(zhàn)至少包括如何發(fā)揮ChatGPT在出版領(lǐng)域的應(yīng)用活力，如何規(guī)制其可能產(chǎn)生的著作權(quán)風(fēng)險(xiǎn)、倫理風(fēng)險(xiǎn)、文化安全風(fēng)險(xiǎn)等[5]。鑒于此，需從ChatGPT的發(fā)展沿革及功能出發(fā)，了解以ChatGPT為代表的生成式AI的技術(shù)特點(diǎn)與應(yīng)用潛力，進(jìn)而探析其對(duì)出版發(fā)展的多維影響。如此才能有效把握以ChatGPT為代表的生成式AI應(yīng)用及其背后的生成式AI技術(shù)的發(fā)展特征，并以技術(shù)預(yù)見視角洞察未來出版的發(fā)展趨勢(shì)，以達(dá)到理論引領(lǐng)實(shí)踐、理論預(yù)判并規(guī)制風(fēng)險(xiǎn)發(fā)生的效果。

1 ChatGPT 的發(fā)展沿革與功能

從發(fā)展歷程來看，ChatGPT主要經(jīng)歷了以下發(fā)展階段[6-7]：（1）基于GPT3.5的預(yù)訓(xùn)練期。OpenAI在2022年初完成了生成式預(yù)訓(xùn)練轉(zhuǎn)換模型（generative pre-trained transformer，GPT）3.5的訓(xùn)練，該模型包含1,750億個(gè)參數(shù)和1,000GB的數(shù)據(jù)集，可以通過少量的提示語(yǔ)或直接詢問生成各種類型和風(fēng)格的文本，是ChatGPT強(qiáng)大的語(yǔ)言理解和文本生成能力形成的基礎(chǔ)。（2）基于人類反饋的強(qiáng)化學(xué)習(xí)期。OpenAI利用人工智能教練（AI trainers）提供的對(duì)話數(shù)據(jù)，對(duì)GPT3.5模型進(jìn)行了有監(jiān)督的微調(diào)，使其能夠以對(duì)話模式與用戶交互。同時(shí)，OpenAI也收集了人類教練對(duì)不同模型回答的評(píng)價(jià)數(shù)據(jù)，用于構(gòu)建獎(jiǎng)勵(lì)模型（reward model），并利用近端策略優(yōu)化（proximal policy optimization，PPO）算法對(duì)其進(jìn)行強(qiáng)化學(xué)習(xí)，使ChatGPT能夠更好地適應(yīng)不同的對(duì)話場(chǎng)景和主題。（3）研究預(yù)覽和公開測(cè)試期。OpenAI于2022年11月發(fā)布了ChatGPT的研究預(yù)覽，邀請(qǐng)公眾在其官方網(wǎng)站上進(jìn)行免費(fèi)試用，希望通過這種方式收集用戶的反饋和建議，在進(jìn)一步發(fā)現(xiàn)ChatGPT優(yōu)勢(shì)和局限的基礎(chǔ)上進(jìn)行改進(jìn)和拓展。未來，OpenAI還將積極探索ChatGPT的低成本應(yīng)用和商業(yè)化拓展，以不斷增強(qiáng)ChatGPT在不同領(lǐng)域的可用性和實(shí)用性。

在功能上，ChatGPT的主要功能早就在大眾對(duì)其的冠名之中呈現(xiàn)出了不同的面向。ChatGPT自稱是“優(yōu)化對(duì)話語(yǔ)言模型”（optimizing language models for dialogue）。不同領(lǐng)域?qū)W者則稱之為“對(duì)話系統(tǒng)”“聊天預(yù)訓(xùn)練生成模型”“人工智能聊天機(jī)器人”“生成型預(yù)訓(xùn)練聊天機(jī)器人”“對(duì)話式AI機(jī)器人”“人機(jī)對(duì)話應(yīng)用程序”“聊天機(jī)器人程序（文字版的AI語(yǔ)音助手）”等。綜合以上種種，ChatGPT的主要功能包括：其一，智能回答。基于海量數(shù)據(jù)、強(qiáng)大的邏輯推理能力和適人化的表達(dá)習(xí)慣，對(duì)用戶提出的個(gè)性化、差異化問題，輸出更真實(shí)、更有效、更加適配的答案。其二，內(nèi)容創(chuàng)作。能夠?qū)崿F(xiàn)論文撰寫、創(chuàng)意寫作、新聞稿件撰寫、詩(shī)歌創(chuàng)作等。其三，代碼編寫。通過分析數(shù)據(jù)執(zhí)行特定編程任務(wù)，如開發(fā)相應(yīng)的AI軟件代碼等，起到以“人工之智能構(gòu)建人工智能”的效果。其四，內(nèi)容翻譯。能夠?qū)崿F(xiàn)多種語(yǔ)言之間的切換翻譯，用于著作翻譯或多語(yǔ)種教學(xué)等。其五，教育輔導(dǎo)。一方面為學(xué)生用戶提供個(gè)性化、定制化的課程資源、輔導(dǎo)材料或試題等；另一方面，根據(jù)教師用戶的特定需要，提供教學(xué)所需的內(nèi)容資源、經(jīng)典教學(xué)案例或?qū)W生就業(yè)指導(dǎo)參考資料等。

2 生成式智能出版的技術(shù)原理

智能出版，是指以智能化的數(shù)字技術(shù)對(duì)作品進(jìn)行編輯加工后，經(jīng)過復(fù)制發(fā)行的新型出版[8]。在《智能出版：現(xiàn)代出版技術(shù)原理與應(yīng)用》一書中，筆者重點(diǎn)分析了出版流程智能再造、出版大數(shù)據(jù)、出版知識(shí)服務(wù)、增強(qiáng)現(xiàn)實(shí)出版、虛擬現(xiàn)實(shí)出版、基于5G的出版、基于區(qū)塊鏈的出版以及基于智能機(jī)器人的出版應(yīng)用等，基本勾勒出了智能出版的輪廓。隨著GPT等生成式AI技術(shù)的進(jìn)一步發(fā)展和迭代，生成式智能出版這一智能出版的新業(yè)態(tài)也呼之欲出，并將在出版業(yè)的內(nèi)部流程智能變革和外部產(chǎn)品服務(wù)智能化兩方面展現(xiàn)出新特點(diǎn)和新趨勢(shì)。

生成式智能出版，是基于生成式AI技術(shù)而出現(xiàn)的新型出版業(yè)態(tài)或新出版階段。生成式智能出版的技術(shù)底座是生成式AI，其技術(shù)原理由數(shù)據(jù)、算法和算力三個(gè)部分組成，如圖1所示，本文以ChatGPT及其背后的技術(shù)原理為基礎(chǔ)作進(jìn)一步的闡釋。

圖1 生成式AI 的技術(shù)原理Fig.1 Technical Principles of Generative AI

2.1 海量無標(biāo)注文本數(shù)據(jù)和高質(zhì)量人工標(biāo)注數(shù)據(jù)優(yōu)勢(shì)

數(shù)據(jù)是能源，是生產(chǎn)要素，是基礎(chǔ)，也是訓(xùn)練語(yǔ)料?！罢Z(yǔ)料體系是語(yǔ)言模型的基礎(chǔ)”[9]，海量的、高質(zhì)量的、大規(guī)模的語(yǔ)料是ChatGPT得以應(yīng)用的基礎(chǔ)，也是生成式智能出版的關(guān)鍵要素之一。

目前，ChatGPT的訓(xùn)練語(yǔ)料或數(shù)據(jù)來源有兩類。一是無標(biāo)注文本數(shù)據(jù)。即從網(wǎng)頁(yè)、WebText2、圖書、維基百科等渠道搜集的約3,000億單詞語(yǔ)料，經(jīng)過數(shù)據(jù)清理后形成超過1,750億的巨量無標(biāo)注文本數(shù)據(jù)[10]；通過對(duì)海量無標(biāo)注語(yǔ)料的預(yù)訓(xùn)練和學(xué)習(xí)，ChatGPT能夠熟練掌握復(fù)雜的語(yǔ)言表達(dá)模式、文字前后邏輯、知識(shí)元關(guān)系等知識(shí)內(nèi)容[11]，而這是其對(duì)話能力得以增強(qiáng)的前提和基礎(chǔ)。二是有標(biāo)注文本數(shù)據(jù)。ChatGPT融入了由40名標(biāo)注人員主導(dǎo)的、數(shù)萬高質(zhì)量的、符合人類偏好的人工標(biāo)注數(shù)據(jù)，以推動(dòng)ChatGPT成為“聽得懂人類語(yǔ)言、自身?yè)碛信袛鄻?biāo)準(zhǔn)的LLM”[12]。同時(shí)，通過對(duì)高質(zhì)量標(biāo)注數(shù)據(jù)的針對(duì)性微調(diào)，ChatGPT的對(duì)話能力進(jìn)一步增強(qiáng)。某種程度而言，40位專家的參與，是人類智慧和機(jī)器智能的融合、人工評(píng)分和獎(jiǎng)勵(lì)模型的融合，賦予了ChatGPT“人格”，最終實(shí)現(xiàn)了ChatGPT輸出的人性化和適人化。

2.2 基于人類反饋的強(qiáng)化學(xué)習(xí)算法優(yōu)勢(shì)

就算法而言，GPT3.5模型為ChatGPT提供了技術(shù)支持。GPT是一種基于互聯(lián)網(wǎng)可用數(shù)據(jù)訓(xùn)練的文本生成深度學(xué)習(xí)模型，采用“基于人類反饋的強(qiáng)化學(xué)習(xí)技術(shù)”（reinforcement learning with human feedback，RLHF），即基于獎(jiǎng)勵(lì)模型和近端策略優(yōu)化模型進(jìn)行訓(xùn)練[6]，實(shí)現(xiàn)人類和機(jī)器的相互問答并不斷對(duì)其算法加以迭代，“使模型逐漸具有對(duì)生成答案的評(píng)判能力”[12]。評(píng)判的標(biāo)準(zhǔn)是適人化，即ChatGPT的輸出與人類常識(shí)、常情、常理是否一致，與人類的認(rèn)知、需求和價(jià)值觀是否一致。具體而言，RLHF的訓(xùn)練過程由預(yù)訓(xùn)練語(yǔ)言模型訓(xùn)練、打分模型訓(xùn)練和基于強(qiáng)化學(xué)習(xí)的語(yǔ)言模型優(yōu)化三個(gè)步驟構(gòu)成[12]。

預(yù)訓(xùn)練語(yǔ)言模型訓(xùn)練。即使用無監(jiān)督學(xué)習(xí)算法對(duì)大規(guī)模文本數(shù)據(jù)集進(jìn)行訓(xùn)練，以學(xué)習(xí)、理解和生成自然語(yǔ)言[13]，形成自然語(yǔ)言的復(fù)雜意圖理解、因果關(guān)系判斷以及特定文本摘要抽取等功能。

打分模型訓(xùn)練。該階段設(shè)置獎(jiǎng)勵(lì)模型，利用標(biāo)注好的數(shù)萬條人類偏好數(shù)據(jù)，進(jìn)行有監(jiān)督的代碼微調(diào)和指令微調(diào)，旨在評(píng)估模型的輸出是否符合人類表現(xiàn)以及表現(xiàn)的優(yōu)劣，從而推動(dòng)輸出內(nèi)容更接近人類表現(xiàn)。

基于強(qiáng)化學(xué)習(xí)的語(yǔ)言模型優(yōu)化?；谏鲜鲇?xùn)練好的獎(jiǎng)勵(lì)模型，使用強(qiáng)化學(xué)習(xí)PPO算法來優(yōu)化ChatGPT、最大化獎(jiǎng)勵(lì)[14]，建構(gòu)生成思維鏈（chain-of-thought）進(jìn)行復(fù)雜推理，以提高ChatGPT“知道知道”“知道不知道”的能力，減少“不知道知道”“不知道不知道”的限制，并通過逐步思考以幫助其回答不知道的問題[15]。

2.3 持續(xù)超強(qiáng)算力支持

在AI三要素之中，數(shù)據(jù)代表著生產(chǎn)要素或生產(chǎn)資料，算法意味著新的生產(chǎn)關(guān)系，算力則表征著新的生產(chǎn)力。算力水平的高低、強(qiáng)弱決定著算法作用的發(fā)揮和數(shù)據(jù)處理能力的大小。

ChatGPT能夠成為AI發(fā)展的里程碑式成果，離不開超強(qiáng)算力的支撐。在算力方面[12]，ChatGPT使用的GPT3.5模型在微軟云計(jì)算服務(wù)Azure AI的超算基礎(chǔ)設(shè)施上訓(xùn)練，總算力消耗約為3,640PF-days（按每秒一千萬億次計(jì)算，須運(yùn)行3,640天）。語(yǔ)料訓(xùn)練和模型運(yùn)行也需要龐大的算力，有研究估測(cè)，完成GPT3的訓(xùn)練，需要有上萬個(gè)英偉達(dá)CPU/GPU24小時(shí)不間斷輸入數(shù)據(jù)，或者說需要7-8個(gè)投資規(guī)模在30億、算力500P的數(shù)據(jù)中心才可支撐其運(yùn)行，一次運(yùn)算要花費(fèi)450萬美元，且算力需求每?jī)蓚€(gè)月都會(huì)翻一番。此外，據(jù)稱新一代GPT5大模型正在25,000個(gè)英偉達(dá)GPU上訓(xùn)練，換言之，需要幾萬片英偉達(dá)計(jì)算設(shè)備的算力支持[16]。

3 生成式AI 推動(dòng)出版流程智能革新

“從人工智能的視角審視出版業(yè)，流程再造、流程重塑將會(huì)首當(dāng)其沖，以大量的自動(dòng)化、智能化系統(tǒng)取代人力資源的投入將會(huì)成為主要趨勢(shì)”[17]?；谏鲜錾墒紸I數(shù)據(jù)、算法和算力的優(yōu)勢(shì)，生成式智能出版較以往智能出版，在出版流程內(nèi)部變革方面將帶來一些新的啟迪和思考。一般而言，智能出版流程涉及智能選題策劃與協(xié)同撰稿、智能審校、智能印刷、智能發(fā)行等[18]，覆蓋內(nèi)容生產(chǎn)、編輯加工、復(fù)制印刷、營(yíng)銷傳播四個(gè)關(guān)鍵環(huán)節(jié)。在生成式AI技術(shù)發(fā)展的背景下，生成式智能出版在內(nèi)容生產(chǎn)方式、編校方式、印刷場(chǎng)景和發(fā)行營(yíng)銷等方面都將呈現(xiàn)出新特點(diǎn)和新趨勢(shì)，如圖2所示。

3.1 由專業(yè)生產(chǎn)內(nèi)容到人工智能生產(chǎn)內(nèi)容

歷經(jīng)二十年數(shù)字出版的蓬勃發(fā)展，出版業(yè)的內(nèi)容生產(chǎn)方式逐漸由專業(yè)生成內(nèi)容（professional generated content,PGC）向用戶生成內(nèi)容（user generated content, UGC）轉(zhuǎn)型，并在生成式AI技術(shù)的加持下，進(jìn)一步升級(jí)至人工智能生成內(nèi)容（artificial intelligence generated content, AIGC）。AIGC可視為是從內(nèi)容生產(chǎn)者視角進(jìn)行分類的一類內(nèi)容、一種內(nèi)容生產(chǎn)方式，或者說是用于內(nèi)容自動(dòng)化生成的一類技術(shù)集合[19]，具有內(nèi)容屬性、主體屬性和技術(shù)屬性。

上述內(nèi)容生產(chǎn)方式的“轉(zhuǎn)型”“升級(jí)”并不意味著PGC完全被UGC、AIGC取而代之，而是強(qiáng)調(diào)內(nèi)容生產(chǎn)方式的多元化、內(nèi)容生產(chǎn)體系的健全化。一如數(shù)字出版不是對(duì)傳統(tǒng)出版全然顛覆，而是豐富出版業(yè)的產(chǎn)品供給、技術(shù)供給和用戶體驗(yàn)供給，實(shí)現(xiàn)技術(shù)與出版的深度融合，進(jìn)而推動(dòng)出版業(yè)的高質(zhì)量發(fā)展。出版實(shí)踐也證明，PGC在當(dāng)前仍然占據(jù)著內(nèi)容生產(chǎn)的主流和統(tǒng)治地位，并沒有因UGC或AIGC的出現(xiàn)而受到動(dòng)搖或撼動(dòng)。

在ChatGPT背后的生成式AI技術(shù)的賦能下，AIGC的出版產(chǎn)品數(shù)量和質(zhì)量將會(huì)得到質(zhì)的提升，同時(shí)也會(huì)引起PGC、UGC出現(xiàn)新的變化。

首先，AIGC規(guī)模、效率、模態(tài)和質(zhì)量的跨越式發(fā)展，將深遠(yuǎn)影響出版業(yè)的內(nèi)容生產(chǎn)。在內(nèi)容規(guī)模方面，較傳統(tǒng)的機(jī)器撰稿、機(jī)器人新聞，AIGC支持長(zhǎng)文檔搜索分析和咨詢、超長(zhǎng)文本對(duì)話和長(zhǎng)文本構(gòu)建，所輸出的內(nèi)容長(zhǎng)度有了質(zhì)的突破；而以往機(jī)器人撰稿僅局限在數(shù)百字的客觀性事實(shí)報(bào)道，如財(cái)經(jīng)新聞、地震新聞、體育新聞等。在輸出效率方面，AIGC的輸出時(shí)間大為縮短，已可以在10秒內(nèi)架構(gòu)一個(gè)網(wǎng)站、60秒設(shè)計(jì)一個(gè)游戲，僅一次對(duì)話便可產(chǎn)生一部劇本或短篇小說。事實(shí)上，早在2018年，微軟小冰聊天機(jī)器人便可用不到4秒的時(shí)間創(chuàng)作完成40行的長(zhǎng)詩(shī)歌《致十年后》，ChatGPT的創(chuàng)作效率則有過之而無不及。在內(nèi)容模態(tài)方面，AIGC已經(jīng)可以同時(shí)支持生成包含文字、圖片、音頻、視頻等在內(nèi)的多模態(tài)內(nèi)容，也可以面向增強(qiáng)現(xiàn)實(shí)出版物提供3D模型、面向虛擬現(xiàn)實(shí)出版物提供數(shù)字化虛擬環(huán)境，真正做到了基于知識(shí)體系的多模態(tài)內(nèi)容輸出。在輸出質(zhì)量方面，高精準(zhǔn)的圖像識(shí)別，基于文獻(xiàn)提煉摘要，堪比人類水平的法律、數(shù)學(xué)和語(yǔ)言考試等，均彰顯出AIGC的高水平學(xué)習(xí)、理解、推理和表達(dá)能力。AIGC算法中蘊(yùn)藏的歸納、總結(jié)、推理等思維能力甚至已經(jīng)超出了大部分人類的水平，某種程度而言具有了強(qiáng)AI的特征。

鑒于AIGC上述的卓越表現(xiàn)，出版業(yè)的內(nèi)容生產(chǎn)理念、制度和實(shí)踐也會(huì)受到長(zhǎng)遠(yuǎn)影響。一則，在出版業(yè)的內(nèi)容生產(chǎn)理念中，“作者”可能會(huì)被顛覆或被重新詮釋。未來的知識(shí)生產(chǎn)或知識(shí)的原材料生產(chǎn)、直接生產(chǎn)、個(gè)體化生產(chǎn)的主體，將不僅僅局限于“自然人”或“法人”，而是將擴(kuò)展至AI、機(jī)器，需要深入研討的是AI能否成為著作權(quán)主體，可否賦予人格。二則，出版業(yè)內(nèi)容生產(chǎn)制度體系亟待重塑和重整：（1）在內(nèi)容直接生產(chǎn)方面，需在發(fā)展以往依靠出版社人力資源所進(jìn)行的自編書制度的同時(shí)，擴(kuò)展基于AI的自編書制度，以不斷提升出版機(jī)構(gòu)自主知識(shí)產(chǎn)權(quán)的比例；（2）在內(nèi)容組織方面，除傳統(tǒng)的策劃、約稿或接受自投稿制度以外，須建立面向AI的策劃、約稿或接受其自投稿的內(nèi)容生產(chǎn)制度；（3）在內(nèi)容審校方面，出版業(yè)作為內(nèi)容選擇產(chǎn)業(yè)，除進(jìn)一步發(fā)揮好人力審校制度的作用以外，人機(jī)協(xié)同審校制度將因適應(yīng)數(shù)字化、智能化發(fā)展需要而得以建立并不斷完善。三則，出版業(yè)的內(nèi)容生產(chǎn)實(shí)踐將經(jīng)常出現(xiàn)AI協(xié)助創(chuàng)作、輔助創(chuàng)作、自主創(chuàng)作的事例，輸出AIGC、AI協(xié)同專業(yè)生成內(nèi)容（AIPGC）、AI協(xié)同用戶生成內(nèi)容（AIUGC）等多元內(nèi)容類型[5]。事實(shí)上，早在ChatGPT出現(xiàn)以前，施普林格 ·自然（Springer Nature）、電子工業(yè)出版社、北京聯(lián)合出版公司等國(guó)內(nèi)外出版機(jī)構(gòu)已紛紛涉足AI生成圖書的出版領(lǐng)域，陸續(xù)出版《鋰離子電池：當(dāng)前研究的機(jī)器生成摘要》《CRISPR——計(jì)算機(jī)生成的文獻(xiàn)綜述》《極簡(jiǎn)區(qū)塊鏈》《陽(yáng)光失了玻璃窗》等AIGC出版物。在2021年，人民法院出版社依托法信大數(shù)據(jù)平臺(tái)與圖書編輯部合作，借助知識(shí)體系和智能串聯(lián)的優(yōu)勢(shì)，從數(shù)據(jù)庫(kù)中調(diào)取結(jié)構(gòu)化、專業(yè)化的法律條目和知識(shí)元，在數(shù)周時(shí)間內(nèi)從資源中臺(tái)中導(dǎo)出生成了《智慧辦案手冊(cè)》圖書初稿，直接變革和顛覆了書稿創(chuàng)作模式，推動(dòng)出版社由傳統(tǒng)的“編校印發(fā)”流程向著“創(chuàng)編校印發(fā)”的流程變革甚至是流程革命。目前，這場(chǎng)深遠(yuǎn)的組織流程革命仍在路上。

其次，UGC與AIGC協(xié)同發(fā)力，將推動(dòng)作品質(zhì)量進(jìn)一步提升和優(yōu)化。UGC的出現(xiàn)，降低了內(nèi)容生產(chǎn)者的進(jìn)入資質(zhì)和門檻，擴(kuò)大了內(nèi)容生產(chǎn)者隊(duì)伍，也進(jìn)一步豐富和滿足了人們的學(xué)習(xí)、閱讀、審美和陶冶情操等需要。其中，網(wǎng)絡(luò)文學(xué)便是數(shù)字出版業(yè)中最典型的UGC業(yè)態(tài)。ChatGPT的出現(xiàn)，意味著AIUGC這一新業(yè)態(tài)的萌芽。事實(shí)上，AIUGC將擴(kuò)大UGC作品的數(shù)量規(guī)模，提高UGC作品的產(chǎn)出效率，優(yōu)化UGC作品的品質(zhì)和結(jié)構(gòu)，實(shí)現(xiàn)創(chuàng)作圖文聲像影多模態(tài)融合的優(yōu)質(zhì)UGC作品，進(jìn)而推動(dòng)UGC作品更好地滿足人們個(gè)性化、定制化、多元化的精神文化需要。

最后，PGC聯(lián)手AIGC，將形成PGC與AIGC共存共生的內(nèi)容生產(chǎn)新格局。一直以來，PGC以其精準(zhǔn)、可控、高質(zhì)量、高可信度而居于內(nèi)容生成體系的主流地位。但較之UGC、AIGC，PGC的生產(chǎn)效率相對(duì)較低，產(chǎn)品規(guī)模始終局限于一定的體量而難以實(shí)現(xiàn)新的躍升，比如我國(guó)圖書出版總冊(cè)數(shù)始終在50萬種左右，新書品種數(shù)近年來一直在20-26萬種。同時(shí)，PGC作品的質(zhì)量也受制于編輯素養(yǎng)和能力，這就意味著并非所有的PGC作品的質(zhì)量和水平天然高于AIGC作品，在體系化、整合性、集成創(chuàng)新等方面，PGC作品較AIGC作品遜色不少。隨著生成式AI技術(shù)賦能出版業(yè)的范圍越廣、程度越深、時(shí)間越久，PGC和AIGC之間的融合趨勢(shì)將會(huì)更加明顯?；贏I的PGC將會(huì)陸續(xù)出現(xiàn)并不斷得到創(chuàng)新發(fā)展，如AI協(xié)助專業(yè)生產(chǎn)內(nèi)容、AI輔助專業(yè)生產(chǎn)內(nèi)容等AIPGC形式將兼采PGC專業(yè)化、高質(zhì)量和AIGC高效率、大規(guī)模、多模態(tài)、整合創(chuàng)新的優(yōu)勢(shì)，推動(dòng)包含出版業(yè)在內(nèi)的內(nèi)容產(chǎn)業(yè)實(shí)現(xiàn)創(chuàng)新、可持續(xù)和高質(zhì)量發(fā)展。

3.2 從人工編校到人機(jī)協(xié)同智能編校

ChatGPT對(duì)出版流程所帶來的影響，除了內(nèi)容生成、內(nèi)容組織（選題策劃）以外，還包括編校環(huán)節(jié)。AIGC出版物的大量出現(xiàn)，對(duì)傳統(tǒng)編校模式提出了挑戰(zhàn)，也推動(dòng)著人機(jī)協(xié)同編校理念更新、模式更新和路徑更新。

隨著生成式智能時(shí)代的到來，PGC將在其中扮演愈發(fā)重要的角色；“AI+人工”的內(nèi)容審核機(jī)制將成為產(chǎn)業(yè)主流，機(jī)器審核的重要性不言而喻[20]。傳統(tǒng)審校模式，基本上都是以人工審核為主，由責(zé)任編輯、文字編輯來承擔(dān)三審三校的主要職責(zé)。“黑馬校對(duì)”等校對(duì)軟件主要起到的是輔助作用，基本局限于錯(cuò)別字、語(yǔ)法語(yǔ)式、標(biāo)點(diǎn)符號(hào)等方面，而對(duì)于內(nèi)容潤(rùn)色、提升、改寫等較深層次的審核和把關(guān)，則顯力有不逮或是無能為力。生成式智能出版到來以后，“人工為主、軟件為輔”的審校模式面臨諸多挑戰(zhàn)：一則，AIGC出版物的內(nèi)容系基于海量數(shù)據(jù)編排、整合的結(jié)果，其觀點(diǎn)的原創(chuàng)性、可版權(quán)性、真?zhèn)涡缘?，往往難以通過人力加以判斷；二則，AIGC輸出內(nèi)容之速度、效率、規(guī)模是難以估量的，僅僅依靠數(shù)量有限的編輯勞動(dòng)力進(jìn)行審核將難堪重負(fù)；三則，基于AIGC輸出的數(shù)據(jù)、信息和知識(shí)，其更新之速度、創(chuàng)新之程度、革新之力度，或高于作為審核主體的編輯個(gè)人知識(shí)水平和素質(zhì)，易出現(xiàn)編輯主體專業(yè)技能和數(shù)字素養(yǎng)的提升跟不上AIGC創(chuàng)新和迭代的情況。

為了更好解決上述問題，出版業(yè)尤其需要強(qiáng)化智能編校系統(tǒng)的研發(fā)和應(yīng)用，在自動(dòng)糾錯(cuò)系統(tǒng)、敏感詞識(shí)別與排查系統(tǒng)、協(xié)同編纂系統(tǒng)等方面開展持續(xù)的技術(shù)攻關(guān)和應(yīng)用落地，并主動(dòng)推動(dòng)“人工審核→人機(jī)互補(bǔ)協(xié)同審核→人機(jī)混合協(xié)同審核→人機(jī)融合協(xié)同審核→人機(jī)整體協(xié)同審核”[21]的路徑生成與演進(jìn)。對(duì)此，首先，須確立人機(jī)共生的理念，理解并運(yùn)用“（人-技術(shù)）→世界”的具身關(guān)系。隨著數(shù)字技術(shù)賦能和賦權(quán)的深入，技術(shù)的融合性逐漸增強(qiáng)[22]，技術(shù)不斷具身至人們的實(shí)踐之中，人們也借助技術(shù)實(shí)現(xiàn)感知、表達(dá)和行動(dòng)，技術(shù)與人類個(gè)體不斷融合并賦予人類個(gè)體充分使用技術(shù)的能力。就審?；顒?dòng)來講，出版編輯借助智能審校、協(xié)同編纂等技術(shù)，將快速識(shí)別敏感詞、自動(dòng)糾錯(cuò)、異時(shí)異地協(xié)同編纂等技能不斷融入自身，實(shí)現(xiàn)了數(shù)字技術(shù)賦能自我，從而能夠更快速、更有效、更高質(zhì)量地完成圖書編校任務(wù)。其次，需重視智能審校工具系統(tǒng)的運(yùn)用，以彌補(bǔ)人工審校的短板和不足。基本思路是以AI工具來審核、校對(duì)AIGC作品，依托智能審核工具識(shí)別文稿的語(yǔ)義錯(cuò)誤、語(yǔ)法錯(cuò)誤、敏感詞匯等，借助智能校對(duì)系統(tǒng)校異同、校是非，以提升文稿的編校質(zhì)量。換言之，以機(jī)器審核機(jī)器生成的內(nèi)容，以AI審核生成式智能出版物。實(shí)踐中，人民日?qǐng)?bào)AI智能編輯部、方正電子公司的“智能編校排”系統(tǒng)、知識(shí)產(chǎn)權(quán)出版社的“中知編校”系統(tǒng)已經(jīng)成功研發(fā)，并在數(shù)百家報(bào)紙、期刊和出版社中得以應(yīng)用。最后，人機(jī)融合協(xié)同審核是生成式智能出版的現(xiàn)實(shí)方案。人機(jī)融合協(xié)同審核是人機(jī)融合智能的具體應(yīng)用，其關(guān)鍵在于將人類智慧和機(jī)器計(jì)算能力相結(jié)合，將編輯人工審核經(jīng)驗(yàn)知識(shí)和機(jī)器審核海量數(shù)據(jù)有機(jī)融合，以及將編輯價(jià)值判斷和機(jī)器算法相匹配協(xié)調(diào)，從而做到主流價(jià)值駕馭算法訓(xùn)練。

3.3 基于生成式AI的印刷場(chǎng)景創(chuàng)新

在印刷環(huán)節(jié)，隨著生成式AI技術(shù)的應(yīng)用，智能印刷流程將進(jìn)一步健全，智能印刷場(chǎng)景也將進(jìn)一步豐富和拓新。這里涉及以下幾方面。

（1）編校環(huán)節(jié)與印刷環(huán)節(jié)的數(shù)字化銜接。一直以來，出版編校環(huán)節(jié)和印刷環(huán)節(jié)在物理空間上是暢通的，而在網(wǎng)絡(luò)空間上則是異步、隔離的，這種局面往往出于對(duì)出版內(nèi)容安全、數(shù)據(jù)安全的考量。然而，如果缺乏數(shù)字化、智能化、協(xié)同化的編校印刷系統(tǒng)，而仍舊依靠膠片傳送、郵箱發(fā)送或拷貝印刷文件來實(shí)現(xiàn)二者的銜接，就無法真正稱之為智能印刷。事實(shí)上，基于智能軟硬件的智能印刷還未真正達(dá)到智能化水平，需輔以智能化ERP管理系統(tǒng)來落實(shí)[23]。由此，至少對(duì)出版與印刷隸屬同一單位的出版企業(yè)而言，編校印一體化、協(xié)同化、智能化的生產(chǎn)管理系統(tǒng)是智能印刷的重要組成部分。生成式AI技術(shù)則能夠?yàn)橹悄芑纳a(chǎn)管理系統(tǒng)提供業(yè)務(wù)咨詢、出版內(nèi)容、多模態(tài)文件、用戶數(shù)據(jù)等，甚至是可以協(xié)助進(jìn)行智能化生產(chǎn)管理系統(tǒng)的代碼編寫。

（2）生成式AI技術(shù)引領(lǐng)和驅(qū)動(dòng)按需印刷業(yè)務(wù)?；贑hatGPT等生成式AI程序，用戶能夠通過對(duì)話和檢索提出個(gè)性化、定制化的知識(shí)需求，并得到某個(gè)特定行業(yè)或領(lǐng)域的專屬知識(shí)問題解答或知識(shí)解決方案。這種AIGC作品或解決方案，正滿足了用戶各取所需的數(shù)據(jù)或知識(shí)需求，并可進(jìn)一步通過和印刷的深度融合，即按需咨詢、按需檢索和按需印刷的融合，持續(xù)衍生出多樣化的按需印刷場(chǎng)景和業(yè)務(wù)。

（3）生成式AI技術(shù)服務(wù)智能印刷廠建設(shè)。ChatGPT的躥紅，也帶動(dòng)了印刷行業(yè)布局AI應(yīng)用和智能工廠建設(shè)的熱度[24]，多家印刷包裝上市公司紛紛借助AIGC技術(shù)開展智能選品、廣告智能輸出和投放、印刷客服智能回復(fù)等業(yè)務(wù)。AIGC技術(shù)在智能印刷廠方面起到的主要作用還是檢索、咨詢和輸出，體現(xiàn)為：其一，擔(dān)任“AI虛擬廠長(zhǎng)”或“智能語(yǔ)音機(jī)器人”，實(shí)現(xiàn)語(yǔ)音交互，對(duì)訂單執(zhí)行、原材料和庫(kù)存等生產(chǎn)經(jīng)營(yíng)數(shù)據(jù)進(jìn)行智能查詢和預(yù)警分析；其二，用于智能客服咨詢，減少人力資源投入，提升在線客服效率和售后服務(wù)水平；其三，輸出智能廣告和營(yíng)銷文案，增強(qiáng)印刷廣告文案水平，提升印刷工作的營(yíng)銷效率。目前，AI技術(shù)在智能印刷廠建設(shè)方面所起到的作用仍是輔助性的，要真正實(shí)現(xiàn)智能印刷廠的自動(dòng)化、智能化和提升良品率、提高生產(chǎn)效率的融合，還需要不斷地思考、探索和實(shí)踐。

3.4 基于生成式AI的營(yíng)銷變革

ChatGPT等LLM對(duì)出版營(yíng)銷環(huán)節(jié)的多維變革和多角度賦能，也是AIGC作用于出版業(yè)的題中之義。

其一，對(duì)ChatGPT等預(yù)訓(xùn)練語(yǔ)料集的熟練運(yùn)用，能夠有效提升出版營(yíng)銷規(guī)劃力、品牌建設(shè)力、產(chǎn)品認(rèn)知力、競(jìng)品分析力[25]，從而提高出版營(yíng)銷編輯的數(shù)字化營(yíng)銷素質(zhì)和能力。在海量無標(biāo)注文本優(yōu)勢(shì)的基礎(chǔ)上，聘請(qǐng)數(shù)十名出版專家進(jìn)行數(shù)據(jù)標(biāo)記，以充分發(fā)揮有標(biāo)注的、帶有出版“烙印”的人工標(biāo)注數(shù)據(jù)優(yōu)勢(shì)；通過對(duì)語(yǔ)料庫(kù)中的國(guó)內(nèi)外出版機(jī)構(gòu)、出版領(lǐng)域、出版業(yè)態(tài)的戰(zhàn)略規(guī)劃、品牌構(gòu)成、產(chǎn)品體系、核心競(jìng)爭(zhēng)力等加以分析，經(jīng)過RLHF的訓(xùn)練，形成可借鑒的出版營(yíng)銷戰(zhàn)略規(guī)劃或營(yíng)銷建議，以提升出版營(yíng)銷編輯的數(shù)字化素養(yǎng)和專業(yè)營(yíng)銷技能，為出版營(yíng)銷環(huán)節(jié)的提質(zhì)增效注入主體動(dòng)力。

其二，有助于創(chuàng)建原創(chuàng)性的營(yíng)銷文檔，提高圖書營(yíng)銷效率和質(zhì)量。在分析式AI的加持下，出版營(yíng)銷環(huán)節(jié)基于海量用戶數(shù)據(jù)優(yōu)勢(shì)以及用戶精準(zhǔn)畫像，涌現(xiàn)出了大數(shù)據(jù)營(yíng)銷、網(wǎng)絡(luò)直播營(yíng)銷、視頻號(hào)營(yíng)銷等多元化營(yíng)銷方式，提升了出版營(yíng)銷效率和效能，推動(dòng)了出版營(yíng)銷的數(shù)字化改革與升級(jí)。但與此同時(shí)，這些營(yíng)銷形態(tài)也暴露出一些不足，如“網(wǎng)紅主播雖然熟諳直播規(guī)律，但是難以駕馭專門的學(xué)科知識(shí)，對(duì)圖書價(jià)值認(rèn)識(shí)不足，圖書的文化屬性往往被忽略”[26]。進(jìn)一步分析可知，網(wǎng)紅直播所用的營(yíng)銷文案，往往在圖書營(yíng)銷的針對(duì)性方面有所不足，與專業(yè)圖書營(yíng)銷文案相比存在一定差距，而基于AIGC的營(yíng)銷文案則能夠解決圖書營(yíng)銷的精準(zhǔn)性、適配性問題，可基于目標(biāo)領(lǐng)域的特征訓(xùn)練模型，如針對(duì)圖書產(chǎn)品的供給側(cè)和需求側(cè)進(jìn)行上下游文案設(shè)計(jì)，實(shí)現(xiàn)商品營(yíng)銷文案的智能生成和自動(dòng)推送[27]。并且，AIGC模型生成的營(yíng)銷文案，能夠綜合調(diào)用語(yǔ)料庫(kù)的文字、圖片、音頻、視頻、3D模型甚至是虛擬環(huán)境軟件等多模態(tài)素材，在豐富出版營(yíng)銷文案形式的同時(shí)，提高全媒體營(yíng)銷文案設(shè)計(jì)的效率。此外，AIGC模型還可生成論文長(zhǎng)摘要，根據(jù)目標(biāo)用戶的知識(shí)問題需求，準(zhǔn)確提煉出期刊文章的精華部分，在編輯“不在場(chǎng)”的情境下有效提升期刊文章營(yíng)銷效率。

其三，有利于推動(dòng)出版數(shù)據(jù)建設(shè)，提升出版內(nèi)容數(shù)據(jù)、用戶數(shù)據(jù)和交互數(shù)據(jù)建設(shè)水平，推動(dòng)客戶關(guān)系管理系統(tǒng)的建立和完善，為高質(zhì)量出版營(yíng)銷奠定基礎(chǔ)。涵蓋上百種語(yǔ)言、囊括大量期刊圖書、多達(dá)上萬億參量的ChatGPT語(yǔ)料庫(kù)，本身就蘊(yùn)涵著古往今來規(guī)模最大、數(shù)據(jù)最全的出版內(nèi)容數(shù)據(jù)；同時(shí)，對(duì)多達(dá)上億用戶數(shù)據(jù)的采集、統(tǒng)計(jì)和分析，也有利于摸清用戶的閱讀偏好、消費(fèi)傾向、個(gè)人特征等，以此確定用戶的基本數(shù)據(jù)和閱讀數(shù)據(jù)，從而推動(dòng)用戶數(shù)據(jù)建設(shè)；最后，每月多達(dá)數(shù)百萬用戶的評(píng)論、點(diǎn)贊、交流等交互數(shù)據(jù)，對(duì)其進(jìn)行學(xué)習(xí)、理解、分析和計(jì)算，也將有助于把握用戶的學(xué)習(xí)和閱讀需求，便于針對(duì)性地提供出版產(chǎn)品服務(wù)，從而推動(dòng)出版產(chǎn)品營(yíng)銷工作的優(yōu)化和改善。在擁有出版內(nèi)容數(shù)據(jù)、用戶數(shù)據(jù)和交互數(shù)據(jù)的基礎(chǔ)上，對(duì)其進(jìn)行負(fù)責(zé)任地使用和創(chuàng)新利用，可進(jìn)一步形成客戶關(guān)系管理系統(tǒng)，形成出版客戶數(shù)據(jù)資產(chǎn)，這是出版營(yíng)銷工作高質(zhì)量推進(jìn)的基礎(chǔ)。值得說明的是，客戶關(guān)系管理系統(tǒng)建設(shè)是工匠精神在出版營(yíng)銷環(huán)節(jié)的體現(xiàn)，也是出版高質(zhì)量發(fā)展的重要數(shù)字基礎(chǔ)設(shè)施。

此外，基于AIGC的虛擬客服或虛擬數(shù)字人，可以24小時(shí)全方位、全天候地提供圖書推薦和售后服務(wù)。生成式AI的主要應(yīng)用場(chǎng)景之一便是根據(jù)用戶個(gè)性化的提問，提供客服咨詢，進(jìn)行智能回答。由此，將ChatGPT等智能聊天機(jī)器人應(yīng)用于圖書推廣、知識(shí)解答和售后服務(wù)，能夠有效減少出版營(yíng)銷環(huán)節(jié)的人力資源投入，提升出版營(yíng)銷服務(wù)效能，改善目標(biāo)讀者的用戶體驗(yàn)，增強(qiáng)目標(biāo)用戶的粘性和忠誠(chéng)度，從而持續(xù)改進(jìn)、優(yōu)化和完善出版營(yíng)銷工作。

4 結(jié)語(yǔ)

ChatGPT的到來，使AI在通往強(qiáng)AI的道路上實(shí)質(zhì)性地跨越了一大步。在海量數(shù)據(jù)語(yǔ)料庫(kù)、RLHF和持續(xù)超強(qiáng)算力支持下，生成式AI取得了世人矚目的成績(jī)，也在AI發(fā)展史上濃墨重彩地描繪了一筆。較分析式AI，生成式智能出版流程智能革新涵蓋了從PGC到AIGC，從人工編校到人機(jī)協(xié)同智能編校，基于生成式智能的印刷場(chǎng)景創(chuàng)新以及營(yíng)銷質(zhì)量、效率和動(dòng)力變革等豐富內(nèi)容，以上權(quán)作一家之言，望方家指正。有關(guān)生

作者貢獻(xiàn)說明

張新新：總體框架設(shè)計(jì)，論文撰寫；

丁靖佳：論文修改。