融合數(shù)字出版背景下AIGC的發(fā)展與應(yīng)用研究

2023-06-28 11:42:57谷彤彤田飛

新聞研究導(dǎo)刊 2023年7期

谷彤彤田飛

摘要：數(shù)字化出版轉(zhuǎn)型先后經(jīng)歷了PGC模式（專業(yè)生成內(nèi)容）與UGC模式（用戶原創(chuàng)內(nèi)容），隨著人工智能技術(shù)的發(fā)展，AIGC（人工智能生成內(nèi)容）逐漸興起，AIGC的發(fā)展與應(yīng)用，不僅推動(dòng)了藝術(shù)創(chuàng)作和人機(jī)交互的進(jìn)步，也為數(shù)字出版行業(yè)帶來(lái)了新的可能性與挑戰(zhàn)。文章著重研究AIGC領(lǐng)域目前發(fā)展最快的圖像生成模型、語(yǔ)言生成算法模型的發(fā)展?fàn)顩r和趨勢(shì)，從而深入分析AIGC在數(shù)字出版領(lǐng)域應(yīng)用的可能性與人類在AIGC領(lǐng)域面臨的挑戰(zhàn)。文章采用網(wǎng)絡(luò)調(diào)研法與文獻(xiàn)研究法，深入分析AIGC領(lǐng)域的AI繪畫和ChatGPT的技術(shù)算法與發(fā)展現(xiàn)狀，通過了解AIGC在智能計(jì)算領(lǐng)域的發(fā)展與應(yīng)用，系統(tǒng)評(píng)估AIGC在社會(huì)工作崗位、人類創(chuàng)造力、隱私安全等方面可能面臨的風(fēng)險(xiǎn)。隨著深度學(xué)習(xí)算法和計(jì)算機(jī)硬件的不斷發(fā)展和進(jìn)步，AIGC技術(shù)在不斷提高其圖像識(shí)別、語(yǔ)音識(shí)別和自然語(yǔ)言處理等方面性能的同時(shí)，也將不斷提高其模型的準(zhǔn)確性，這將有助于進(jìn)一步推動(dòng)AIGC技術(shù)的應(yīng)用和發(fā)展。文章通過解析AIGC和人工智能的發(fā)展，旨在了解其對(duì)人類社會(huì)產(chǎn)生的深遠(yuǎn)影響。文章認(rèn)為，未來(lái)AIGC會(huì)發(fā)揮更加重要的作用，同時(shí)也會(huì)為各行各業(yè)帶來(lái)更多機(jī)遇。

關(guān)鍵詞：數(shù)字出版；AIGC；圖像生成模型；自然語(yǔ)言處理；人工智能

中圖分類號(hào)：G230.7 文獻(xiàn)標(biāo)志碼：A 文章編號(hào)：1674-8883（2023）07-0004-03

基金項(xiàng)目：本論文為2015年度長(zhǎng)沙理工大學(xué)湖南省工藝美術(shù)產(chǎn)品工業(yè)設(shè)計(jì)中心開放基金資助項(xiàng)目“工藝美術(shù)產(chǎn)品數(shù)據(jù)聚合與互聯(lián)網(wǎng)展示平臺(tái)的構(gòu)建”研究成果，項(xiàng)目編號(hào)：2015GYMS006；2022年度湖南省教育廳科學(xué)研究項(xiàng)目“用戶體驗(yàn)創(chuàng)新驅(qū)動(dòng)的科研成果數(shù)字化管理平臺(tái)設(shè)計(jì)研究”成果，項(xiàng)目編號(hào)：22C0301

隨著數(shù)字化智能時(shí)代的到來(lái)，傳統(tǒng)出版行業(yè)也在向數(shù)字化方向轉(zhuǎn)型。數(shù)字化出版早期多為PGC模式。PGC是指專業(yè)生成內(nèi)容，它是由專業(yè)人員、公司或組織生產(chǎn)的高質(zhì)量、經(jīng)過篩選的內(nèi)容。伴隨著Web2.0概念的興起，UGC模式在市場(chǎng)逐漸占據(jù)主導(dǎo)地位。UGC是指用戶原創(chuàng)內(nèi)容，其兼具草根性、原創(chuàng)力強(qiáng)等特征。但伴隨著互聯(lián)網(wǎng)的發(fā)展，UGC的創(chuàng)作門檻越來(lái)越低，如今由海量用戶生成的數(shù)量龐大的UGC已經(jīng)暴露出許多弊端，如信息有誤、劣質(zhì)信息泛濫、價(jià)值低等[1]。

2022年4月，中宣部印發(fā)《關(guān)于推動(dòng)出版深度融合發(fā)展的實(shí)施意見》，全面部署未來(lái)一個(gè)時(shí)期出版融合發(fā)展的目標(biāo)、方向等。在內(nèi)容建設(shè)方面，明確提出要立足擴(kuò)大優(yōu)質(zhì)內(nèi)容供給，堅(jiān)持“內(nèi)容為王”，創(chuàng)新內(nèi)容呈現(xiàn)傳播方式等[2]。在這種情況下，PGC在內(nèi)容設(shè)置、符碼分類等方面均呈現(xiàn)出了更加專業(yè)化、精品化的特質(zhì)[3]。

短短數(shù)月，AIGC已快速涉及出版領(lǐng)域，如自媒體領(lǐng)域大量使用AI插畫、新聞機(jī)構(gòu)已開始嘗試用ChatGPT編寫新聞報(bào)道等。這些技術(shù)的發(fā)展與應(yīng)用，不僅推動(dòng)了藝術(shù)創(chuàng)作和人機(jī)交互的進(jìn)步，也為數(shù)字出版行業(yè)帶來(lái)了新的可能性與挑戰(zhàn)。因此，本文的研究目的是探究人工智能在繪畫和對(duì)話生成方面的應(yīng)用，著重分析AI繪畫和ChatGPT兩個(gè)領(lǐng)域的發(fā)展現(xiàn)狀和趨勢(shì)。本文旨在深入分析AIGC在數(shù)字出版領(lǐng)域的應(yīng)用，以及AI對(duì)于人類創(chuàng)造力和思維的影響與挑戰(zhàn)。

一、AI繪畫：人工智能技術(shù)發(fā)展的新領(lǐng)域

（一）AI繪畫的發(fā)展現(xiàn)狀

傳統(tǒng)的計(jì)算機(jī)繪畫技術(shù)局限于機(jī)器執(zhí)行預(yù)先設(shè)定的規(guī)則和算法，因此無(wú)法創(chuàng)造出高質(zhì)量的圖像。隨著深度學(xué)習(xí)和生成對(duì)抗網(wǎng)絡(luò)技術(shù)的應(yīng)用，AI繪畫發(fā)展出了一種全新的生成方式，即通過對(duì)數(shù)據(jù)集的學(xué)習(xí)，機(jī)器能夠自主生成新的圖像。Midjourney和Diffusion是當(dāng)前AI繪畫領(lǐng)域的代表性算法，它們能夠生成質(zhì)量和逼真度較高的圖像。

Midjourney是一種深度學(xué)習(xí)算法[4]。該算法通過一個(gè)多階段的圖像生成過程來(lái)實(shí)現(xiàn)圖像生成。在訓(xùn)練過程中，該算法使用了類似圖像分割的方式，將圖像分為不同的部分，然后單獨(dú)學(xué)習(xí)和訓(xùn)練每個(gè)部分，這種方式可以有效提高算法的效率和準(zhǔn)確性。

Diffusion是一種基于擴(kuò)散過程的圖像生成算法。該算法的核心思想是通過多次擴(kuò)散來(lái)逐步減少圖像的噪聲和干擾，從而產(chǎn)生更加逼真的圖像。Diffusion算法模型的創(chuàng)新與應(yīng)用，推動(dòng)AIGC技術(shù)的突破性進(jìn)展[5]，目前其所使用的穩(wěn)定擴(kuò)散2.0可以生成分辨率為512x512像素的圖像。如圖1所示。

（二）AI繪畫技術(shù)原理的發(fā)展

早期的AI繪畫技術(shù)主要采用基于規(guī)則的方法，即通過定義各種規(guī)則和限制條件，生成具有特定形態(tài)和樣式的圖像，這種方法在圖像生成速度和效果上存在很大限制。隨著深度學(xué)習(xí)技術(shù)的發(fā)展，基于深度學(xué)習(xí)的生成模型逐漸成為AI繪畫的主流方法。其中，基于生成對(duì)抗網(wǎng)絡(luò)（GAN）的模型，成為最具代表性的AI繪畫方式之一。GAN模型由兩個(gè)部分組成，一個(gè)生成器和一個(gè)判別器。生成器利用噪聲信號(hào)生成圖像，判別器則評(píng)估圖像的真實(shí)度。兩個(gè)部分不斷博弈，不斷提高生成器的圖像質(zhì)量。

基于變分自編碼器（VAE）的AI繪畫是另一種常見的方式。VAE模型通過壓縮圖像信息并學(xué)習(xí)重構(gòu)圖像的能力來(lái)生成新的圖像。

二、ChatGPT：基于GPT的自然語(yǔ)言生成模型

（一）ChatGPT的模型原理和特點(diǎn)

ChatGPT是一種基于Transformer架構(gòu)的深度學(xué)習(xí)語(yǔ)言模型，通過預(yù)訓(xùn)練大規(guī)模的文本數(shù)據(jù)，可以生成自然流暢的語(yǔ)言文本，因此在對(duì)話生成、文本摘要、機(jī)器翻譯等任務(wù)中取得了優(yōu)異的成果[6]。ChatGPT的技術(shù)原理和算法主要基于深度學(xué)習(xí)和自然語(yǔ)言處理技術(shù)。

GPT模型主要基于Transformer架構(gòu)，這是一種自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)架構(gòu)。Transformer是GPT系列模型的基本單元，也是目前常見大規(guī)模語(yǔ)言模型的核心組件。該架構(gòu)可以有效地處理長(zhǎng)序列的文本數(shù)據(jù)，同時(shí)具有并行計(jì)算的優(yōu)勢(shì)。模型需要根據(jù)前面已生成的文本內(nèi)容，預(yù)測(cè)下一個(gè)單詞的概率分布。通過不斷地迭代，模型可以逐漸具有生成答案的評(píng)判能力從而生成連貫的自然語(yǔ)言文本[7]。

（二）ChatGPT的發(fā)展現(xiàn)狀

ChatGPT-3是一種基于人工智能的自然語(yǔ)言處理技術(shù)，它可以從海量數(shù)據(jù)中學(xué)習(xí)各種知識(shí)并生成問題解決辦法，處理多種類型的實(shí)際問題，并超越單一的任務(wù)場(chǎng)景[8]。ChatGPT-3能夠根據(jù)上下文情境和對(duì)話歷史來(lái)生成響應(yīng)，并解析和理解復(fù)雜的自然語(yǔ)言。ChatGPT-3.5在上一代的基礎(chǔ)上使用了更大的訓(xùn)練數(shù)據(jù)和更多的參數(shù)，因此在語(yǔ)言理解、邏輯推理和語(yǔ)境感知等方面的表現(xiàn)更好。目前ChatGPT的應(yīng)用范圍十分廣泛，在學(xué)術(shù)傳播方面，有學(xué)者甚至認(rèn)為人工智能可以深度開發(fā)文獻(xiàn)，優(yōu)化內(nèi)容分發(fā)，建立良好的學(xué)術(shù)交流環(huán)境[9]。

2023年3月14日，GPT-4一經(jīng)出現(xiàn)就掀起了人工智能的熱潮，直接把AI從1.0時(shí)代推升到2.0時(shí)代[10]。該模型在接受文本和圖像提示方面具有更強(qiáng)大的功能，并且可以同時(shí)處理純文本和圖像輸入。同時(shí)，GPT-4還更具創(chuàng)造力，可以處理更加細(xì)微的指令[11]，它的擴(kuò)展能力得到了增強(qiáng)，可以同時(shí)處理超過2.5萬(wàn)個(gè)單詞的文本。GPT-4在事實(shí)性、可操縱性和遵守既定準(zhǔn)則方面實(shí)現(xiàn)了有史以來(lái)最好的效果，GPT-4的出現(xiàn)讓人們看到了技術(shù)迭代演進(jìn)的方向[12]。

三、AIGC：未來(lái)社會(huì)發(fā)展新方向

AIGC是一種基于人工智能技術(shù)的生成式計(jì)算系統(tǒng)。AIGC的發(fā)展受到了深度學(xué)習(xí)、計(jì)算機(jī)視覺、自然語(yǔ)言處理等多個(gè)領(lǐng)域的技術(shù)支持，并具有高效率、智能化與沉浸式體驗(yàn)等優(yōu)勢(shì)。隨著云計(jì)算、大數(shù)據(jù)等技術(shù)的普及，AIGC的應(yīng)用也得到了大規(guī)模的推廣和應(yīng)用[13]。英偉達(dá)創(chuàng)始人黃仁勛在開發(fā)者大會(huì)上提出了一個(gè)全新的概念，“我們正處于AI的‘iPhone時(shí)刻”[1]。

（一）AIGC的應(yīng)用前景

隨著人工智能技術(shù)的迅速發(fā)展，基于AIGC的智能計(jì)算在未來(lái)具有廣闊的應(yīng)用前景。首先，AIGC可以應(yīng)用于各種領(lǐng)域的數(shù)據(jù)分析和決策。如在金融領(lǐng)域，AIGC可以完成風(fēng)險(xiǎn)評(píng)估和欺詐檢測(cè)等任務(wù)；在醫(yī)療領(lǐng)域，AIGC可以完成疾病診斷和醫(yī)療健康管理等任務(wù)。其次，AIGC可以為人們提供更加便捷和智能化的生活方式。如在智能家居領(lǐng)域，AIGC可以通過語(yǔ)音識(shí)別、人臉識(shí)別等技術(shù)實(shí)現(xiàn)智能家居的自動(dòng)化和智能化；在智能交通領(lǐng)域，AIGC可以通過車輛識(shí)別、交通流量預(yù)測(cè)等技術(shù)優(yōu)化交通流量和提高交通安全性等。

（二）AIGC的未來(lái)發(fā)展趨勢(shì)

近兩年，隨著AIGC和人工智能的不斷發(fā)展，人類將面臨一些新的挑戰(zhàn)。

首先，人工智能的高度自動(dòng)化特性可能會(huì)取代部分人類工作，特別是那些重復(fù)性工作。

其次，人工智能將影響人類創(chuàng)造力和想象力的發(fā)揮。AIGC目前已經(jīng)展現(xiàn)出驚人的創(chuàng)造力，可以生成與人類相媲美的繪畫和文學(xué)等作品。這意味著未來(lái)人們不僅要與其他人類藝術(shù)家競(jìng)爭(zhēng)，還要與AIGC競(jìng)爭(zhēng)。但同時(shí)，AIGC也將成為一種新的工具，可以協(xié)助人類產(chǎn)出更多極具創(chuàng)意和新穎的想法，從而促進(jìn)人類文化的進(jìn)步。

最后，人工智能的發(fā)展還將對(duì)隱私和安全帶來(lái)挑戰(zhàn)。AIGC需要大量的數(shù)據(jù)來(lái)訓(xùn)練模型，這意味著收集和存儲(chǔ)個(gè)人信息將變得更加容易。此外，黑客也可能利用AIGC漏洞進(jìn)行更加高效精準(zhǔn)的攻擊。因此，平衡好數(shù)據(jù)安全和發(fā)展之間的關(guān)系至關(guān)重要[15]。

四、結(jié)語(yǔ)

數(shù)字化出版是當(dāng)代出版業(yè)發(fā)展的一個(gè)重要趨勢(shì)，人工智能技術(shù)的應(yīng)用也為數(shù)字化出版帶來(lái)了新的可能性。結(jié)合AIGC，可以快速生成各種內(nèi)容，如自動(dòng)生成文章、插圖、設(shè)計(jì)封面等，為數(shù)字化出版帶來(lái)了更多便利和創(chuàng)新。然而，AI也會(huì)給人類出版者帶來(lái)挑戰(zhàn)，如在版權(quán)保護(hù)和出版物質(zhì)量方面，需要遵循更嚴(yán)格的規(guī)定。AI技術(shù)目前還存在偽裝可信信息、提供虛假信息等問題，因此需要進(jìn)行主觀判斷和決策，對(duì)編輯和評(píng)估等出版工作也提出了更高的要求。

當(dāng)前AIGC在不同領(lǐng)域得到了廣泛應(yīng)用，它可以幫助人們更好地理解和處理復(fù)雜的信息和數(shù)據(jù)，從而提高工作效率和生活質(zhì)量?？傊M管AIGC和人工智能的發(fā)展將帶來(lái)一些挑戰(zhàn)和問題，但如果能夠充分發(fā)揮其優(yōu)勢(shì)和潛力，其將有望為人類帶來(lái)更加繁榮美好的未來(lái)。

參考文獻(xiàn)：

[1] 陳旖旎，周曉英，岳麗欣，等.移動(dòng)UGC社區(qū)用戶健康信息采納行為意愿的影響因素[J].圖書情報(bào)知識(shí)，2022，39（5）：82-95.

[2] 中共中央宣傳部印發(fā)《關(guān)于推動(dòng)出版深度融合發(fā)展的實(shí)施意見》的通知[EB/OL].國(guó)家新聞出版署-信息發(fā)布，https：//www. nppa.gov.cn/nppa/contents/279/103878.shtml，2022-04-24.

[3] 姜海，凌昱婕.數(shù)字化出版的專業(yè)性轉(zhuǎn)向：基于PGC模式的出版建構(gòu)與實(shí)踐研究[J].出版發(fā)行研究，2015（6）：33-37.

[4] 趙覺珵.人工智能繪畫，驚喜伴著爭(zhēng)議[N].環(huán)球時(shí)報(bào)，2023-03-24（008）.

[5] 翟尤，李娟. AIGC發(fā)展路徑思考：大模型工具化普及迎來(lái)新機(jī)遇[J].互聯(lián)網(wǎng)天地，2022（11）：22-27.

[6] 于浩，張文蘭. ChatGPT技術(shù)下教育面臨的挑戰(zhàn)和機(jī)遇[J/OL].中國(guó)醫(yī)學(xué)教育技術(shù)，http：//kns.cnki.net/kcms/detail/61.1317.G4.20230317. 1006.002.html，2023-04-14.

[7] 朱光輝，王喜文. ChatGPT的運(yùn)行模式、關(guān)鍵技術(shù)及未來(lái)圖景[J].新疆師范大學(xué)學(xué)報(bào)（哲學(xué)社會(huì)科學(xué)版），2023，44（4）：113-122.

[8] 甲子光年，劉楊楠.硬剛谷歌，微軟正式發(fā)布“ChatGPT版Bing”，打響新一輪AI之戰(zhàn)[OL].界面新聞，https：//www.jiemian.com/ article/8864723.html，2023-02-08.

[9] 李媛.人工智能時(shí)代的學(xué)術(shù)期刊數(shù)字化傳播[J].中國(guó)科技期刊研究，2019（11）：1183-1190.

[10] 張慧，佟彤，葉鷹. AI2.0時(shí)代智慧圖書館的GPT技術(shù)驅(qū)動(dòng)創(chuàng)新[J/OL].圖書館雜志，http：//kns.cnki.net/kcms/detail/31.1108. G2.20230411.1939.002.html，2023-04-14.

[11] 張渺. GPT-4再燃熱點(diǎn)拷問科技倫理邊界[N].中國(guó)青年報(bào)，2023-03-27（008）.

[12] 倪雨晴.逐浪AIGC：大模型狂飆[N]. 21世紀(jì)經(jīng)濟(jì)報(bào)道，2023-03-20（007）.

[13] 王諾，畢學(xué)成，許鑫.先利其器：元宇宙場(chǎng)景下的AIGC及其GLAM應(yīng)用機(jī)遇[J].圖書館論壇，2023，43（2）：117-124.

[14] 李玉洋.黃仁勛提AI“iPhone時(shí)刻”欲推計(jì)算光刻革命？[N].中國(guó)經(jīng)營(yíng)報(bào)，2023-03-27（C03）.

[15] 江潞潞.智能交往，未來(lái)已來(lái)：“激蕩AIGC”數(shù)字交往八人談?dòng)^點(diǎn)綜述[J].傳媒觀察，2023（3）：48-54.

作者簡(jiǎn)介谷彤彤，研究方向：數(shù)字媒體藝術(shù)、用戶體驗(yàn)、交互設(shè)計(jì)。田飛，副教授，系本文通訊作者，研究方向：交互設(shè)計(jì)、信息化產(chǎn)品、用戶體驗(yàn)設(shè)計(jì)。

融合數(shù)字出版背景下AIGC的發(fā)展與應(yīng)用研究

一、AI繪畫：人工智能技術(shù)發(fā)展的新領(lǐng)域

二、ChatGPT：基于GPT的自然語(yǔ)言生成模型

三、AIGC：未來(lái)社會(huì)發(fā)展新方向

四、結(jié)語(yǔ)

一、AI繪畫：人工智能技術(shù)發(fā)展的新領(lǐng)域

二、ChatGPT：基于GPT的自然語(yǔ)言生成模型

三、AIGC：未來(lái)社會(huì)發(fā)展新方向

四、結(jié)語(yǔ)