谷彤彤 田飛
摘要:數(shù)字化出版轉(zhuǎn)型先后經(jīng)歷了PGC模式(專業(yè)生成內(nèi)容)與UGC模式(用戶原創(chuàng)內(nèi)容),隨著人工智能技術(shù)的發(fā)展,AIGC(人工智能生成內(nèi)容)逐漸興起,AIGC的發(fā)展與應(yīng)用,不僅推動(dòng)了藝術(shù)創(chuàng)作和人機(jī)交互的進(jìn)步,也為數(shù)字出版行業(yè)帶來(lái)了新的可能性與挑戰(zhàn)。文章著重研究AIGC領(lǐng)域目前發(fā)展最快的圖像生成模型、語(yǔ)言生成算法模型的發(fā)展?fàn)顩r和趨勢(shì),從而深入分析AIGC在數(shù)字出版領(lǐng)域應(yīng)用的可能性與人類在AIGC領(lǐng)域面臨的挑戰(zhàn)。文章采用網(wǎng)絡(luò)調(diào)研法與文獻(xiàn)研究法,深入分析AIGC領(lǐng)域的AI繪畫和ChatGPT的技術(shù)算法與發(fā)展現(xiàn)狀,通過了解AIGC在智能計(jì)算領(lǐng)域的發(fā)展與應(yīng)用,系統(tǒng)評(píng)估AIGC在社會(huì)工作崗位、人類創(chuàng)造力、隱私安全等方面可能面臨的風(fēng)險(xiǎn)。隨著深度學(xué)習(xí)算法和計(jì)算機(jī)硬件的不斷發(fā)展和進(jìn)步,AIGC技術(shù)在不斷提高其圖像識(shí)別、語(yǔ)音識(shí)別和自然語(yǔ)言處理等方面性能的同時(shí),也將不斷提高其模型的準(zhǔn)確性,這將有助于進(jìn)一步推動(dòng)AIGC技術(shù)的應(yīng)用和發(fā)展。文章通過解析AIGC和人工智能的發(fā)展,旨在了解其對(duì)人類社會(huì)產(chǎn)生的深遠(yuǎn)影響。文章認(rèn)為,未來(lái)AIGC會(huì)發(fā)揮更加重要的作用,同時(shí)也會(huì)為各行各業(yè)帶來(lái)更多機(jī)遇。
關(guān)鍵詞:數(shù)字出版;AIGC;圖像生成模型;自然語(yǔ)言處理;人工智能
中圖分類號(hào):G230.7 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-8883(2023)07-0004-03
基金項(xiàng)目:本論文為2015年度長(zhǎng)沙理工大學(xué)湖南省工藝美術(shù)產(chǎn)品工業(yè)設(shè)計(jì)中心開放基金資助項(xiàng)目“工藝美術(shù)產(chǎn)品數(shù)據(jù)聚合與互聯(lián)網(wǎng)展示平臺(tái)的構(gòu)建”研究成果,項(xiàng)目編號(hào):2015GYMS006;2022年度湖南省教育廳科學(xué)研究項(xiàng)目“用戶體驗(yàn)創(chuàng)新驅(qū)動(dòng)的科研成果數(shù)字化管理平臺(tái)設(shè)計(jì)研究”成果,項(xiàng)目編號(hào):22C0301
隨著數(shù)字化智能時(shí)代的到來(lái),傳統(tǒng)出版行業(yè)也在向數(shù)字化方向轉(zhuǎn)型。數(shù)字化出版早期多為PGC模式。PGC是指專業(yè)生成內(nèi)容,它是由專業(yè)人員、公司或組織生產(chǎn)的高質(zhì)量、經(jīng)過篩選的內(nèi)容。伴隨著Web2.0概念的興起,UGC模式在市場(chǎng)逐漸占據(jù)主導(dǎo)地位。UGC是指用戶原創(chuàng)內(nèi)容,其兼具草根性、原創(chuàng)力強(qiáng)等特征。但伴隨著互聯(lián)網(wǎng)的發(fā)展,UGC的創(chuàng)作門檻越來(lái)越低,如今由海量用戶生成的數(shù)量龐大的UGC已經(jīng)暴露出許多弊端,如信息有誤、劣質(zhì)信息泛濫、價(jià)值低等[1]。
2022年4月,中宣部印發(fā)《關(guān)于推動(dòng)出版深度融合發(fā)展的實(shí)施意見》,全面部署未來(lái)一個(gè)時(shí)期出版融合發(fā)展的目標(biāo)、方向等。在內(nèi)容建設(shè)方面,明確提出要立足擴(kuò)大優(yōu)質(zhì)內(nèi)容供給,堅(jiān)持“內(nèi)容為王”,創(chuàng)新內(nèi)容呈現(xiàn)傳播方式等[2]。在這種情況下,PGC在內(nèi)容設(shè)置、符碼分類等方面均呈現(xiàn)出了更加專業(yè)化、精品化的特質(zhì)[3]。
短短數(shù)月,AIGC已快速涉及出版領(lǐng)域,如自媒體領(lǐng)域大量使用AI插畫、新聞機(jī)構(gòu)已開始嘗試用ChatGPT編寫新聞報(bào)道等。這些技術(shù)的發(fā)展與應(yīng)用,不僅推動(dòng)了藝術(shù)創(chuàng)作和人機(jī)交互的進(jìn)步,也為數(shù)字出版行業(yè)帶來(lái)了新的可能性與挑戰(zhàn)。因此,本文的研究目的是探究人工智能在繪畫和對(duì)話生成方面的應(yīng)用,著重分析AI繪畫和ChatGPT兩個(gè)領(lǐng)域的發(fā)展現(xiàn)狀和趨勢(shì)。本文旨在深入分析AIGC在數(shù)字出版領(lǐng)域的應(yīng)用,以及AI對(duì)于人類創(chuàng)造力和思維的影響與挑戰(zhàn)。
(一)AI繪畫的發(fā)展現(xiàn)狀
傳統(tǒng)的計(jì)算機(jī)繪畫技術(shù)局限于機(jī)器執(zhí)行預(yù)先設(shè)定的規(guī)則和算法,因此無(wú)法創(chuàng)造出高質(zhì)量的圖像。隨著深度學(xué)習(xí)和生成對(duì)抗網(wǎng)絡(luò)技術(shù)的應(yīng)用,AI繪畫發(fā)展出了一種全新的生成方式,即通過對(duì)數(shù)據(jù)集的學(xué)習(xí),機(jī)器能夠自主生成新的圖像。Midjourney和Diffusion是當(dāng)前AI繪畫領(lǐng)域的代表性算法,它們能夠生成質(zhì)量和逼真度較高的圖像。
Midjourney是一種深度學(xué)習(xí)算法[4]。該算法通過一個(gè)多階段的圖像生成過程來(lái)實(shí)現(xiàn)圖像生成。在訓(xùn)練過程中,該算法使用了類似圖像分割的方式,將圖像分為不同的部分,然后單獨(dú)學(xué)習(xí)和訓(xùn)練每個(gè)部分,這種方式可以有效提高算法的效率和準(zhǔn)確性。
Diffusion是一種基于擴(kuò)散過程的圖像生成算法。該算法的核心思想是通過多次擴(kuò)散來(lái)逐步減少圖像的噪聲和干擾,從而產(chǎn)生更加逼真的圖像。Diffusion算法模型的創(chuàng)新與應(yīng)用,推動(dòng)AIGC技術(shù)的突破性進(jìn)展[5],目前其所使用的穩(wěn)定擴(kuò)散2.0可以生成分辨率為512x512像素的圖像。如圖1所示。
(二)AI繪畫技術(shù)原理的發(fā)展
早期的AI繪畫技術(shù)主要采用基于規(guī)則的方法,即通過定義各種規(guī)則和限制條件,生成具有特定形態(tài)和樣式的圖像,這種方法在圖像生成速度和效果上存在很大限制。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,基于深度學(xué)習(xí)的生成模型逐漸成為AI繪畫的主流方法。其中,基于生成對(duì)抗網(wǎng)絡(luò)(GAN)的模型,成為最具代表性的AI繪畫方式之一。GAN模型由兩個(gè)部分組成,一個(gè)生成器和一個(gè)判別器。生成器利用噪聲信號(hào)生成圖像,判別器則評(píng)估圖像的真實(shí)度。兩個(gè)部分不斷博弈,不斷提高生成器的圖像質(zhì)量。
基于變分自編碼器(VAE)的AI繪畫是另一種常見的方式。VAE模型通過壓縮圖像信息并學(xué)習(xí)重構(gòu)圖像的能力來(lái)生成新的圖像。
(一)ChatGPT的模型原理和特點(diǎn)
ChatGPT是一種基于Transformer架構(gòu)的深度學(xué)習(xí)語(yǔ)言模型,通過預(yù)訓(xùn)練大規(guī)模的文本數(shù)據(jù),可以生成自然流暢的語(yǔ)言文本,因此在對(duì)話生成、文本摘要、機(jī)器翻譯等任務(wù)中取得了優(yōu)異的成果[6]。ChatGPT的技術(shù)原理和算法主要基于深度學(xué)習(xí)和自然語(yǔ)言處理技術(shù)。
GPT模型主要基于Transformer架構(gòu),這是一種自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)架構(gòu)。Transformer是GPT系列模型的基本單元,也是目前常見大規(guī)模語(yǔ)言模型的核心組件。該架構(gòu)可以有效地處理長(zhǎng)序列的文本數(shù)據(jù),同時(shí)具有并行計(jì)算的優(yōu)勢(shì)。模型需要根據(jù)前面已生成的文本內(nèi)容,預(yù)測(cè)下一個(gè)單詞的概率分布。通過不斷地迭代,模型可以逐漸具有生成答案的評(píng)判能力從而生成連貫的自然語(yǔ)言文本[7]。
(二)ChatGPT的發(fā)展現(xiàn)狀
ChatGPT-3是一種基于人工智能的自然語(yǔ)言處理技術(shù),它可以從海量數(shù)據(jù)中學(xué)習(xí)各種知識(shí)并生成問題解決辦法,處理多種類型的實(shí)際問題,并超越單一的任務(wù)場(chǎng)景[8]。ChatGPT-3能夠根據(jù)上下文情境和對(duì)話歷史來(lái)生成響應(yīng),并解析和理解復(fù)雜的自然語(yǔ)言。ChatGPT-3.5在上一代的基礎(chǔ)上使用了更大的訓(xùn)練數(shù)據(jù)和更多的參數(shù),因此在語(yǔ)言理解、邏輯推理和語(yǔ)境感知等方面的表現(xiàn)更好。目前ChatGPT的應(yīng)用范圍十分廣泛,在學(xué)術(shù)傳播方面,有學(xué)者甚至認(rèn)為人工智能可以深度開發(fā)文獻(xiàn),優(yōu)化內(nèi)容分發(fā),建立良好的學(xué)術(shù)交流環(huán)境[9]。
2023年3月14日,GPT-4一經(jīng)出現(xiàn)就掀起了人工智能的熱潮,直接把AI從1.0時(shí)代推升到2.0時(shí)代[10]。該模型在接受文本和圖像提示方面具有更強(qiáng)大的功能,并且可以同時(shí)處理純文本和圖像輸入。同時(shí),GPT-4還更具創(chuàng)造力,可以處理更加細(xì)微的指令[11],它的擴(kuò)展能力得到了增強(qiáng),可以同時(shí)處理超過2.5萬(wàn)個(gè)單詞的文本。GPT-4在事實(shí)性、可操縱性和遵守既定準(zhǔn)則方面實(shí)現(xiàn)了有史以來(lái)最好的效果,GPT-4的出現(xiàn)讓人們看到了技術(shù)迭代演進(jìn)的方向[12]。
AIGC是一種基于人工智能技術(shù)的生成式計(jì)算系統(tǒng)。AIGC的發(fā)展受到了深度學(xué)習(xí)、計(jì)算機(jī)視覺、自然語(yǔ)言處理等多個(gè)領(lǐng)域的技術(shù)支持,并具有高效率、智能化與沉浸式體驗(yàn)等優(yōu)勢(shì)。隨著云計(jì)算、大數(shù)據(jù)等技術(shù)的普及,AIGC的應(yīng)用也得到了大規(guī)模的推廣和應(yīng)用[13]。英偉達(dá)創(chuàng)始人黃仁勛在開發(fā)者大會(huì)上提出了一個(gè)全新的概念,“我們正處于AI的‘iPhone時(shí)刻”[1]。
(一)AIGC的應(yīng)用前景
隨著人工智能技術(shù)的迅速發(fā)展,基于AIGC的智能計(jì)算在未來(lái)具有廣闊的應(yīng)用前景。首先,AIGC可以應(yīng)用于各種領(lǐng)域的數(shù)據(jù)分析和決策。如在金融領(lǐng)域,AIGC可以完成風(fēng)險(xiǎn)評(píng)估和欺詐檢測(cè)等任務(wù);在醫(yī)療領(lǐng)域,AIGC可以完成疾病診斷和醫(yī)療健康管理等任務(wù)。其次,AIGC可以為人們提供更加便捷和智能化的生活方式。如在智能家居領(lǐng)域,AIGC可以通過語(yǔ)音識(shí)別、人臉識(shí)別等技術(shù)實(shí)現(xiàn)智能家居的自動(dòng)化和智能化;在智能交通領(lǐng)域,AIGC可以通過車輛識(shí)別、交通流量預(yù)測(cè)等技術(shù)優(yōu)化交通流量和提高交通安全性等。
(二)AIGC的未來(lái)發(fā)展趨勢(shì)
近兩年,隨著AIGC和人工智能的不斷發(fā)展,人類將面臨一些新的挑戰(zhàn)。
首先,人工智能的高度自動(dòng)化特性可能會(huì)取代部分人類工作,特別是那些重復(fù)性工作。
其次,人工智能將影響人類創(chuàng)造力和想象力的發(fā)揮。AIGC目前已經(jīng)展現(xiàn)出驚人的創(chuàng)造力,可以生成與人類相媲美的繪畫和文學(xué)等作品。這意味著未來(lái)人們不僅要與其他人類藝術(shù)家競(jìng)爭(zhēng),還要與AIGC競(jìng)爭(zhēng)。但同時(shí),AIGC也將成為一種新的工具,可以協(xié)助人類產(chǎn)出更多極具創(chuàng)意和新穎的想法,從而促進(jìn)人類文化的進(jìn)步。
最后,人工智能的發(fā)展還將對(duì)隱私和安全帶來(lái)挑戰(zhàn)。AIGC需要大量的數(shù)據(jù)來(lái)訓(xùn)練模型,這意味著收集和存儲(chǔ)個(gè)人信息將變得更加容易。此外,黑客也可能利用AIGC漏洞進(jìn)行更加高效精準(zhǔn)的攻擊。因此,平衡好數(shù)據(jù)安全和發(fā)展之間的關(guān)系至關(guān)重要[15]。
數(shù)字化出版是當(dāng)代出版業(yè)發(fā)展的一個(gè)重要趨勢(shì),人工智能技術(shù)的應(yīng)用也為數(shù)字化出版帶來(lái)了新的可能性。結(jié)合AIGC,可以快速生成各種內(nèi)容,如自動(dòng)生成文章、插圖、設(shè)計(jì)封面等,為數(shù)字化出版帶來(lái)了更多便利和創(chuàng)新。然而,AI也會(huì)給人類出版者帶來(lái)挑戰(zhàn),如在版權(quán)保護(hù)和出版物質(zhì)量方面,需要遵循更嚴(yán)格的規(guī)定。AI技術(shù)目前還存在偽裝可信信息、提供虛假信息等問題,因此需要進(jìn)行主觀判斷和決策,對(duì)編輯和評(píng)估等出版工作也提出了更高的要求。
當(dāng)前AIGC在不同領(lǐng)域得到了廣泛應(yīng)用,它可以幫助人們更好地理解和處理復(fù)雜的信息和數(shù)據(jù),從而提高工作效率和生活質(zhì)量??傊M管AIGC和人工智能的發(fā)展將帶來(lái)一些挑戰(zhàn)和問題,但如果能夠充分發(fā)揮其優(yōu)勢(shì)和潛力,其將有望為人類帶來(lái)更加繁榮美好的未來(lái)。
參考文獻(xiàn):
[1] 陳旖旎,周曉英,岳麗欣,等.移動(dòng)UGC社區(qū)用戶健康信息采納行為意愿的影響因素[J].圖書情報(bào)知識(shí),2022,39(5):82-95.
[2] 中共中央宣傳部印發(fā)《關(guān)于推動(dòng)出版深度融合發(fā)展的實(shí)施意見》的通知[EB/OL].國(guó)家新聞出版署-信息發(fā)布,https://www. nppa.gov.cn/nppa/contents/279/103878.shtml,2022-04-24.
[3] 姜海,凌昱婕.數(shù)字化出版的專業(yè)性轉(zhuǎn)向:基于PGC模式的出版建構(gòu)與實(shí)踐研究[J].出版發(fā)行研究,2015(6):33-37.
[4] 趙覺珵.人工智能繪畫,驚喜伴著爭(zhēng)議[N].環(huán)球時(shí)報(bào),2023-03-24(008).
[5] 翟尤,李娟. AIGC發(fā)展路徑思考:大模型工具化普及迎來(lái)新機(jī)遇[J].互聯(lián)網(wǎng)天地,2022(11):22-27.
[6] 于浩,張文蘭. ChatGPT技術(shù)下教育面臨的挑戰(zhàn)和機(jī)遇[J/OL].中國(guó)醫(yī)學(xué)教育技術(shù),http://kns.cnki.net/kcms/detail/61.1317.G4.20230317. 1006.002.html,2023-04-14.
[7] 朱光輝,王喜文. ChatGPT的運(yùn)行模式、關(guān)鍵技術(shù)及未來(lái)圖景[J].新疆師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2023,44(4):113-122.
[8] 甲子光年,劉楊楠.硬剛谷歌,微軟正式發(fā)布“ChatGPT版Bing”,打響新一輪AI之戰(zhàn)[OL].界面新聞,https://www.jiemian.com/ article/8864723.html,2023-02-08.
[9] 李媛.人工智能時(shí)代的學(xué)術(shù)期刊數(shù)字化傳播[J].中國(guó)科技期刊研究,2019(11):1183-1190.
[10] 張慧,佟彤,葉鷹. AI2.0時(shí)代智慧圖書館的GPT技術(shù)驅(qū)動(dòng)創(chuàng)新[J/OL].圖書館雜志,http://kns.cnki.net/kcms/detail/31.1108. G2.20230411.1939.002.html,2023-04-14.
[11] 張渺. GPT-4再燃熱點(diǎn)拷問科技倫理邊界[N].中國(guó)青年報(bào),2023-03-27(008).
[12] 倪雨晴.逐浪AIGC:大模型狂飆[N]. 21世紀(jì)經(jīng)濟(jì)報(bào)道,2023-03-20(007).
[13] 王諾,畢學(xué)成,許鑫.先利其器:元宇宙場(chǎng)景下的AIGC及其GLAM應(yīng)用機(jī)遇[J].圖書館論壇,2023,43(2):117-124.
[14] 李玉洋.黃仁勛提AI“iPhone時(shí)刻”欲推計(jì)算光刻革命?[N].中國(guó)經(jīng)營(yíng)報(bào),2023-03-27(C03).
[15] 江潞潞.智能交往,未來(lái)已來(lái):“激蕩AIGC”數(shù)字交往八人談?dòng)^點(diǎn)綜述[J].傳媒觀察,2023(3):48-54.
作者簡(jiǎn)介 谷彤彤,研究方向:數(shù)字媒體藝術(shù)、用戶體驗(yàn)、交互設(shè)計(jì)。 田飛,副教授,系本文通訊作者,研究方向:交互設(shè)計(jì)、信息化產(chǎn)品、用戶體驗(yàn)設(shè)計(jì)。