許雪晨 田侃 李文軍
關(guān)鍵詞:AIGC;新一代人工智能技術(shù);ChatGPT;產(chǎn)業(yè)發(fā)展;數(shù)字經(jīng)濟(jì)
DOI:10.19313/j.cnki.cn10-1223/f.20230705.001
一、引言
習(xí)近平總書(shū)記指出,“把新一代人工智能作為推動(dòng)科技跨越發(fā)展、產(chǎn)業(yè)優(yōu)化升級(jí)、生產(chǎn)力整體躍升的驅(qū)動(dòng)力量,努力實(shí)現(xiàn)高質(zhì)量發(fā)展?!苯?jīng)過(guò)60 多年的發(fā)展,人工智能發(fā)展進(jìn)入新的階段,相比于傳統(tǒng)人工智能,新一代人工智能呈現(xiàn)出深度學(xué)習(xí)、跨界融合、人機(jī)協(xié)同、群智開(kāi)放、自主操控等新特征。大數(shù)據(jù)驅(qū)動(dòng)知識(shí)學(xué)習(xí)、跨媒體協(xié)同處理等也成為人工智能的發(fā)展重點(diǎn)。近年來(lái),通過(guò)無(wú)監(jiān)督學(xué)習(xí)條件下的“大數(shù)據(jù)+大模型”方式,自然語(yǔ)言處理、語(yǔ)音識(shí)別、計(jì)算機(jī)視覺(jué)等任務(wù)的性能均顯著提升,新一代人工智能的重要分支——人工智能生成內(nèi)容(Artificial Intelligence GeneratedContent,AIGC)迎來(lái)加速發(fā)展,正在催生全新的產(chǎn)業(yè)體系。
代表AIGC 最新進(jìn)展的是OpenAI 開(kāi)發(fā)的聊天機(jī)器人——ChatGPT(Long 等,2022),通過(guò)大規(guī)模預(yù)訓(xùn)練模型,ChatGPT 具備理解自然語(yǔ)言和文本生成的能力,可以執(zhí)行文本翻譯、摘要生成、情感分析等任務(wù)。ChatGPT 以其強(qiáng)大的功能和廣泛的應(yīng)用場(chǎng)景,在推出僅兩個(gè)月后,就迅速發(fā)展壯大,月活用戶數(shù)量已超過(guò)1 億。如果說(shuō)“阿爾法狗”刷新了普通大眾對(duì)人工智能技術(shù)的看法,那么ChatGPT 則使人工智能技術(shù)“飛入尋常百姓家”。這引起了業(yè)界和學(xué)界的廣泛關(guān)注。
2023 年2 月,微軟宣布在Bing 搜索引擎中引入ChatGPT,自集成ChatGPT 后,Bing 的日活量也首次突破1 億。作為人工智能領(lǐng)域的現(xiàn)象級(jí)應(yīng)用,ChatGPT 也開(kāi)啟了中國(guó)人工智能行業(yè)新賽道,引發(fā)國(guó)內(nèi)科技巨頭競(jìng)相涌入。在眾多互聯(lián)網(wǎng)公司中,百度最早官宣將在今年3 月上線百度版ChatGPT——“文心一言”。騰訊則表示,專項(xiàng)研究正在有序推進(jìn),針對(duì)類ChatGPT 對(duì)話式產(chǎn)品已成立“混元助手”項(xiàng)目組。此外,京東宣布將推出產(chǎn)業(yè)版ChatGPT—ChatJD。網(wǎng)易有道則對(duì)AIGC在教育場(chǎng)景的落地進(jìn)行布局。360 也對(duì)外公布,計(jì)劃推出類ChatGPT 的demo 版產(chǎn)品。
ChatGPT 是近年來(lái)人工智能領(lǐng)域的一項(xiàng)重大突破,但其突然火爆并非橫空出世,非一日之功,而是人工智能大模型從量變到質(zhì)變的一個(gè)華麗蛻變。
在過(guò)去幾十年里,由于機(jī)器學(xué)習(xí)算法、計(jì)算機(jī)處理能力、移動(dòng)互聯(lián)網(wǎng)等方面的進(jìn)步,計(jì)算和人工智能相關(guān)的方法取得了長(zhǎng)足進(jìn)展并引發(fā)了一系列突破,ChatGPT 的成功基于大模型、大算力、大訓(xùn)練數(shù)據(jù)。幾十年間,人工智能已成為包括中國(guó)在內(nèi)的許多國(guó)家經(jīng)濟(jì)發(fā)展的重要引擎。
2017 年7 月,國(guó)務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》(以下簡(jiǎn)稱《規(guī)劃》)①,這是本世紀(jì)以來(lái)中國(guó)發(fā)布的第一個(gè)人工智能系統(tǒng)性戰(zhàn)略規(guī)劃,這一規(guī)劃提出了面向2030 年中國(guó)新一代人工智能發(fā)展的指導(dǎo)思想、戰(zhàn)略目標(biāo)、重點(diǎn)任務(wù)和保障措施。《規(guī)劃》指出,要重點(diǎn)突破跨媒體統(tǒng)一表征、關(guān)聯(lián)理解與知識(shí)挖掘、知識(shí)圖譜構(gòu)建與學(xué)習(xí)、知識(shí)演化與推理、智能描述與生成等技術(shù),實(shí)現(xiàn)跨媒體知識(shí)表征、分析、挖掘、推理、演化和利用,構(gòu)建分析推理引擎。AIGC 技術(shù)能力升級(jí)將為這一目標(biāo)的實(shí)現(xiàn)提供強(qiáng)力支撐。2023 年2 月13 日,北京市經(jīng)濟(jì)和信息化局發(fā)布《2022 年北京人工智能產(chǎn)業(yè)發(fā)展白皮書(shū)》,該白皮書(shū)提到,今年北京市將引導(dǎo)企業(yè)、高校、科研院所、新型研發(fā)機(jī)構(gòu)、開(kāi)源社區(qū)等,圍繞人工智能關(guān)鍵核心技術(shù)創(chuàng)新協(xié)同攻關(guān),持續(xù)推動(dòng)建設(shè)具有全球影響力的人工智能創(chuàng)新策源地。同時(shí),支持頭部企業(yè)打造對(duì)標(biāo)ChatGPT 的大模型,構(gòu)建開(kāi)源框架和通用大模型的應(yīng)用生態(tài),形成人工智能產(chǎn)業(yè)發(fā)展新突破;加強(qiáng)人工智能算力基礎(chǔ)設(shè)施布局,加速人工智能基礎(chǔ)數(shù)據(jù)供給②。上海市經(jīng)信委表示,在全球科技競(jìng)爭(zhēng)日趨白熱化的情況下,積極發(fā)展AIGC,加快構(gòu)筑活躍的產(chǎn)業(yè)生態(tài),將是上海人工智能發(fā)展的重要著力點(diǎn)。
目前,隨著政策面利好,疊加科技巨頭陸續(xù)入場(chǎng),AIGC 的應(yīng)用場(chǎng)景不再單純局限于聊天機(jī)器人、文本生成等方面,更將為數(shù)字經(jīng)濟(jì)、產(chǎn)業(yè)發(fā)展甚至社會(huì)變革注入強(qiáng)大動(dòng)力。由于AIGC 興起時(shí)間較短,對(duì)該領(lǐng)域相關(guān)內(nèi)容的梳理和綜述相對(duì)匱乏,因此,本文旨在全面、系統(tǒng)地對(duì)AIGC 相關(guān)的概念、技術(shù)和國(guó)內(nèi)外主要科技公司前瞻布局進(jìn)行系統(tǒng)梳理分析,并從產(chǎn)業(yè)視角深度剖析AIGC 產(chǎn)業(yè)本身及其與相關(guān)產(chǎn)業(yè)的融合。關(guān)注新一代人工智能技術(shù)AIGC 對(duì)產(chǎn)業(yè)和社會(huì)發(fā)展的影響,迫切且關(guān)鍵。
本文剩余內(nèi)容結(jié)構(gòu)是:首先對(duì)AIGC 概念和發(fā)展歷程進(jìn)行梳理,全面了解AIGC 發(fā)展?fàn)顩r;然后探討AIGC 帶來(lái)的產(chǎn)業(yè)機(jī)遇,分析其應(yīng)用場(chǎng)景及其可能帶來(lái)的風(fēng)險(xiǎn);最后在上述分析基礎(chǔ)上,提出中國(guó)針對(duì)AIGC 發(fā)展和治理的政策建議。
二、AIGC 概念梳理與發(fā)展歷程
(一)AIGC概念與內(nèi)涵
1950年,艾倫·圖靈在《計(jì)算機(jī)器與智能》中提出了著名的“圖靈測(cè)試”——判定機(jī)器是否“智能”的試驗(yàn)方法(Turing,2009),即機(jī)器是否能夠模仿人類的思維方式來(lái)“生成”內(nèi)容,實(shí)現(xiàn)人機(jī)交互。因此,人工智能從圖靈開(kāi)始就被寄予了用于內(nèi)容創(chuàng)造的期許。經(jīng)過(guò)半個(gè)多世紀(jì)發(fā)展,數(shù)據(jù)快速積累、算力性能提升和算法效力增強(qiáng),如今人工智能不僅實(shí)現(xiàn)了人機(jī)互動(dòng),還能夠進(jìn)行寫(xiě)作、編曲、繪畫(huà)、視頻制作等創(chuàng)意工作。2018 年,由人工智能創(chuàng)作的肖像畫(huà)《埃德蒙·貝拉米畫(huà)像》拍賣43.25 萬(wàn)美元,成為人類歷史上首次拍賣的AI 藝術(shù)品,引發(fā)各界關(guān)注。隨著人工智能越來(lái)越多地被應(yīng)用于內(nèi)容創(chuàng)作,AIGC 概念悄然興起。
目前,對(duì)AIGC 的定義尚無(wú)統(tǒng)一規(guī)范的界定。國(guó)內(nèi)產(chǎn)學(xué)研各界對(duì)于AIGC 的理解是“繼專業(yè)生成內(nèi)容(Professional Generated Content,PGC)和用戶生成內(nèi)容(User Generated Content,UGC)之后(Nosita 和Lestari,2019;Lobato 等,2011),利用人工智能技術(shù)自動(dòng)生成內(nèi)容的新型生產(chǎn)方式”。在國(guó)際上對(duì)應(yīng)的術(shù)語(yǔ)是“人工智能合成媒體(AI-generated Media 或Synthetic Media)”(Pataranutaporn 等,2023),其定義是“通過(guò)人工智能算法對(duì)數(shù)據(jù)或媒體進(jìn)行生產(chǎn)、操控和修改的統(tǒng)稱”。因此,AIGC 是指從內(nèi)容生產(chǎn)者的角度對(duì)內(nèi)容進(jìn)行分類的一種內(nèi)容類型,同時(shí)也是一種自動(dòng)化生成內(nèi)容的技術(shù)。
(二)AIGC 發(fā)展歷程
梳理人工智能的發(fā)展演進(jìn),AIGC 的發(fā)展基本可以劃分為三個(gè)時(shí)期:醞釀萌芽階段(20 世紀(jì)50年代至20 世紀(jì)90 年代中期)、穩(wěn)步推進(jìn)階段(20 世紀(jì)90 年代中期至21 世紀(jì)10 年代中期)以及迅猛發(fā)展階段(21 世紀(jì)10 年代中期至今)(三階段的相關(guān)總結(jié)見(jiàn)表1)。
1. 醞釀萌芽階段
20 世紀(jì)50 年代至20 世紀(jì)90 年代中期,受限于技術(shù)水平,AIGC 僅局限于小范圍實(shí)驗(yàn)。1950年,圖靈提出“圖靈測(cè)試”能夠判定機(jī)器是否“智能”;1957 年,計(jì)算機(jī)首次創(chuàng)作完成弦樂(lè)四重奏《依利亞克組曲》;1966 年,世界上第一款可人機(jī)對(duì)話的機(jī)器人“伊莉莎(Eliza)”問(wèn)世,主要通過(guò)關(guān)鍵字掃描與重組完成交互任務(wù)。20 世紀(jì)80 年代中期,國(guó)際商業(yè)機(jī)器公司(International BusinessMachines Corporation,IBM)創(chuàng)造了語(yǔ)音控制打字機(jī)“坦戈拉(Tangora)”,約能處理20 000 個(gè)單詞。
20 世紀(jì)80 年代末至90 年代中期,由于高昂的研發(fā)投入沒(méi)有實(shí)現(xiàn)預(yù)期的商業(yè)變現(xiàn),世界各國(guó)開(kāi)始減少人工智能領(lǐng)域的投入,AIGC 沒(méi)有實(shí)現(xiàn)重大突破。但在此期間,圖靈測(cè)試、對(duì)話機(jī)器人以及語(yǔ)控打字機(jī)已經(jīng)孕育了AIGC 的雛形。
2. 穩(wěn)步推進(jìn)階段
20 世紀(jì)90 年代中期至21 世紀(jì)10 年代中期,AIGC 逐漸進(jìn)入穩(wěn)步推進(jìn)階段。2006 年起,一方面,圖形處理器和張量處理器等算力設(shè)備性能大幅提升,深度學(xué)習(xí)算力增強(qiáng),深度學(xué)習(xí)算法取得重大突破;另一方面,互聯(lián)網(wǎng)的推廣普及使得數(shù)據(jù)規(guī)模劇增,這為各類人工智能算法提供了海量訓(xùn)練數(shù)據(jù)。雖然算力的提升與數(shù)據(jù)的膨脹使人工智能取得了長(zhǎng)足發(fā)展,但AIGC 仍受限于算法約束,創(chuàng)作任務(wù)依然沒(méi)有取得重大突破,應(yīng)用場(chǎng)景有限,應(yīng)用效果有待提升。2007 年,紐約大學(xué)的人工智能系統(tǒng)撰寫(xiě)小說(shuō)《1 The Road》——世界第一部完全由人工智能創(chuàng)作的小說(shuō),雖然小說(shuō)可讀性不強(qiáng)、存在拼寫(xiě)錯(cuò)誤、邏輯混亂,但從AIGC 整個(gè)發(fā)展歷程來(lái)看,其突破性意義遠(yuǎn)高于文學(xué)價(jià)值。2012 年,微軟推出全自動(dòng)同聲傳譯系統(tǒng),計(jì)算機(jī)能夠自動(dòng)完成語(yǔ)音識(shí)別、英中機(jī)器翻譯,以及中文語(yǔ)音合成,效果非常流暢,這標(biāo)志著深度神經(jīng)網(wǎng)絡(luò)模型在語(yǔ)音識(shí)別和音頻生成領(lǐng)域獲得了巨大的成功,為AIGC 進(jìn)一步發(fā)展帶來(lái)希望。
在進(jìn)入21 世紀(jì)后,AIGC 從前期的技術(shù)實(shí)驗(yàn)性向商業(yè)實(shí)用性轉(zhuǎn)變,但受限于算法瓶頸,其往往只能根據(jù)算法提供的模板生成內(nèi)容,開(kāi)放性、包容性還有待提升,無(wú)法較好地完成創(chuàng)作。
3. 迅猛發(fā)展階段
21 世紀(jì)10 年代中期至今,AIGC 迎來(lái)新發(fā)展,生成內(nèi)容更加多元,生成效果更加逼真。自2014 年起,Goodfellow 等(2020)提出以生成式對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Network,GAN)為代表的深度學(xué)習(xí)算法,并不斷迭代更新,為AIGC 提供了強(qiáng)大的技術(shù)支撐。此后,2017 年,微軟人工智能少女“小冰”完成了世界首部完全由人工智能創(chuàng)作的詩(shī)集——《陽(yáng)光失了玻璃窗》。2018年,英偉達(dá)發(fā)布可以實(shí)現(xiàn)自動(dòng)生成圖片的模型——StyleGAN(Karras 等,2020),該模型目前已升級(jí)到第四代——StyleGAN-XL(Sauer 等,2022),其生成圖片的分辨率極高,人眼難以分辨真假。2019 年,DeepMind 發(fā)布DVD-GAN 模型(Clark 等,2019)可以生成高度逼真且連貫的視頻,該模型能夠通過(guò)學(xué)習(xí)和理解人類的語(yǔ)言,進(jìn)行對(duì)話、聊天互動(dòng)。2021 年,OpenAI 推出DALL-E(Ramesh等,2021),主要用于文本與圖像的交互生成內(nèi)容,并于一年后推出升級(jí)版本DALL-E-2(Marcus等,2022)。 DALL-E-2 基于對(duì)主題、風(fēng)格、調(diào)色板和所需概念意義的“理解”,可以生成相應(yīng)的圖像,同時(shí)該模型還能夠根據(jù)原圖像進(jìn)行二次創(chuàng)作。至此,AIGC 技術(shù)基本成熟,有望成為改變商業(yè)模式和產(chǎn)業(yè)發(fā)展范式的重要驅(qū)動(dòng)力。
總的來(lái)說(shuō),該階段深度學(xué)習(xí)算法快速發(fā)展,AIGC 生成效果逐漸逼真直至人類難以分辨。與此同時(shí),市場(chǎng)受到較高關(guān)注,雖然距離大規(guī)模證明和體系化發(fā)展仍有差距,但從資本的加碼到應(yīng)用場(chǎng)景的探索,距離的縫隙有望逐步填補(bǔ)。
三、國(guó)內(nèi)外主要科技公司AIGC 布局現(xiàn)狀
2022 年下半年起,“AIGC”接棒“元宇宙”成為全球矚目的焦點(diǎn)和熱議話題,各個(gè)行業(yè)都在積極探尋AIGC 助力下的新方向,搶占新賽道。國(guó)內(nèi)外各大科技企業(yè)紛紛在AIGC 領(lǐng)域搶先布局,新興科技創(chuàng)業(yè)公司悄然興起。本節(jié)將對(duì)國(guó)內(nèi)外主要科技公司AIGC 布局進(jìn)行梳理,并以中美兩國(guó)為例,分析比較兩國(guó)AIGC 發(fā)展異同,明確中國(guó)AIGC 發(fā)展難點(diǎn)痛點(diǎn)與瓶頸環(huán)節(jié)。
(一)國(guó)外AIGC 發(fā)展現(xiàn)狀
國(guó)外AIGC 領(lǐng)域的相關(guān)企業(yè)既有谷歌、META、微軟等科技巨頭,也不乏Stability AI、Jasper、OpenAI 等新晉獨(dú)角獸企業(yè)。上述科技公司的項(xiàng)目不僅可以生成圖片,還能夠進(jìn)行視頻生成。例如,META 推出Make-A-Video 系統(tǒng)(Singer 等,2022),實(shí)現(xiàn)了由文本到視頻的飛躍;谷歌推出ImagenVideo(Saharia 等,2022)和Phenaki(Villegas 等,2022),可以從簡(jiǎn)單的文本提示中生成高清視頻。AIGC 在海外市場(chǎng)發(fā)展迅速,目前具有參照意義的國(guó)外公司主要有:
1. 微軟
2019 年,微軟向OpenAI 投資10 億美元,試圖實(shí)現(xiàn)AI 的彎道超車。在關(guān)注技術(shù)研發(fā)的同時(shí),微軟積極籌備OpenAI 的商業(yè)化落地,將OpenAI 的技術(shù)與自有產(chǎn)品進(jìn)行集成。2020 年,微軟將GPT-3 模型(Brown 等,2020)用于Office、Bing 和Microsoft design 等產(chǎn)品中;2021 年,在Azure中集中部署OpenAI 開(kāi)發(fā)的GPT、DALLE、Codex 等各類工具,這也成為OpenAI 最早的收入來(lái)源。2023 年1 月,微軟向OpenAI 追加數(shù)十億美元的投資。2 月2 日,微軟宣布旗下所有產(chǎn)品均將整合ChatGPT,包括搜索引擎Bing、辦公全家桶Office。目前,微軟已發(fā)布4 款基于ChatGPT 的融合應(yīng)用,包括視頻會(huì)議Teams 智能概述功能,銷售應(yīng)用Viva Sales 生成郵件回復(fù),搜索引擎Bing 通過(guò)聊天獲取答案,瀏覽器Edge 聊天和編寫(xiě)功能。微軟CEO 納德拉宣布將在云計(jì)算平臺(tái)Azure 中整合ChatGPT,宣告Azure OpenAI 服務(wù)全面上市,通過(guò)該服務(wù)可以訪問(wèn)OpenAI 開(kāi)發(fā)的AI 模型,屆時(shí)微軟的每個(gè)產(chǎn)品都將具備相同的AI 能力。
2. 谷歌
2021 年,谷歌推出大語(yǔ)言模型LaMDA(Thoppilan 等,2022),并在此基礎(chǔ)上開(kāi)發(fā)了Bard,可以將信息知識(shí)和大語(yǔ)言模型的智能相結(jié)合,提供新鮮高質(zhì)量的回復(fù)。這意味著與ChatGPT 不同,Bard 可以基于實(shí)時(shí)網(wǎng)絡(luò)數(shù)據(jù),而ChatGPT 的信息獲取來(lái)源只局限于2021 年以前的數(shù)據(jù)。谷歌目前在文本、源代碼、音頻、圖像和視頻四個(gè)領(lǐng)域均開(kāi)展了生成式模型研究。Wordcraft Writers Workshop可以幫助作家從大型語(yǔ)言模型中獲得寫(xiě)作上的幫助。AudioLM(Borsos 等,2022)是音頻生成模型,該模型將音頻樣本輸入并繼續(xù)進(jìn)行創(chuàng)作,用以生成音樂(lè)和語(yǔ)音。此外,谷歌研究院還發(fā)布了AIGC工具Stable Diffusion(Rombach 等,2022)和Dreambooth(Ruiz 等,2022),借助上述工具,只需輸入幾張指定物體的照片和相應(yīng)的類名,即可通過(guò)文字描述讓被指定物體出現(xiàn)在用戶想要生成的場(chǎng)景中。
3. META
Meta 在AIGC 領(lǐng)域也有戰(zhàn)略安排。2022 年11 月,Meta 的人工智能實(shí)驗(yàn)室Meta AI 發(fā)布了AI系統(tǒng)“Make-A-Video”,能夠根據(jù)輸入的自然語(yǔ)言文本生成一段5 秒鐘左右的短視頻。并且在語(yǔ)言生成視頻的基礎(chǔ)上,拓展到從圖像生成視頻以及從視頻生成視頻。此外,Meta 在AIGC 的其他方向也有布局。Meta A 提出了一個(gè)全新的文本到四維生成系統(tǒng)MAV3D(MakeA-Video3D),將自然語(yǔ)言描述作為輸入,并輸出一個(gè)動(dòng)態(tài)的三維場(chǎng)景表示,可以從任意的視角進(jìn)行渲染。
4. 獨(dú)角獸企業(yè)
除了上述這三家企業(yè)之外,還包括Zyro、NVIDIA、OpenAI、Gliacloud 等人工智能企業(yè)與獨(dú)角獸企業(yè)同樣具備對(duì)標(biāo)AIGC 的技術(shù)能力(見(jiàn)表2 所示)。
(1)Zyro:一方面圍繞垂直業(yè)務(wù)場(chǎng)景,結(jié)合業(yè)務(wù)knowhow 組織相關(guān) AIGC 能力;另一方面,圍繞電商場(chǎng)景,通過(guò)AIGC 生成網(wǎng)站搭建過(guò)程中所需的各類素材,具體業(yè)務(wù)包括針對(duì)性生成公司介紹、企業(yè)價(jià)值、Slogan、自動(dòng)提升圖片清晰度、自動(dòng)生成logo 等。
(2)NVIDIA:通過(guò)構(gòu)建技術(shù)矩陣,使其最終服務(wù)于創(chuàng)作型工具平臺(tái)在視覺(jué)生成研究領(lǐng)域始終處于前沿,代表作品包括CycleGAN(Zhu 等,2017)、GauGAN(Park 等,2019)、EditGAN(Ling等,2021 等)、GANverse3D(Zhang 等,2020)、Instant NeRF(Müller 等,2022)等。
(3)OpenAI:通過(guò)客戶端付費(fèi)訂閱模式,對(duì)外提供GPT 和ChatGPT 等模型能力,實(shí)現(xiàn)商業(yè)化盈利。
(二)國(guó)內(nèi)AIGC發(fā)展現(xiàn)狀
相比于國(guó)際先進(jìn)科技公司,雖然中國(guó)AIGC 產(chǎn)業(yè)尚處于起步階段,底層技術(shù)和商業(yè)化落地較國(guó)外仍有一定距離,但眾多國(guó)內(nèi)知名企業(yè)如百度、阿里巴巴、京東在AIGC 領(lǐng)域也進(jìn)行了布局,并嘗試將相關(guān)技術(shù)應(yīng)用于自身業(yè)務(wù)。代表性公司包括:
1. 百度
2022 年8 月,基于自主研發(fā)的產(chǎn)業(yè)級(jí)大模型ERNIE(Sun 等,2019),百度推出AI 藝術(shù)創(chuàng)意輔助平臺(tái)——文心一格。通過(guò)文心大模型準(zhǔn)確的語(yǔ)義理解和圖片生成能力,文心一格可以為用戶提供豐富多樣的創(chuàng)意,幫助創(chuàng)作者打破創(chuàng)作瓶頸。同年9 月,百度發(fā)布多款A(yù)IGC 應(yīng)用內(nèi)容生產(chǎn)領(lǐng)域的技術(shù)和產(chǎn)品,包括“創(chuàng)作者AI 助理”和“百度APP 數(shù)字人”等。值得一提的是,由百度推出的AI 數(shù)字人度曉曉,作答2022 年高考語(yǔ)文作文得分達(dá)到48 分,得分超過(guò)了75%的考生,這表明AIGC 創(chuàng)造的內(nèi)容具有較高的可讀性和創(chuàng)造性。
2. 阿里巴巴
2019 年初,阿里巴巴達(dá)摩院?jiǎn)?dòng)通用性人工智能大模型M6 項(xiàng)目(Lin 等,2021),并于2021年3 月首次發(fā)布,參數(shù)量達(dá)到千億級(jí),成為世界上最大的中文多模態(tài)模型。同年11 月,M6 成為全球首個(gè)突破10 萬(wàn)億參數(shù)的AI 模型。M6 主打多模態(tài)、多任務(wù)能力,擅長(zhǎng)寫(xiě)作、對(duì)話等任務(wù),已在超40 個(gè)場(chǎng)景中實(shí)現(xiàn)商業(yè)化落地。目前,M6 模型已經(jīng)成為阿里重要的科技基礎(chǔ)設(shè)施,在電商領(lǐng)域的服裝設(shè)計(jì)和工業(yè)級(jí)文案生成以及支付寶的搜索推薦等業(yè)務(wù)中實(shí)現(xiàn)了產(chǎn)業(yè)化應(yīng)用。此外,阿里巴巴計(jì)劃在釘釘APP 中引入類ChatGPT 的對(duì)話機(jī)器人。
3. 京東
京東在AIGC賽道上的布局更加聚焦文本、數(shù)字人生成和通用型Chat AI 等技術(shù)。在文本生成領(lǐng)域,京東發(fā)布了商品文案生成模型K-PLUG(Xu 等,2021),幫助商家自動(dòng)生成商品標(biāo)題、商品賣點(diǎn)文案、商品直播文案,人工審核通過(guò)率超過(guò)95%。在數(shù)字人生成領(lǐng)域,京東利用AI 虛擬數(shù)字人代替人工客服,數(shù)字人主播在6.18 場(chǎng)景中試播,改變了傳統(tǒng)的營(yíng)銷模式。在2023 年2 月,京東宣布將推出ChatGPT 產(chǎn)業(yè)版——ChatJD,旨在打造高頻、剛需的產(chǎn)業(yè)版通用ChatGPT 類產(chǎn)品。
4. 創(chuàng)業(yè)公司
如表3 所示,國(guó)內(nèi)也涌現(xiàn)了一批成長(zhǎng)迅速的創(chuàng)業(yè)公司,代表企業(yè)如下:
(1)小冰科技:最早提出AI Being(人工智能數(shù)字員工)定義,并開(kāi)發(fā)了小冰框架,用于快速生成符合條件的虛擬人。目前,由小冰框架提供的數(shù)字人已活躍于眾多場(chǎng)景中,這其中包括萬(wàn)科集團(tuán)年度優(yōu)秀員工“崔筱盼”、紅杉中國(guó)首位虛擬分析師“Hóng”等。作為賦予AI Being 創(chuàng)造力的重要部分,小冰布局AIGC 多年,并已形成穩(wěn)定商業(yè)落地與文本、聲音、圖像的產(chǎn)品化陣列。在文本方面,小冰金融文本生成產(chǎn)品覆蓋約90%的機(jī)構(gòu)投資人。在繪畫(huà)方面,“夏語(yǔ)冰”創(chuàng)作的水墨畫(huà)是唯一入選去年迪拜世博會(huì)中國(guó)館的人工智能繪畫(huà)作品。據(jù)不完全統(tǒng)計(jì),由小冰創(chuàng)建并承載的人工智能交互主體,擁有全球范圍人工智能交互總流量約60%,超過(guò)主要同行業(yè)者亞馬遜、谷歌及蘋(píng)果同類產(chǎn)品的流量總和。
(2)聆心智能:基于生成式模型的情感對(duì)話系統(tǒng),為用戶打造不同類型的AI 心理陪伴人,并提供更科學(xué)、高效的精神健康服務(wù)。此外,聆心智能正致力于打造超擬人大模型,增加場(chǎng)景化、擬人化的風(fēng)格設(shè)定,讓AI 成為通用人工智能時(shí)代的智能體,具備個(gè)性、情感和成長(zhǎng)能力。
(3)影譜科技:憑借數(shù)字孿生等關(guān)鍵技術(shù)優(yōu)勢(shì)以及3D 數(shù)字化場(chǎng)景、沉浸式體驗(yàn)的營(yíng)造能力,發(fā)布了國(guó)內(nèi)首個(gè)依托AIGC 技術(shù)的元宇宙活動(dòng)平臺(tái)——影宙,將元宇宙和AIGC 相結(jié)合,探索元宇宙與各垂直行業(yè)的融合應(yīng)用。
(三)中美兩國(guó)
大模型及AIGC 發(fā)展對(duì)比大模型作為一種變革性技術(shù),已經(jīng)成為AIGC 及整個(gè)人工智能技術(shù)的制高點(diǎn)和基礎(chǔ)設(shè)施,中國(guó)和美國(guó)作為這個(gè)領(lǐng)域的主要玩家,正在圍繞AIGC 展開(kāi)角逐。在本小節(jié),本文旨在對(duì)中美兩國(guó)大模型數(shù)量及參數(shù)量、論文及研究機(jī)構(gòu)和AIGC 創(chuàng)業(yè)公司及產(chǎn)業(yè)環(huán)境等方面進(jìn)行對(duì)比,深度解析中國(guó)和美國(guó)AIGC 賽道。
1. 預(yù)訓(xùn)練模型參數(shù)量
如表4 所示,在預(yù)訓(xùn)練語(yǔ)言模型的參數(shù)量排名前10 的機(jī)構(gòu)中,美國(guó)有6 個(gè),中國(guó)擁有4 個(gè)。在部分評(píng)測(cè)基準(zhǔn)中,中國(guó)的大模型成績(jī)甚至更加優(yōu)異,特別表現(xiàn)在中文語(yǔ)言理解、閱讀理解等榜單中。但這一類大模型底層創(chuàng)新均來(lái)自于美國(guó)的研究機(jī)構(gòu)。國(guó)內(nèi)推出的大模型如百度文心、阿里M6、華為盤(pán)古(Zeng 等,2021)、智源研究院悟道(Yuan 等,2022)和浪潮源1.0(Wu 等,2021)等,均基于BERT(Devlin 等,2018)大模型架構(gòu)優(yōu)化而來(lái),缺乏根技術(shù)上的創(chuàng)新。此外,現(xiàn)階段上述模型在問(wèn)題回答的完整性和邏輯性等方面,仍無(wú)法與ChatGPT 抗衡。
2. AIGC 模型相關(guān)論文、研發(fā)機(jī)構(gòu)
過(guò)去五年,美國(guó)總共發(fā)表了98 篇與預(yù)訓(xùn)練模型相關(guān)的論文,中國(guó)則發(fā)表了240 篇。不難發(fā)現(xiàn),中國(guó)論文發(fā)表數(shù)量遙遙領(lǐng)先,但在論文引用情況方面,引用量排名前十的論文大都來(lái)自美國(guó)的研究者,可見(jiàn)美國(guó)的高質(zhì)量論文仍然處于領(lǐng)先地位。此外,如圖1 所示,在全球AIGC 模型研發(fā)機(jī)構(gòu)排名中,前十名中美國(guó)占據(jù)六席,中國(guó)機(jī)構(gòu)則占據(jù)四席。因此,中國(guó)研發(fā)機(jī)構(gòu)雖然起步較晚,但不遜色于美國(guó)。
3. AIGC 獨(dú)角獸數(shù)量和產(chǎn)業(yè)環(huán)境對(duì)比
由于技術(shù)發(fā)展不足,以及產(chǎn)業(yè)環(huán)境的影響,在中國(guó),AIGC 大多被作為公司的部分業(yè)務(wù)乃至相對(duì)邊緣化的功能進(jìn)行研發(fā),獨(dú)立運(yùn)行的創(chuàng)業(yè)公司數(shù)量明顯少于美國(guó),大部分細(xì)分賽道的初創(chuàng)玩家也都少于5 家。截至2022 年底,美國(guó)的AIGC 獨(dú)角獸數(shù)量是292 家,估值4.6 萬(wàn)億美元,中國(guó)則有69 家,估值1.4 萬(wàn)億美元。與美國(guó)相比,中國(guó)人工智能獨(dú)角獸的數(shù)量和估值差距仍然很大。此外,中國(guó)AIGC 布局最多的賽道是AI 寫(xiě)作和語(yǔ)音合成領(lǐng)域,虛擬人賽道剛剛開(kāi)始興起,基本均停留在內(nèi)容領(lǐng)域。而在美國(guó),延展領(lǐng)域得到了更為充分的挖掘,例如個(gè)性化文本生成、合成數(shù)據(jù)等賽道均是重點(diǎn)布局領(lǐng)域。
通過(guò)上述對(duì)比分析可以發(fā)現(xiàn),中國(guó)AIGC 發(fā)展水平仍與美國(guó)存在一定差距,究其原因,可以歸結(jié)為以下三個(gè)方面:
(1)從算力層面來(lái)看,我國(guó)的數(shù)據(jù)中心多面向軟件應(yīng)用環(huán)境,真正面向AI 的算力非常少,又或者需求不高,而算力本身非常昂貴,模型越大,數(shù)據(jù)越多,數(shù)據(jù)訓(xùn)練AI 所要消耗的費(fèi)用就越大。以ChatGPT 為例,訓(xùn)練一次的成本約140 萬(wàn)美元,這是國(guó)內(nèi)大多公司不能負(fù)擔(dān)的。此外,高端GPU和AI 芯片缺乏也成為國(guó)內(nèi)AIGC 領(lǐng)域卡脖子問(wèn)題。
(2)從數(shù)據(jù)層面來(lái)看,國(guó)內(nèi)數(shù)據(jù)的質(zhì)量普遍不高,一是數(shù)據(jù)積累量不夠,再者數(shù)據(jù)管理較為嚴(yán)格,部分?jǐn)?shù)據(jù)文本需要審批才可以被人工智能企業(yè)使用,減慢了數(shù)據(jù)價(jià)值的釋放。而美國(guó)擁有龐大的、高質(zhì)量的數(shù)據(jù)資源,這使得美國(guó)企業(yè)可以在大數(shù)據(jù)的支持下,快速開(kāi)發(fā)AIGC 技術(shù),并提供更加準(zhǔn)確、多樣化的服務(wù)。
(3)從人才層面來(lái)看,美國(guó)擁有全球先進(jìn)的高等教育體系和吸引科技人才的激勵(lì)措施,這使得美國(guó)企業(yè)可以從世界范圍內(nèi)吸引最優(yōu)秀的人才來(lái)開(kāi)發(fā)AIGC 技術(shù)。盡管中國(guó)擁有大量的科技人才,但在AIGC 領(lǐng)域的高端人才匱乏;我國(guó)AI 開(kāi)發(fā)者有思維慣性,過(guò)度依賴開(kāi)源內(nèi)容,對(duì)大模型缺乏探索創(chuàng)新。
綜上所述,大模型和AIGC 是新一代人工智能技術(shù)最主要的競(jìng)爭(zhēng)領(lǐng)域,中美都將其作為戰(zhàn)略高地,傾注了大量的資源??傮w上呈現(xiàn)出美國(guó)領(lǐng)先、中國(guó)追趕的局面。中國(guó)大模型發(fā)展迅速,但生態(tài)構(gòu)建和商業(yè)應(yīng)用還有很大發(fā)展空間。在保持總量、規(guī)模和速度的同時(shí),需要提升質(zhì)量,實(shí)現(xiàn)大模型的高質(zhì)量發(fā)展。
四、AIGC產(chǎn)業(yè)發(fā)展機(jī)遇
隨著預(yù)訓(xùn)練大模型走向成熟并成為AIGC 應(yīng)用的技術(shù)底座,AIGC 相關(guān)產(chǎn)業(yè)有望迎來(lái)爆發(fā)期。本節(jié)將從AIGC 相關(guān)產(chǎn)業(yè)鏈和重點(diǎn)行業(yè)應(yīng)用領(lǐng)域角度分析AIGC 可能帶來(lái)的發(fā)展機(jī)遇。具體來(lái)說(shuō),AIGC 以大模型、大數(shù)據(jù)和大算力為基礎(chǔ)(鄭世林等,2023),AIGC 熱度持續(xù)提升,將帶動(dòng)算力、芯片等相關(guān)產(chǎn)業(yè)鏈加速發(fā)展。此外,各行業(yè)對(duì)于數(shù)字內(nèi)容的需求正在爆發(fā)性增長(zhǎng),數(shù)字世界中內(nèi)容的消費(fèi)和供給之間存在巨大差距,迫切需要加以彌合。AIGC 以其真實(shí)性、多樣性、組合性的特征,有望幫助企業(yè)提高內(nèi)容生產(chǎn)效率,解放生產(chǎn)力,提高相關(guān)數(shù)字化產(chǎn)品的智能度,從而更好地服務(wù)于傳媒、影視和電商等內(nèi)容需求豐富的行業(yè)。
(一)AIGC 相關(guān)產(chǎn)業(yè)鏈和數(shù)字經(jīng)濟(jì)或?qū)⒂瓉?lái)發(fā)展良機(jī)
AIGC算法復(fù)雜,模型訓(xùn)練需要海量數(shù)據(jù),對(duì)算力要求呈指數(shù)級(jí)提升,同時(shí)也需要快速高效的方式來(lái)處理數(shù)據(jù)集。在內(nèi)容生產(chǎn)過(guò)程中,AIGC 相關(guān)模型需要對(duì)海量的標(biāo)注數(shù)據(jù)進(jìn)行不斷的學(xué)習(xí),從而更好地學(xué)習(xí)人類的說(shuō)話方式和想法,最終實(shí)現(xiàn)高質(zhì)量創(chuàng)作。以ChatGPT 為例,目前提供能力基于GPT-3.5 和RLHF(人類反饋強(qiáng)化學(xué)習(xí))訓(xùn)練獲得,與GPT 家族的其他模型(GPT-1、GPT-2)相比,模型結(jié)構(gòu)并沒(méi)有太大改變,但模型訓(xùn)練的參數(shù)量從1.7 億增加到1 750 億,預(yù)訓(xùn)練數(shù)據(jù)量從5GB 增加到45TB。隨著模型的迭代升級(jí),預(yù)計(jì)數(shù)據(jù)量和算力需求都會(huì)繼續(xù)成幾何倍數(shù)增長(zhǎng)。因此,AIGC 和相關(guān)產(chǎn)業(yè)互相促進(jìn),互相支撐。首先,隨著AIGC 在更多領(lǐng)域得到應(yīng)用,海量數(shù)據(jù)和流量將源源不斷地產(chǎn)生,以算力為代表的云計(jì)算等基礎(chǔ)設(shè)施或?qū)⒊掷m(xù)釋放。通信硬件設(shè)施將是AIGC 發(fā)展最先受益的環(huán)節(jié),包括運(yùn)營(yíng)商為主的技術(shù)設(shè)施底座、承載算力的 IDC、服務(wù)器“東數(shù)西算”帶來(lái)的骨干網(wǎng)建設(shè)需求等各個(gè)產(chǎn)業(yè)鏈環(huán)節(jié);其次,從云計(jì)算、大數(shù)據(jù)、人工智能、邊緣計(jì)算等技術(shù)角度來(lái)講,未來(lái)應(yīng)用的高算力運(yùn)算需求,對(duì)基礎(chǔ)設(shè)施提出更高要求的基礎(chǔ)上也進(jìn)一步帶動(dòng)對(duì)相關(guān)技術(shù)及算法的需求;最后,從應(yīng)用端角度來(lái)講,以工業(yè)互聯(lián)網(wǎng)、車聯(lián)網(wǎng)、云游戲以及AR/VR 等應(yīng)用漸行漸近,應(yīng)用場(chǎng)景的不斷落地,進(jìn)一步倒逼基礎(chǔ)設(shè)施建設(shè)的不斷加快升級(jí)。同時(shí),隨著應(yīng)用場(chǎng)景的不斷豐富,也將進(jìn)一步拉動(dòng)相關(guān)產(chǎn)業(yè)鏈環(huán)節(jié)需求進(jìn)一步提升。另一方面,隨著云計(jì)算等基礎(chǔ)設(shè)施的完善、數(shù)字經(jīng)濟(jì)應(yīng)用的落地和發(fā)展,數(shù)據(jù)等計(jì)算資源得以不斷增加,這為AIGC 的迭代優(yōu)化提供了寶貴的訓(xùn)練數(shù)據(jù),其算法得以更加精進(jìn),從而生成更符合人類語(yǔ)言和行為的內(nèi)容。
(二)AIGC 有望塑造數(shù)字內(nèi)容生產(chǎn)與交互新范式
數(shù)字內(nèi)容邁入強(qiáng)需求、視頻化、拼創(chuàng)意的螺旋式升級(jí)周期,AIGC 的發(fā)展恰好迎合了這一需要。AIGC 正在越來(lái)越頻繁地被應(yīng)用到數(shù)字內(nèi)容的創(chuàng)作工作中,成為未來(lái)互聯(lián)網(wǎng)的內(nèi)容生產(chǎn)基礎(chǔ)設(shè)施。
近年來(lái),AI 技術(shù)正被廣泛應(yīng)用于傳媒業(yè)的內(nèi)容生產(chǎn)、分發(fā)和管理等環(huán)節(jié)。AIGC 作為當(dāng)前新型的內(nèi)容生產(chǎn)方式,有助于進(jìn)一步降低相關(guān)企業(yè)的邊際成本,并賦能自動(dòng)采編、作品自動(dòng)生成、游戲建模及虛擬人輔助創(chuàng)造等環(huán)節(jié)。具體來(lái)說(shuō),在采編環(huán)節(jié),基于AI 算法可以快速自動(dòng)化地批量生成文章,幫助新聞編輯人員更快、更準(zhǔn)、更智能化地生產(chǎn)內(nèi)容。比如中國(guó)地震臺(tái)網(wǎng)的寫(xiě)稿機(jī)器人僅用25 秒便完成了《四川阿壩州九寨溝縣發(fā)生7.0 級(jí)地震》這一消息的準(zhǔn)確編發(fā),這則消息不僅包括速報(bào)參數(shù)、震中地形等8 項(xiàng)內(nèi)容,還配了4 張現(xiàn)場(chǎng)圖片。此外,AIGC 可以幫助從業(yè)者借助字幕生成和視頻錦集等工具,實(shí)現(xiàn)視頻智能剪輯,提升視頻內(nèi)容價(jià)值。如2022 年北京冬奧會(huì)期間,央視借助AI 智能內(nèi)容生產(chǎn)剪輯系統(tǒng),自動(dòng)制作比賽項(xiàng)目的視頻集錦,高效節(jié)省了人力和時(shí)間成本,提高多類型內(nèi)容編發(fā)能力。
隨著影視行業(yè)的快速發(fā)展,高質(zhì)量劇本相對(duì)缺乏、制作成本高昂以及部分作品質(zhì)量等過(guò)程性問(wèn)題逐漸顯現(xiàn),亟待進(jìn)行產(chǎn)業(yè)結(jié)構(gòu)升級(jí),向信息化、數(shù)字化的方向發(fā)展。借助AIGC 技術(shù),可以激發(fā)影視劇本創(chuàng)作的思路,擴(kuò)展影視角色和場(chǎng)景的創(chuàng)作空間,從而在后期制作過(guò)程中大幅提升影視產(chǎn)品的質(zhì)量。這不僅有助于實(shí)現(xiàn)影視作品的文化價(jià)值與經(jīng)濟(jì)價(jià)值的最大化,同時(shí)也能夠有效應(yīng)對(duì)影視行業(yè)在創(chuàng)作和制作過(guò)程中所面臨的諸多挑戰(zhàn)。比如通過(guò)AI 合成人臉、聲音等相關(guān)內(nèi)容,實(shí)現(xiàn)“數(shù)字復(fù)活”已故演員、高難度動(dòng)作合成等,擴(kuò)展角色和場(chǎng)景創(chuàng)作空間。此外,借助AIGC 合成虛擬物理場(chǎng)景,能夠創(chuàng)造無(wú)法實(shí)拍或成本過(guò)高的場(chǎng)景,極大拓展影視作品想象力的邊界,給觀眾帶來(lái)更優(yōu)質(zhì)的視聽(tīng)體驗(yàn)。長(zhǎng)期來(lái)看,隨著模型參數(shù)和數(shù)據(jù)訓(xùn)練量的提升,AIGC 有望大幅提升影視內(nèi)容供給量及創(chuàng)作效率。
(三)AIGC 促進(jìn)電商發(fā)展模式的轉(zhuǎn)變
隨著數(shù)字技術(shù)的不斷創(chuàng)新和應(yīng)用,消費(fèi)者的需求不斷升級(jí)和加速,沉浸式購(gòu)物體驗(yàn)已成為電商領(lǐng)域不可或缺的發(fā)展趨勢(shì)。AIGC 正加快商品3D 模型、虛擬主播乃至虛擬貨場(chǎng)的構(gòu)建,通過(guò)結(jié)合元宇宙技術(shù),實(shí)現(xiàn)視聽(tīng)等多感官交互的沉浸式購(gòu)物體驗(yàn)。具體而言,在商品展示和試用環(huán)節(jié),借助AIGC 可以自動(dòng)生成商品的3D 幾何模型和紋理,幫助消費(fèi)者實(shí)現(xiàn)虛擬試用,提高商品銷售轉(zhuǎn)化率。積木易搭推出的3D 數(shù)字化解決方案,支持在分鐘級(jí)的時(shí)間內(nèi)完成商品的3D 拍攝和生成,精度可達(dá)到毫米級(jí)。相較于傳統(tǒng)電商商品展示采用圖文、短視頻的展現(xiàn)形式,3D 動(dòng)態(tài)互動(dòng)形式的商品對(duì)于消費(fèi)者更有吸引力。同時(shí)生成出的3D 商品模型還可用于在線試穿,高度還原商品或服務(wù)試用的體驗(yàn)感,從而更好地體驗(yàn)其質(zhì)量和性能,有助于提高消費(fèi)者的購(gòu)買(mǎi)意愿。數(shù)據(jù)顯示,3D 購(gòu)物的轉(zhuǎn)化率平均值為70%,較行業(yè)平均水平提升了9 倍,同比正常引導(dǎo)成交客單價(jià)提升超200%,同時(shí)商品退換貨率顯著降低。此外,AIGC 可以幫助打造虛擬主播,賦能直播帶貨?;谟?jì)算機(jī)視覺(jué)、CG渲染和動(dòng)作捕捉等技術(shù),打造虛擬主播為觀眾提供24 小時(shí)不間斷的貨品推薦介紹以及在線服務(wù)能力,降低商家直播門(mén)檻。相比真人直播間帶貨,虛擬主播具備三大優(yōu)勢(shì):一是虛擬主播能夠填補(bǔ)真人主播的空白時(shí)間,使直播間能不停輪播,既為用戶提供更靈活的觀看時(shí)間和更方便的購(gòu)物體驗(yàn),也為合作商家創(chuàng)造更大的生意增量。二是虛擬品牌能加快店鋪或品牌年輕化進(jìn)程,拉近與新消費(fèi)人群的距離。通過(guò)在元宇宙中建立虛擬形象,品牌主播可以更好地塑造品牌形象,吸引更多的消費(fèi)者(鄭世林等,2022)。未來(lái),虛擬品牌主播還可以延伸到元宇宙中的更多場(chǎng)景中,實(shí)現(xiàn)圈層傳播。AIGC 同樣能夠賦能線上商城和線下秀場(chǎng)加速演變,為消費(fèi)者提供全新的購(gòu)物場(chǎng)景。通過(guò)從二維圖像中重建場(chǎng)景的三維幾何結(jié)構(gòu),實(shí)現(xiàn)虛擬貨場(chǎng)快速、低成本、大批量的構(gòu)建,將有效降低商家搭建3D 購(gòu)物空間的門(mén)檻及成本,為一些原本高度倚重線下門(mén)店的行業(yè)打開(kāi)了線上線下融合的想象空間,同時(shí)為消費(fèi)者提供線上線下融合的新消費(fèi)體驗(yàn)。
(四)AIGC 推進(jìn)數(shù)實(shí)融合,加快產(chǎn)業(yè)升級(jí)
AIGC 在工業(yè)、金融、教育、醫(yī)療等行業(yè)同樣也將快速滲透,助力產(chǎn)業(yè)升級(jí)。在工業(yè)領(lǐng)域,AIGC有助于提升產(chǎn)業(yè)效率和水平。主要體現(xiàn)在:一是融入計(jì)算機(jī)輔助設(shè)計(jì),AIGC 將工業(yè)流程中低級(jí)重復(fù)、多耗時(shí)以及低層次的任務(wù)自動(dòng)化,將數(shù)千小時(shí)的時(shí)間耗費(fèi)縮短至幾分鐘,可最大程度縮短工程設(shè)計(jì)周期,提高效率;二是AIGC 支持生成衍生設(shè)計(jì),為工程師提供更多靈感刺激;三是AIGC 能夠在設(shè)計(jì)中引入變化,實(shí)現(xiàn)動(dòng)態(tài)模擬,提高產(chǎn)業(yè)適應(yīng)性和生動(dòng)性;四是AIGC 推動(dòng)加速構(gòu)建數(shù)字孿生系統(tǒng)。AIGC 將物理環(huán)境中的數(shù)字幾何圖形,參數(shù)化為3D 建模數(shù)據(jù),創(chuàng)建物理世界中的數(shù)字孿生系統(tǒng)。在金融領(lǐng)域,AIGC 助力實(shí)現(xiàn)降本增效。一方面AIGC 可實(shí)現(xiàn)金融資訊、產(chǎn)品介紹視頻的自動(dòng)化生產(chǎn),提升金融機(jī)構(gòu)運(yùn)營(yíng)的效率;另一方面,AIGC 可以塑造視、聽(tīng)雙通道的虛擬數(shù)字人客服,讓金融服務(wù)內(nèi)容更加生動(dòng),方式更加多元。在教育領(lǐng)域,AIGC 賦予教育新活力。一方面,AIGC為教育工作者提供了新的工具,使平面抽象的課本立體化、具象化,以更加生動(dòng)的方式向受教者傳遞知識(shí);另一方面,相比于閱讀和講座等傳統(tǒng)方式,AIGC 可以合成虛擬人物,增強(qiáng)互動(dòng)性與趣味性,給一場(chǎng)枯燥乏味的演講注入新的活力。在醫(yī)療領(lǐng)域,AIGC 賦能診療全過(guò)程。主要體現(xiàn)在:一是在輔助診斷方面,AIGC 可改善醫(yī)學(xué)圖像質(zhì)量、輔助錄入電子病歷等,最大限度解放醫(yī)生的智力與精力,使專業(yè)醫(yī)生專注到核心業(yè)務(wù)中,既能提高效率,又能實(shí)現(xiàn)專業(yè)醫(yī)生業(yè)務(wù)能力的提升;二是在康復(fù)治療方面,AIGC 可以為失聲者合成語(yǔ)言音頻,為殘疾者合成肢體投影,為心理疾病患者合成無(wú)攻擊感的醫(yī)護(hù)陪伴等,提供人性化康復(fù)治療,舒緩其情緒,加速患者康復(fù)??傊?,AIGC 正在發(fā)展成與其他各類產(chǎn)業(yè)深度融合的橫向結(jié)合體,其相關(guān)應(yīng)用正加速滲透到經(jīng)濟(jì)社會(huì)的方方面面。
五、AIGC 發(fā)展面臨的問(wèn)題與挑戰(zhàn)
隨著人工智能技術(shù)發(fā)展步入快車道,AIGC 因?yàn)槠溲杆俚姆磻?yīng)能力、生動(dòng)的信息輸出、廣泛的應(yīng)用場(chǎng)景,加速滲透到社會(huì)生產(chǎn)和生活的方方面面。在滲透過(guò)程中,AIGC 的關(guān)鍵技術(shù)攻關(guān)水平有待提升,相關(guān)法律法規(guī)有待完善,圍繞公平正義、社會(huì)責(zé)任、國(guó)家安全的爭(zhēng)議日益增多,引發(fā)一系列亟待解決的經(jīng)濟(jì)與社會(huì)問(wèn)題。
(一)AIGC 核心技術(shù)有待攻關(guān)
目前,國(guó)內(nèi)外AIGC 迭代升級(jí),能夠進(jìn)一步釋放生產(chǎn)力,但核心技術(shù)方面尚有局限,阻礙產(chǎn)業(yè)發(fā)展進(jìn)程。一是AIGC 技術(shù)所依賴的人工智能算法存在固有缺陷。例如其透明度方面仍然存在尚未攻克的技術(shù)難題,由于算法模型的黑箱運(yùn)作機(jī)制,其運(yùn)行機(jī)制和因果邏輯無(wú)法清晰呈現(xiàn)出來(lái),這一模型特點(diǎn)導(dǎo)致人們無(wú)法理解和解釋其傳導(dǎo)機(jī)制,若算法出現(xiàn)錯(cuò)誤,將不利于糾偏除誤(李安,2021)。因此,算法的應(yīng)用存在問(wèn)題。又如,算法運(yùn)行容易受到模型、數(shù)據(jù)、學(xué)習(xí)方法的影響,呈現(xiàn)出非穩(wěn)健的性質(zhì)。當(dāng)數(shù)據(jù)量不足時(shí),其算法模型被隨機(jī)噪聲影響的可能性較大,容易得出錯(cuò)誤結(jié)論;在算法投入應(yīng)用之后,在線數(shù)據(jù)內(nèi)容不斷更新,算法極有可能引致系統(tǒng)性能方面的偏差,進(jìn)而引發(fā)系統(tǒng)失靈;算法以數(shù)據(jù)為基礎(chǔ),若使用的初始數(shù)據(jù)有偏,這些有偏數(shù)據(jù)不會(huì)隨時(shí)間流逝而消失,反而會(huì)永久影響模型的運(yùn)行結(jié)果,最終導(dǎo)致人工智能算法生成內(nèi)容錯(cuò)誤,引發(fā)用戶對(duì)于算法的公平性爭(zhēng)議(劉璇和朝樂(lè)門(mén),2022)。二是AIGC 內(nèi)容創(chuàng)作技術(shù)仍不完善。例如,在文本生成方面,部分企業(yè)在自然語(yǔ)言理解技術(shù)方面沒(méi)有取得實(shí)質(zhì)性突破,往往只是簡(jiǎn)單地機(jī)械化套用模板,導(dǎo)致生成的文本缺乏邏輯性,文本結(jié)構(gòu)雷同、千篇一律,可讀性不高。在語(yǔ)音合成方面,當(dāng)前基于AIGC 技術(shù)的語(yǔ)音表達(dá)不夠流暢、斷句存在錯(cuò)誤、聲音具有較強(qiáng)的機(jī)械感。若進(jìn)一步提高生成語(yǔ)音的情感嵌入,不僅需要更高水平的模型,還需要大規(guī)模的數(shù)據(jù)量支持訓(xùn)練,對(duì)模型和數(shù)據(jù)的高要求使得難以控制成本,導(dǎo)致AIGC 技術(shù)使用復(fù)雜度提升,最終制約技術(shù)落地與推廣。
(二)行業(yè)發(fā)展規(guī)范有待完善
近年來(lái),隨著人工智能技術(shù)的快速發(fā)展,人工智能產(chǎn)業(yè)規(guī)范也逐漸完善,治理體系初步形成,但由于科技進(jìn)步的加速,制度建設(shè)也未必能夠及時(shí)跟進(jìn),這導(dǎo)致了技術(shù)創(chuàng)新發(fā)展與政策支持、法律規(guī)制之間的不匹配問(wèn)題(劉維,2021)。具體來(lái)說(shuō),AIGC 大量進(jìn)入市場(chǎng)對(duì)著作權(quán)法理論構(gòu)成巨大挑戰(zhàn)。當(dāng)前,中國(guó)《著作權(quán)法》中規(guī)定,著作權(quán)的指向?qū)ο鬄椤白髌贰?。僅從法律文本來(lái)看,我國(guó)現(xiàn)行知識(shí)產(chǎn)權(quán)法律體系均規(guī)定法律主體為享有權(quán)利、負(fù)有義務(wù)和承擔(dān)責(zé)任的人。因此,非人生產(chǎn)的智能化內(nèi)容難以通過(guò)“作品—?jiǎng)?chuàng)作—作者”的邏輯獲得著作權(quán)的保護(hù),這一觀點(diǎn)獲得了2019 年北京互聯(lián)網(wǎng)法院的判決支持。而在2020 年騰訊公司訴網(wǎng)貸之家網(wǎng)站轉(zhuǎn)載機(jī)器人自動(dòng)撰寫(xiě)的文章作品一案中,深圳南山區(qū)法院認(rèn)為在滿足獨(dú)創(chuàng)性要求的情況下,人工智能撰寫(xiě)的文章屬于著作權(quán)保護(hù)的作品。法律概念的模糊引發(fā)司法裁判的翻轉(zhuǎn),導(dǎo)致AIGC 作品存在著作權(quán)歸屬不清的現(xiàn)實(shí)困境。這一問(wèn)題不僅可能導(dǎo)致使用AIGC 技術(shù)創(chuàng)作的作品無(wú)法獲得著作權(quán)保護(hù),阻礙人工智能技術(shù)發(fā)揮其創(chuàng)作價(jià)值,還有可能因人工智能的海量摹寫(xiě)行為稀釋既有作品權(quán)利人的獨(dú)創(chuàng)性,威脅他人的合法權(quán)益。
(三)良好行業(yè)生態(tài)構(gòu)建面臨挑戰(zhàn)
良好行業(yè)生態(tài)的構(gòu)建有賴于每個(gè)企業(yè)主體的努力。目前,健康行業(yè)生態(tài)面臨一系列挑戰(zhàn):一方面,當(dāng)前我國(guó)AIGC 技術(shù)仍處于發(fā)展初期,具有未知性和不穩(wěn)定性,大多企業(yè)尚沒(méi)有做好應(yīng)對(duì)與防范風(fēng)險(xiǎn)的準(zhǔn)備,應(yīng)急處置能力有待提高,風(fēng)險(xiǎn)治理理念尚未真正落實(shí)到技術(shù)研發(fā)與應(yīng)用中。這可能導(dǎo)致企業(yè)錯(cuò)失把風(fēng)險(xiǎn)攔截在萌芽狀態(tài)的機(jī)會(huì),為行業(yè)生態(tài)埋下隱患,一旦遭受內(nèi)部威脅或外部攻擊,極易引發(fā)網(wǎng)絡(luò)信息內(nèi)容生態(tài)安全風(fēng)險(xiǎn)。另一方面,近年來(lái),各科技企業(yè)通過(guò)建立內(nèi)容審核機(jī)制,落實(shí)互聯(lián)網(wǎng)內(nèi)容治理主體責(zé)任,形成了“機(jī)審+人審”的基本審核方式。但在機(jī)審方面,受到審核類型、內(nèi)容違規(guī)變化繁雜、網(wǎng)絡(luò)黑灰產(chǎn)對(duì)抗手段加劇等因素影響,出現(xiàn)審核錯(cuò)誤率偏高的情況;在人審方面,因不同人審團(tuán)隊(duì)在人員管理、業(yè)務(wù)流程、審核能力等方面表現(xiàn)各異,沒(méi)有形成統(tǒng)一的行業(yè)標(biāo)準(zhǔn),缺乏專業(yè)審核人員,導(dǎo)致包含虛假、錯(cuò)誤、違法違規(guī)信息內(nèi)容流出,嚴(yán)重影響行業(yè)甚至整個(gè)網(wǎng)絡(luò)生態(tài)環(huán)境。
(四)企業(yè)技術(shù)管理能力建設(shè)不足
隨著數(shù)字技術(shù)的開(kāi)源開(kāi)放,AIGC 技術(shù)研發(fā)門(mén)檻、制作成本等不斷降低,致使市場(chǎng)上的企業(yè)魚(yú)龍混雜,多數(shù)企業(yè)核心能力不足,主要體現(xiàn)在企業(yè)技術(shù)管理能力不足。由于AIGC 技術(shù)具有動(dòng)態(tài)性,且愈發(fā)復(fù)雜,這要求企業(yè)作為技術(shù)研發(fā)主體具備相應(yīng)的技術(shù)研發(fā)與管理能力。但是企業(yè)的商業(yè)屬性決定了其逐利性,當(dāng)資源有限時(shí),企業(yè)會(huì)首先滿足自身盈利,而降低對(duì)技術(shù)研發(fā)和制度保障機(jī)制的投入。不同企業(yè)的核心能力差距巨大,表現(xiàn)為:投資積累“家底”厚實(shí)、發(fā)展時(shí)間長(zhǎng)的企業(yè)可能有更高的技術(shù)研發(fā)和管理水平,反之水平較低。在廣闊的應(yīng)用場(chǎng)景吸引下,眾多初入市場(chǎng)的小型企業(yè)在技術(shù)管理能力不達(dá)標(biāo)的情況下,將AIGC 投入應(yīng)用,滋生了抄襲侵權(quán)、內(nèi)容造假、惡意營(yíng)銷等灰黑產(chǎn)業(yè)鏈的溫床,阻礙了行業(yè)的健康和可持續(xù)發(fā)展。
六、發(fā)展建議與展望
AIGC 相關(guān)技術(shù)發(fā)展將為云計(jì)算、傳媒、影視、電商和醫(yī)療等行業(yè)帶來(lái)前所未有的發(fā)展機(jī)遇。與此同時(shí),AIGC 發(fā)展也面臨商業(yè)化落地、版權(quán)確權(quán)、隱私保護(hù)等一系列挑戰(zhàn)。為此,本文從產(chǎn)學(xué)研用、法律法規(guī)、行業(yè)生態(tài)和政策引導(dǎo)等維度,對(duì)AIGC 的發(fā)展提出建議,并對(duì)未來(lái)發(fā)展方向進(jìn)行展望。
(一)發(fā)展建議
1. 鼓勵(lì)產(chǎn)學(xué)研用協(xié)同,推動(dòng)科技攻關(guān)
鼓勵(lì)產(chǎn)學(xué)研用各主體基于開(kāi)源共享平臺(tái)促成協(xié)同合作、加快技術(shù)創(chuàng)新與應(yīng)用創(chuàng)新。圍繞AIGC產(chǎn)業(yè)發(fā)展與治理需求,一是推動(dòng)行業(yè)層面在算力能力、算法技術(shù)、技術(shù)落地等方面的聯(lián)合攻關(guān),聚焦算法透明度、穩(wěn)健性、偏見(jiàn)與歧視等技術(shù)攻關(guān),突破行業(yè)發(fā)展瓶頸;二是鼓勵(lì)超大規(guī)模神經(jīng)網(wǎng)絡(luò)模型的聯(lián)合研發(fā)與代碼開(kāi)源,支持產(chǎn)學(xué)研各界通過(guò)合作構(gòu)建訓(xùn)練與標(biāo)準(zhǔn)測(cè)試數(shù)據(jù)集、搭建面向重點(diǎn)行業(yè)應(yīng)用的開(kāi)發(fā)者協(xié)同平臺(tái)等方式,加快共性技術(shù)和基礎(chǔ)產(chǎn)品研發(fā)、降低AIGC 應(yīng)用門(mén)檻,促進(jìn)產(chǎn)業(yè)化繁榮發(fā)展;三是探索構(gòu)建行業(yè)級(jí)AIGC 參考實(shí)施框架,以生態(tài)協(xié)議、行業(yè)標(biāo)準(zhǔn)的互聯(lián)互通支撐內(nèi)容生態(tài)的共建共享;四是嘗試通過(guò)推廣制度模板、制定多邊議程、發(fā)揮市場(chǎng)工具等手段,積極參與AIGC 應(yīng)用與治理等領(lǐng)域的國(guó)際規(guī)則制定和全球發(fā)展合作,通過(guò)制度性輸出和影響力的擴(kuò)大,支持相關(guān)產(chǎn)業(yè)和重點(diǎn)企業(yè)增強(qiáng)海外競(jìng)爭(zhēng)力、爭(zhēng)取更大國(guó)際市場(chǎng)與產(chǎn)業(yè)話語(yǔ)權(quán)。
2. 完善法律法規(guī),推進(jìn)監(jiān)管治理
統(tǒng)籌推進(jìn)“技術(shù)”監(jiān)管與“內(nèi)容”治理,逐步完善保障AIGC 良性發(fā)展的治理體系。近年來(lái),我國(guó)相繼頒布《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》①《網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例(征求意見(jiàn)稿)》②《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》③和《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定(征求意見(jiàn)稿)》④等法規(guī)??傮w而言,劃清了AIGC 相關(guān)技術(shù)發(fā)展的紅線,但就細(xì)節(jié)而言,責(zé)任認(rèn)定與歸結(jié)、知識(shí)產(chǎn)權(quán)保護(hù)等問(wèn)題尚處于起步階段。因此,仍然需要政府和相關(guān)研究機(jī)構(gòu)盡早前瞻布局,完善監(jiān)管與治理體系。針對(duì)AIGC 作品權(quán)屬認(rèn)定等方面的法律法規(guī)缺位問(wèn)題,可以從法律法規(guī)層面進(jìn)一步明確AIGC 的應(yīng)用范圍,明晰AIGC 技術(shù)研發(fā)與孵化、內(nèi)容傳播等相關(guān)方面的主體責(zé)任;針對(duì)基于深度偽造技術(shù)的虛假內(nèi)容制作和散布問(wèn)題,需要監(jiān)管部門(mén)對(duì)披露和標(biāo)注生成內(nèi)容、傳播媒介提高鑒別能力,并制定規(guī)范細(xì)化主體責(zé)任;針對(duì)模仿、抄襲或合理使用的認(rèn)定標(biāo)準(zhǔn)模糊的問(wèn)題,探索侵權(quán)主體及侵權(quán)責(zé)任的認(rèn)定路徑,對(duì)AIGC 作品及其智力與經(jīng)濟(jì)投入、技術(shù)工具及作品所依賴的數(shù)據(jù)基礎(chǔ)等提供平衡的保護(hù),確保相關(guān)數(shù)字內(nèi)容的合規(guī)有序流通;針對(duì)AIGC 技術(shù)及應(yīng)用快速迭代的特點(diǎn),探索形成法律法規(guī)動(dòng)態(tài)評(píng)估、修改和廢止機(jī)制,確保法律法規(guī)和監(jiān)管治理的科學(xué)化、精細(xì)化、敏捷化。同時(shí),謹(jǐn)遵包容審慎理念,鼓勵(lì)立法研究的多方參與、監(jiān)管手段的分級(jí)分類、行業(yè)治理的公私合作。
3. 鼓勵(lì)行業(yè)自治,共建發(fā)展生態(tài)
倡導(dǎo)在行業(yè)層面強(qiáng)化“倫理先行、自律自治”意識(shí),共同打造AIGC 良性發(fā)展生態(tài)。鼓勵(lì)相關(guān)行業(yè)聯(lián)盟、龍頭企業(yè)、研究機(jī)構(gòu)以及標(biāo)準(zhǔn)組織等發(fā)揮資源整合優(yōu)勢(shì),加強(qiáng)內(nèi)容識(shí)別、事實(shí)核查、問(wèn)題感知、違法打擊、輿情治理、版權(quán)保護(hù)等治理技術(shù)能力研究,圍繞AIGC 的合法合規(guī)應(yīng)用和健康有序發(fā)展聯(lián)合制定公約、標(biāo)準(zhǔn)、指南、準(zhǔn)則等行業(yè)制度規(guī)范,建立完善爭(zhēng)議解決、行業(yè)黑名單、危機(jī)應(yīng)對(duì)聯(lián)動(dòng)等行業(yè)自治機(jī)制,并積極開(kāi)展制度宣傳、標(biāo)準(zhǔn)推廣、測(cè)試評(píng)估、標(biāo)桿塑造等活動(dòng);特別是針對(duì)“算法偏見(jiàn)”“算法黑箱”帶來(lái)的數(shù)字內(nèi)容不公正、責(zé)任主體難界定等問(wèn)題,牽頭支持可解釋、可信賴的AIGC 技術(shù)框架、標(biāo)準(zhǔn)體系、評(píng)測(cè)機(jī)制等的研究和推廣。
4. 加強(qiáng)正向引導(dǎo),賦能數(shù)實(shí)融合
市場(chǎng)經(jīng)濟(jì)的逐利性推動(dòng)了AIGC 的迅猛發(fā)展,然而,行業(yè)的健康、可持續(xù)發(fā)展卻需要主管部門(mén)的正確引導(dǎo),通過(guò)政策引導(dǎo)充分釋放AIGC 的正面應(yīng)用價(jià)值,賦能數(shù)字經(jīng)濟(jì)與實(shí)體經(jīng)濟(jì)深度融合。具體來(lái)說(shuō),一方面,地方政府和主管部門(mén)可以依托本地資源稟賦,結(jié)合發(fā)展需求,通過(guò)規(guī)劃指引、財(cái)政補(bǔ)貼、試點(diǎn)示范、揭榜掛帥等方式,引導(dǎo)數(shù)字內(nèi)容產(chǎn)業(yè)發(fā)展,支持AIGC 技術(shù)賦能影視傳媒、社交娛樂(lè)以及電商零售等領(lǐng)域,推動(dòng)數(shù)字內(nèi)容產(chǎn)業(yè)跨界衍生,刺激信息消費(fèi);培育與AIGC 產(chǎn)業(yè)發(fā)展相匹配的內(nèi)容審核技術(shù)產(chǎn)品和服務(wù)體系。另一方面,加強(qiáng)引導(dǎo)數(shù)據(jù)整理、算力統(tǒng)籌、算法開(kāi)源等平臺(tái)和企業(yè)基礎(chǔ)能力的合規(guī)建設(shè),堅(jiān)持“以虛促實(shí)、以虛強(qiáng)實(shí)”基本導(dǎo)向,推動(dòng)AIGC 技術(shù)參與生產(chǎn)和生活方式重構(gòu)。例如,基于AIGC 技術(shù)提供逼真在線服務(wù)體驗(yàn),在商貿(mào)服務(wù)、社會(huì)服務(wù)、醫(yī)療教育服務(wù)等領(lǐng)域催生新業(yè)態(tài)。又如,探索以AIGC 技術(shù)為基礎(chǔ),對(duì)現(xiàn)實(shí)世界進(jìn)行人機(jī)交互更為自然、環(huán)境細(xì)節(jié)更為逼真的虛擬空間模擬仿真,推動(dòng)AIGC 賦能工業(yè)制造、城市規(guī)劃、科學(xué)研究、生產(chǎn)辦公等領(lǐng)域的效力提升和價(jià)值再造,從虛擬維度優(yōu)化物理世界發(fā)展。
(二)未來(lái)展望
1. 核心技術(shù)持續(xù)演進(jìn)
(1)從真實(shí)可控向多樣組合發(fā)展
當(dāng)前,AIGC 算法已經(jīng)可以產(chǎn)生高質(zhì)量的內(nèi)容,其模型在簡(jiǎn)單場(chǎng)景表現(xiàn)出能與人類媲美的能力,然而,針對(duì)復(fù)雜場(chǎng)景生成的內(nèi)容依然不夠深入、缺少細(xì)節(jié)。例如,目前AIGC 生成的人臉圖像或數(shù)字人頭像已經(jīng)可以做到真假難辨。相比之下,由于視頻數(shù)據(jù)的復(fù)雜性和特征的多樣性,AIGC 尚無(wú)法較好地完成視頻創(chuàng)作任務(wù)。同時(shí),單一模態(tài)的內(nèi)容生成無(wú)法滿足數(shù)字世界或元宇宙的需求??梢灶A(yù)見(jiàn),AIGC 技術(shù)未來(lái)的發(fā)展方向?qū)⑹峭ㄟ^(guò)不同個(gè)體間的交互進(jìn)行內(nèi)容生產(chǎn)。通過(guò)對(duì)整體的、多模態(tài)的復(fù)雜場(chǎng)景創(chuàng)作,AIGC 有望實(shí)現(xiàn)更多數(shù)智內(nèi)容,進(jìn)而反哺核心及關(guān)聯(lián)領(lǐng)域,促進(jìn)共同發(fā)展。
(2)從本地化集中式向大規(guī)模分布式發(fā)展
作為數(shù)字經(jīng)濟(jì)和實(shí)體經(jīng)濟(jì)深度融合的新模式,AIGC 通過(guò)人工智能技術(shù)產(chǎn)生可交互的創(chuàng)新型、高質(zhì)量數(shù)字內(nèi)容,當(dāng)前與未來(lái)一段時(shí)間,新一代人工智能技術(shù)的研究重點(diǎn)將轉(zhuǎn)向大規(guī)模分布式AIGC 交互算法。主要有以下兩方面的原因:一方面,AIGC 離不開(kāi)大規(guī)模分布式深度學(xué)習(xí)技術(shù)和多智能體強(qiáng)化學(xué)習(xí)技術(shù)。大規(guī)模分布式AIGC 能夠高效地管理和利用計(jì)算資源,將流程拆解,通過(guò)多設(shè)備分布式計(jì)算的方式,加快內(nèi)容生產(chǎn)流程,提高內(nèi)容生成效率和質(zhì)量。目前谷歌和微軟等人工智能頭部公司,已經(jīng)開(kāi)始布局下一代超大規(guī)模人工智能模型的分布式計(jì)算平臺(tái),以解決大模型訓(xùn)練面臨的算力緊缺、資源利用率低、模型制作效率低等難題。另一方面,大規(guī)模多智能體網(wǎng)絡(luò)在分布式計(jì)算的框架通過(guò)個(gè)體間的合作和競(jìng)爭(zhēng)可以完成單體無(wú)法完成的任務(wù)。AIGC 作為促進(jìn)數(shù)實(shí)深度融合乃至元宇宙的重要生產(chǎn)工具,需要模擬物理世界各類復(fù)雜網(wǎng)絡(luò)系統(tǒng),包括動(dòng)物群體、社交網(wǎng)絡(luò)、城市復(fù)雜體等。因此,深入探究大規(guī)模分布式多智能體算法,增強(qiáng)其拓展性、安全性、穩(wěn)定性、遷移性等,將是未來(lái)重點(diǎn)探索的方向之一。
2. 產(chǎn)品類型逐漸豐富
近年來(lái),隨著第四次科技革命的興起,AIGC 應(yīng)用成為數(shù)字經(jīng)濟(jì)的一個(gè)重要細(xì)分賽道。其中,數(shù)字人作為鏈接物理世界與虛擬世界的主要媒介,通過(guò)其特有的接近人類的思維以及其可交互的能力,能夠打破物理及時(shí)空的邊界。例如,用戶通過(guò)XR 技術(shù)和新一代智能終端設(shè)備,可以獲得豐富的沉浸式體驗(yàn)。而可以自主生成內(nèi)容的數(shù)字人或許可以成為構(gòu)建人機(jī)交融、數(shù)實(shí)深度融合的未來(lái)世界的最佳載體,同時(shí)也是未來(lái)人類構(gòu)建“自生成、自更新”的元宇宙新世界的必經(jīng)之路。隨著新一代人工智能技術(shù)的不斷發(fā)展、數(shù)字人開(kāi)發(fā)難度和成本的降低,具有自主內(nèi)容生成能力的“智慧化”數(shù)字人可以進(jìn)行無(wú)限的內(nèi)容創(chuàng)作,元宇宙將為人類提供自由創(chuàng)造的空間。同時(shí),基于AIGC 的元宇宙世界也無(wú)需依賴于自然宇宙的映射,而將脫離于現(xiàn)實(shí)世界自我生成、自我發(fā)展、自我更新。隨著通用生成式AI 技術(shù)的不斷演進(jìn),AIGC 模型不再僅僅生成文本、音頻、視頻等基本形態(tài)的作品,甚至可以創(chuàng)造具有情感感知和認(rèn)知能力的內(nèi)容。
3. 生態(tài)產(chǎn)業(yè)日益完善
隨著AIGC 的不斷迭代,以標(biāo)準(zhǔn)規(guī)范、技術(shù)研發(fā)、內(nèi)容創(chuàng)作、行業(yè)應(yīng)用、資產(chǎn)服務(wù)為核心的生態(tài)體系將日趨完善,賦能相關(guān)產(chǎn)業(yè)升級(jí)。標(biāo)準(zhǔn)規(guī)范為AIGC 生態(tài)構(gòu)建了從技術(shù)、內(nèi)容、應(yīng)用、服務(wù)到監(jiān)管的全過(guò)程一體化標(biāo)準(zhǔn)體系,促進(jìn)AIGC 在合理合規(guī)合法的框架下良性發(fā)展。同時(shí),在核心技術(shù)持續(xù)演進(jìn)和關(guān)鍵能力顯著增強(qiáng)的背景下,性能更強(qiáng)大、邏輯更智能的AI 算法將被應(yīng)用于AIGC,技術(shù)研發(fā)的不斷創(chuàng)新將強(qiáng)有力地推動(dòng)內(nèi)容創(chuàng)作,提高生成內(nèi)容質(zhì)量,使內(nèi)容更接近人類智力水平和審美標(biāo)準(zhǔn),同時(shí)應(yīng)用于各類行業(yè)各種場(chǎng)景。AIGC 的繁榮發(fā)展將促進(jìn)資產(chǎn)服務(wù)快速跟進(jìn),通過(guò)對(duì)生成內(nèi)容的合規(guī)評(píng)估、資產(chǎn)管理、產(chǎn)權(quán)保護(hù)、交易服務(wù)等構(gòu)成AIGC 的完整生態(tài)鏈,并進(jìn)行價(jià)值重塑,充分釋放其商業(yè)潛力。隨著5G、云計(jì)算、VR、AR 等前沿技術(shù)的快速發(fā)展和新一代智能終端設(shè)備的研發(fā)創(chuàng)新,完整的AIGC 生態(tài)鏈?zhǔn)俏磥?lái)釋放數(shù)據(jù)要素紅利、推動(dòng)傳統(tǒng)產(chǎn)業(yè)升級(jí)、促進(jìn)數(shù)字經(jīng)濟(jì)發(fā)展、構(gòu)建數(shù)實(shí)融合一體最重要的推動(dòng)力之一。
ChatGPT 自發(fā)布以來(lái),在許多實(shí)際應(yīng)用場(chǎng)景中發(fā)揮重要作用,將AIGC浪潮推到新的高度。本文對(duì)AIGC 進(jìn)行了廣泛的概述,首先介紹了其發(fā)展演進(jìn),并梳理了每個(gè)階段的關(guān)鍵痛點(diǎn)堵點(diǎn);隨后,本文分析了AIGC的產(chǎn)業(yè)機(jī)遇;最后,本文討論了AIGC及其應(yīng)用的未來(lái)挑戰(zhàn),并對(duì)其未來(lái)發(fā)展方向進(jìn)行展望。
產(chǎn)業(yè)經(jīng)濟(jì)評(píng)論2023年4期