摘要:隨著人工智能的迅猛發(fā)展,數(shù)字內(nèi)容的生產(chǎn)和傳播方式經(jīng)歷了深刻的變革。近幾年,數(shù)字內(nèi)容產(chǎn)業(yè)快速發(fā)展,如自然語言處理和語音識別技術支撐下的文本生成、文本分析,圖像識別技術和生成式對抗網(wǎng)絡幫助圖像的自動化生成,在社交媒體、游戲、虛擬現(xiàn)實等領域得到了廣泛的應用,這些技術使得自動寫作、圖像合成、音樂生成和視頻制作等更加高效和便捷。如今,人工智能助推數(shù)字產(chǎn)業(yè)的發(fā)展,逐步融入人們的生產(chǎn)生活中。文章首先闡述人工智能時代數(shù)字內(nèi)容相關發(fā)展的歷程,并介紹國家層面對數(shù)字文化產(chǎn)業(yè)的政策支持。其次分析當前人工智能生成內(nèi)容的三種不同分類形式,并對應著各自的主體特征:創(chuàng)新性和多樣性、多元主體協(xié)同參與、泛娛樂化和交互性,這些形式包括自動寫作、圖像合成和音樂生成。每種形式都具有獨特的技術特點和應用領域,給數(shù)字內(nèi)容產(chǎn)業(yè)帶來了新的發(fā)展機遇。最后對人工智能影響下的版權問題進行解剖分析,在應用人工智能技術生產(chǎn)數(shù)字內(nèi)容的同時,存在著底層算法、版權歸屬、知識產(chǎn)權等問題。為此,加強法律保護和技術監(jiān)管至關重要,以促進產(chǎn)業(yè)生態(tài)的可持續(xù)發(fā)展。只有通過法律、技術和合作的共同努力,才能實現(xiàn)數(shù)字內(nèi)容產(chǎn)業(yè)的良性發(fā)展和創(chuàng)新繁榮。
關鍵詞:人工智能;數(shù)字內(nèi)容;新聞傳播學;版權;文化數(shù)字化
中圖分類號:G206;D923.41 文獻標志碼:A 文章編號:1674-8883(2023)22-0069-04
2023年是人工智能發(fā)展的標志性一年。AIGC的廣泛運用在生產(chǎn)過程中也帶來了許多新的問題和挑戰(zhàn),在版權方面和數(shù)字內(nèi)容生產(chǎn)方式方面有很多問題亟待解決。本文旨在對人工智能影響下我國數(shù)字內(nèi)容生產(chǎn)及其版權問題進行深入的探討和分析,首先對人工智能時代數(shù)字內(nèi)容生產(chǎn)方式的變革和發(fā)展進行簡要的概述和分析,其次重點分析AIGC數(shù)字內(nèi)容生產(chǎn)過程中涉及的版權問題,同時也將探討人工智能對內(nèi)容創(chuàng)作和使用等方面的影響。
數(shù)字內(nèi)容是伴隨著互聯(lián)網(wǎng)和新興技術出現(xiàn)的,最初是由歐美國家提出的,即“digital content”,主要是以數(shù)字為載體,以內(nèi)容為核心[1]。近年來,AIGC的出現(xiàn)也加速了數(shù)字內(nèi)容的發(fā)展,使得數(shù)字內(nèi)容以更豐富多樣的形式展現(xiàn)在大眾面前。雖然目前學術界并未對數(shù)字內(nèi)容有一個明確的定義,但基本可以概括為幾個大方向:第一是作為數(shù)字介質儲存在線上的內(nèi)容;第二是通過數(shù)字技術生成的數(shù)字資產(chǎn),包括游戲、影視資料、文字等;第三是元宇宙形態(tài)的[2]無形商品。數(shù)字內(nèi)容的發(fā)展歷程可以追溯到計算機技術的出現(xiàn)和互聯(lián)網(wǎng)普及時期,從20世紀初期的電子化內(nèi)容開始,數(shù)字內(nèi)容逐步起步。本文主要討論第二、三種形式的數(shù)字內(nèi)容,重點討論人工智能時期數(shù)字生成內(nèi)容的發(fā)展。
(一)發(fā)展歷程
人工智能生成內(nèi)容經(jīng)歷了四個不同的發(fā)展階段[3]。20世紀50年代初步萌芽,當時研究人員開始嘗試用計算機來創(chuàng)作音樂,為早期的人工智能生成內(nèi)容奠定了相應的基礎。這個時期的人工智能算法并不具備很強的學習能力,大多依賴于預定好的規(guī)則和模型來執(zhí)行特定的任務,一般會進行簡單的音樂旋律或是文本、線條的生成。
隨著人工智能深度學習和技術強化,開始在數(shù)字領域取得了更大的突破。20世紀90年代開始,自然語言處理技術出現(xiàn),人工智能系統(tǒng)開始有能力理解和生成類似人類的文本,聊天機器人、語言模型和推薦系統(tǒng)開始出現(xiàn),能夠生成基于文本的內(nèi)容,如新聞文章、產(chǎn)品的個性化描述等。深度學習網(wǎng)絡在學習范式和網(wǎng)絡結構上的不斷迭代升級,提升了人工智能算法的學習能力,推動了AIGC技術的快速發(fā)展。后期在新型網(wǎng)絡的加持之下,開始生成更復雜的內(nèi)容。如在圖像生成方面,能夠生成高度逼真且有視覺吸引力的圖像;在視頻方面,已經(jīng)能夠合成逼真的動態(tài)超清視頻內(nèi)容,包括動畫、特效甚至整個場景。
在人工智能和數(shù)字內(nèi)容深度融合之后,開始尋求進一步的融合創(chuàng)新發(fā)展。人工智能技術逐漸被用于更多創(chuàng)作領域。如音樂生成、電影劇本的創(chuàng)作和藝術表演等。Google的Magenta以及OpenAI的MuseNet[4],這類項目為人工智能探索出了新的創(chuàng)造力。人工智能也在逐步與其他技術結合,如區(qū)塊鏈和物聯(lián)網(wǎng)的介入,推動數(shù)字內(nèi)容的創(chuàng)作、分發(fā)和消費方式發(fā)生巨大改變。
(二)政策引導
對于數(shù)字內(nèi)容,國家在多個方面進行了戰(zhàn)略部署,強調要推動科技賦能數(shù)字內(nèi)容產(chǎn)業(yè)發(fā)展。從目前的政策來看,我國高度重視和支持人工智能產(chǎn)業(yè)的發(fā)展。習近平總書記指出,“中國高度重視創(chuàng)新發(fā)展,把新一代人工智能作為推動科技跨越發(fā)展、產(chǎn)業(yè)優(yōu)化升級、生產(chǎn)力整體躍升的驅動力量,努力實現(xiàn)高質量發(fā)展”。我國要抓住人工智能發(fā)展的新機遇,制定人工智能新的里程目標。高質量發(fā)展數(shù)字產(chǎn)業(yè)是建設文化強國的必然路徑[5]。
2019年國務院發(fā)布的《關于完善促進消費體制機制進一步激發(fā)居民消費潛力的若干意見》中提到,要加快發(fā)展數(shù)字出版等新興數(shù)字內(nèi)容產(chǎn)業(yè),豐富數(shù)字內(nèi)容供給。隨著數(shù)字中國建設的不斷推進,國內(nèi)數(shù)字內(nèi)容產(chǎn)業(yè)規(guī)模不斷擴大,用戶數(shù)量持續(xù)上升,在社會經(jīng)濟發(fā)展中的重要性日益增長[6]。尤其在2020年新冠肺炎疫情防控期間,數(shù)字內(nèi)容產(chǎn)業(yè)為刺激居民消費、恢復經(jīng)濟增長提供了有力支撐。
2022年,中共中央辦公廳、國務院辦公廳印發(fā)了《“十四五”文化發(fā)展規(guī)劃》,人工智能數(shù)字內(nèi)容的重要性不斷凸顯?!兑?guī)劃》強調,要提升公共文化的數(shù)字水平,加快文化產(chǎn)業(yè)的數(shù)字化布局,并且推動科技賦能文化產(chǎn)業(yè)。同時還提出了一系列推動數(shù)字文化發(fā)展的重大專項,如國家文化大數(shù)據(jù)體系建設等[7]。
除此以外,政府還推動了跨部門協(xié)作,加強政策協(xié)同和資源整合。相關部門包括文化和旅游部、科技部、財政部、工信部等,通過合作促進數(shù)字生成內(nèi)容產(chǎn)業(yè)的發(fā)展,并提供協(xié)同支持。
到2025年,基本形成覆蓋重點領域和關鍵環(huán)節(jié)的文化和科技融合創(chuàng)新體系,實現(xiàn)文化和科技的深度融合。按照國家科技創(chuàng)新基地優(yōu)化整合總體部署,建成若干目標明確、重點突出、協(xié)同攻關的文化科技領域國家科技創(chuàng)新基地,建成100家左右特色鮮明、示范性強、管理規(guī)范、配套完善的國家文化和科技融合示范基地,200家左右擁有知名品牌、引領行業(yè)發(fā)展、競爭力強的文化和科技融合領軍企業(yè),使文化和科技融合成為文化高質量發(fā)展的重要引擎。
數(shù)字內(nèi)容和人工智能的結合,在很大程度上提高了相關行業(yè)的生產(chǎn)水平和效率。彭蘭教授提到:“智能化技術正在全面進入內(nèi)容行業(yè),并促使內(nèi)容生產(chǎn)、分發(fā)、消費等全面升級。”[8]傳統(tǒng)的互聯(lián)網(wǎng)模式下,內(nèi)容生產(chǎn)供不應求。PGC模式下的團隊需要投入大量的人力、財力資源甚至技術成本來生產(chǎn)內(nèi)容,且內(nèi)容難以滿足互聯(lián)網(wǎng)用戶的需求。而UGC的生產(chǎn)模式雖然模糊了生產(chǎn)者和消費者之間的界限,降低了內(nèi)容生產(chǎn)的準入門檻,但是生產(chǎn)出來的內(nèi)容參差不齊。AIGC的出現(xiàn),使得數(shù)字內(nèi)容開始高數(shù)量、高效率生產(chǎn),節(jié)省了人力資源和時間成本,同時也滿足了不同用戶的多樣化需求。
(一)數(shù)字內(nèi)容生產(chǎn)分類
根據(jù)生成內(nèi)容的不同,可以將數(shù)字內(nèi)容生產(chǎn)分為以下幾種不同的類型。
1. AI+文本
預訓練語言模型的出現(xiàn)增強了人工智能的語義理解能力和文本生成能力,這些能力為人工智能自動寫作提供了可能。AI寫作可以模仿人類寫作風格并連貫生成上下文,開始在各種劇本編寫工作和輔助工作中嶄頭露角。GPT-3[9]等語言模型可以生成跨不同體裁、風格和語氣且連貫上下文的文本。人工智能可以生成文章、故事、詩歌,甚至代碼片段,促進了新聞、體育、天氣預報和其他數(shù)據(jù)驅動領域的自動化內(nèi)容創(chuàng)建。第一財經(jīng)的“DT稿王”在一分鐘內(nèi)寫出了1680字[10],這種高速生成也提高了新聞報道的時效性。
2. AI+圖像
基于生成式對抗網(wǎng)絡(GAN)的技術,人工智能在圖像生成領域取得了顯著的進步。如今,AI能夠實現(xiàn)圖像生成、圖像識別、圖像修復等功能[11]。目前市面上的平臺例如Midjourney就是將算法和技術原理結合,通過口令生成超高分辨率的逼真圖像,同時還能夠實現(xiàn)各種風格的轉換。這類平臺可以幫助藝術家和設計師創(chuàng)造新的視覺風格、生成圖案或增強現(xiàn)有作品。另外在三維技術上已經(jīng)能夠渲染不同場所的全方位三維圖景[12],促進了虛擬現(xiàn)實和增強現(xiàn)實交互式和沉浸式體驗的創(chuàng)建。通過AI技術,用戶能夠更加真實地感受到虛擬場景中的各種細節(jié)。
3. AI+音樂
從20世紀初的電子音樂產(chǎn)生以來,到現(xiàn)在Open AI推出了創(chuàng)新性的音樂生成系統(tǒng)MuseNet,基于深度學習技術生成不同風格和情感的音樂作品。這些音樂作品能夠應用到新聞的背景音和電影配樂等。這些AI生成的音樂軟件,能夠以一種令人驚嘆的方式模仿和創(chuàng)新各種音樂風格,從古典到現(xiàn)代,甚至是跨地域風格。人工智能技術還能自動識別音樂的基本風格,如Apple Music就能夠利用算法來分析聽歌歷史、評分等,了解用戶的音樂偏好和喜好,為他們生成符合其口味的音樂作品,提供更加個性化的音樂體驗。
4. AI+視頻
影視及短視頻行業(yè)迅速發(fā)展,在這些視頻創(chuàng)作過程中,存在制作成本高、劇本生產(chǎn)速度慢等問題。AIGC技術首先能在劇本上提供相應的思路和幫助,其次能通過技術實現(xiàn)影片中高難度的場景制作、動作合成、音畫同步、人臉替換等工作。在2020年播出的《了不起的兒科醫(yī)生》中,由于人物需要進行AI人臉替換,通過人工智能減輕了工作量,減少了創(chuàng)作損失,另外還能將無法實拍出來的場景或是高成本的場景展現(xiàn)出來,給予觀眾美妙的虛實體驗。
(二)數(shù)字內(nèi)容主體特征
1.創(chuàng)新和多樣性
如上文提到的類似ChatGPT生成文本,人工智能時代的文本輸出顯然更富有多樣性。目前的寫作機器人已經(jīng)能夠根據(jù)不同的場景和需求生成不同的觀點和態(tài)度,也能夠模仿人類交流對話來形成全新的體驗。而以往的人工智能生成文本只是簡單地進行文本對應。
2.多元主體協(xié)同參與
從20世紀90年代發(fā)展至今,從傳統(tǒng)的電腦操作的Web1.0時代,到以手機移動端為入口的Web2.0時代,目前正在發(fā)展到突破物理界限的Web3.0的元宇宙時代,越來越方便和低門檻的操作打破了網(wǎng)絡內(nèi)容生產(chǎn)者和用戶之間的界限,用戶也參與到互聯(lián)網(wǎng)內(nèi)容的生產(chǎn)中去。元宇宙時代,人們自主操控自己的所見和所得。AI+圖像的發(fā)展,也讓沒有繪畫基礎或攝影基礎的人利用一些簡單的指令,在幾秒內(nèi)就能完成一幅攝影作品。
3.泛娛樂化、深度沉浸
虛擬現(xiàn)實(VR)和增強現(xiàn)實(AR)技術的進步,可以在數(shù)字環(huán)境中創(chuàng)造出逼真的感官體驗,這類技術可以運用于游戲、教育、旅游等領域。數(shù)字內(nèi)容還可以讓用戶選擇設計元素,在活動中選擇劇情、自主探索環(huán)境等。用戶主動參與數(shù)字體驗,增強數(shù)字內(nèi)容的沉浸感。
4.交互性
不同于傳統(tǒng)的數(shù)字內(nèi)容,人工智能時代的數(shù)字內(nèi)容主要凸顯其個性化和交互性特征。根據(jù)不同應用場景的需求,能夠為用戶提供不同的內(nèi)容。例如,目前在一些商場等地開設了智能鏡子交互系統(tǒng),通過人臉識別和自然語言處理等技術輸入人臉信息并為顧客提供個性化妝容建議,在節(jié)省人力的同時還能為顧客帶來與以往不同的體驗。
人工智能生成作品和版權始終密切相關。目前人工智能生成的數(shù)字內(nèi)容還處于初步發(fā)展階段,因此在版權方面還存在很多問題和風險,但是版權相關的法律是會隨著時代發(fā)展而改變的。目前我國已經(jīng)認識到人工智能技術對我國法律體系帶來的挑戰(zhàn)和機遇,雖然在知識產(chǎn)權法中沒有提及人工智能生成內(nèi)容的有關條例,但也為AIGC相關的版權問題提供了依據(jù)[13]。
一個AI作品的生成需要涉及多個方面的人群,不僅涉及使用并生成該作品的用戶,還有生成作品所涉及的數(shù)據(jù)庫信息,以及AI生成軟件的投資商和開發(fā)商。因此生成的人工智能內(nèi)容的版權處于一個十分模糊的狀態(tài)。
(一)版權問題
1.低獨創(chuàng)性
根據(jù)我國的著作權法第三條規(guī)定[14],受著作權法保護的作品內(nèi)容應具有獨創(chuàng)性、形式表現(xiàn)以及智力成果。著作權法通常是以人的利益為根本而創(chuàng)設的[15]。在傳統(tǒng)的著作權法律框架之下,原創(chuàng)性才是王道。而人工智能生成的作品雖然不具備人的情感,但也離不開人的算法創(chuàng)意和獨立自主創(chuàng)作的能力。在人工智能生成的作品中,多數(shù)是根據(jù)龐大的數(shù)據(jù)庫計算訓練得出的,這也不乏雜糅不同作者的風格、作品。在這種情況下,人工智能生成作品的版權問題就有待討論。
2.低人類參與性
由于著作權法中授予的版權屬于人類作者,但人工智能生成內(nèi)容出現(xiàn)時,這一界限便模糊了。人工智能數(shù)字內(nèi)容除了在生成之前需要人類的關鍵詞口令參與之外,其余部分多數(shù)是機器完成。在這樣的情況下,人工智能數(shù)字內(nèi)容便缺乏一定的被版權保護的條件。在“菲林訴訟百度一案”中,就因“是否人類作者”而引起爭議。雖然法院的結論是其有爭議的報告并不是軟件單獨生成的,但是法院認為自然人創(chuàng)作的作品才是獲得著作權保護的基本條件。因此,即使人工智能軟件生成的作品能夠和人類作品相類似或類比,但基于作者身份的概念,還是會存在著作權的相應問題。
3.版權歸屬不明晰
僅從人工智能生成圖片這一單一的角度出發(fā),在生成的過程中需要多方面的協(xié)同參與。不論是人工智能平臺的商業(yè)歸屬,或是生成前的口令下發(fā)者,以及人工智能數(shù)據(jù)庫的訓練學習內(nèi)容,這些主體加在一起使得人工智能生成內(nèi)容得以運行,因此在判定歸屬和認定版權時存在一定阻礙。在全球首例的大型AIGC侵權案件(Stable Diffusion案)中,學者們依舊認為把AIGC對數(shù)據(jù)庫的數(shù)據(jù)及相關內(nèi)容的使用是很難規(guī)劃入合理的使用范疇的。
根據(jù)以上情況,首先我國可以制定出可行的方案,對數(shù)字內(nèi)容和相應制作團隊進行保護,以此來順應全球人工智能生成內(nèi)容的發(fā)展趨勢。其次,應厘清在人工智能生成內(nèi)容整個流程中的責任主體,明確每個步驟的權利范圍,減少“灰色領域”。最后,針對人工智能相關的技術侵權問題,可以交由技術去解決。用技術去解決技術,應是未來發(fā)展的趨勢。
(二)未來挑戰(zhàn)
1.對內(nèi)容生產(chǎn)者的沖擊
AI數(shù)字生成內(nèi)容的底層邏輯是輸入龐大的數(shù)據(jù)庫進行模仿和學習,在不同的數(shù)據(jù)庫之間進行選擇和歸納,最后輸出人類口令規(guī)定出的內(nèi)容。在AIGC興起前,內(nèi)容創(chuàng)作者如攝影師、插畫師、設計師等職業(yè)是無可替代的存在。然而,AIGC目前可以生成逼真的圖像,包括風景、人像和物品等。尤其是在靜物拍攝方面,AIGC能夠生成高清的靜物圖像而無需人力和物力,因此品牌方可以用低成本生成大批量的圖片,壓縮攝影師的生存空間。
2.對于數(shù)字生態(tài)內(nèi)容的沖擊
AIGC的低門檻準入性和便捷性,在用戶進行數(shù)字內(nèi)容創(chuàng)作的同時也會伴隨著不良內(nèi)容的出現(xiàn)。流量至上的時代,不可避免會有故意傳播低質內(nèi)容或吸眼球內(nèi)容來博流量的用戶,降低了網(wǎng)民用戶的信任感,嚴重影響數(shù)字內(nèi)容的生態(tài)環(huán)境,對網(wǎng)絡社會造成負面影響。針對此類情況,應加強網(wǎng)民用戶的素質,學會辨別和拒絕低質內(nèi)容,理性對待網(wǎng)絡信息。
3.創(chuàng)意和創(chuàng)意過程的沖擊
AIGC的低門檻,讓人們對人工智能有了一定依賴。無論是普通人、學生,還是藝術家,都開始嘗試用人工智能作為自己的創(chuàng)作工具。曾經(jīng)的一幅畫需要一定的繪畫技巧、攝影技巧、審美及時間來完成,而如今這樣的現(xiàn)象顛覆了傳統(tǒng)的思維方式和創(chuàng)作過程,導致思維模式缺乏個性化的特征,或是降低靈感。
科技時代的到來也意味著人類文明邁入了一個新的階段,人工智能的出現(xiàn)改變了文化生產(chǎn)及消費的各種行為。人工智能在為人們提供新的文化內(nèi)容、加速社會文化創(chuàng)造力的同時,也面臨著諸多新的挑戰(zhàn),如版權問題、壓縮藝術工作者生存空間等。盡管未來人工智能生產(chǎn)內(nèi)容和版權法律環(huán)境會不斷演變,仍可以對未來發(fā)展保持信心。隨著人工智能的不斷變革,我國乃至全球將制定相應的規(guī)則和策略,實現(xiàn)人類生活與人工智能的融合,確保人工智能服務于人類和社會。
[1] 張立,吳素平,周丹.國內(nèi)外數(shù)字內(nèi)容產(chǎn)業(yè)概念追蹤與辨析[J].出版發(fā)行研究,2021(4):43-47.
[2] 鄭世林,陳志輝,王祥樹.從互聯(lián)網(wǎng)到元宇宙:產(chǎn)業(yè)發(fā)展機遇、挑戰(zhàn)與政策建議[J].產(chǎn)業(yè)經(jīng)濟評論,2022(6):105-118.
[3] 蔡子凡,蔚海燕.人工智能生成內(nèi)容(AIGC)的演進歷程及其圖書館智慧服務應用場景[J].圖書館雜志,2023,42(4):34-43,135-136.
[4] 阿比拉什·保爾.音樂生成技術研究[J].國際創(chuàng)新技術與探索工程雜志,2020,9(6):29-34.
[5] 中共中央宣傳部.習近平總書記系列重要講話讀本[M].北京:人民出版社,2016:203.
[6] 中共中央 國務院關于完善促進消費體制機制進一步激發(fā)居民消費潛力的若干意見[J].中華人民共和國國務院公報,2018(28):16-22.
[7] 中共中央辦公廳 國務院辦公廳印發(fā)《“十四五”文化發(fā)展規(guī)劃》[J].中華人民共和國國務院公報,2022(24):4-22.
[8] 彭蘭.智能時代的新內(nèi)容革命[J].國際新聞界,2018,40(6):88-109.
[9] 張爾坤,張一瀟. Chat GPT啟示:大語言模型時代傳播學研究新問題[J].國際新聞界,2023,45(6):167-176.
[10] 丁瓊.人工智能背景下機器人新聞寫作的應用與反思[J].聲屏世界,2021(2):30-31.
[11] 張建明,高黎娟.基于AI深度學習的超分辨率重建技術在圖像檔案修復中的應用研究[J].中國檔案,2022(11):36-37.
[12] 易舸,張銣鈁.淺談電影中應用的計算機3D技術[J].家庭生活指南,2019(1):93.
[13] 吳漢東.人工智能生成作品的著作權法之問[J].中外法學,2020,32(3):653-673.
[14] 黃薇,王雷鳴.《中華人民共和國著作權法》導讀與釋義[M].北京:中國民主法制出版社,2020:10-35.
[15] 侯利陽,李兆軒. ChatGPT學術性使用中的法律挑戰(zhàn)與制度因應[J].東北師大學報(哲學社會科學版),2023(4):29-39.
作者簡介 劉詩穎,研究方向:新聞傳播理論。