摘要:人工智能給各行業(yè)都帶來巨大變革,現(xiàn)行法律制度也受到很多挑戰(zhàn)。“藝格敷詞”與“以文生圖”這兩個相反概念,展示了文字與圖像的復雜關系,生成式人工智能給“語圖關系”帶來了新的變化。本文認為,參照康德提出的“圖式”概念,按照合理使用的有關規(guī)定,如人工智能對于訓練素材的使用符合“轉換性使用”的具體要件,則應認定屬于合理使用。在堅持獨創(chuàng)性客觀標準的前提下,人工智能生成物有可能構成符合作品定義,具備獨創(chuàng)性要件,應當作為《著作權法》保護的作品。對人工智能生成物的使用如果發(fā)生侵權,使用者應承擔侵權責任。面對生成式人工智能的時代之問和已經(jīng)產(chǎn)生的經(jīng)濟利益,法律制度應當提供裁決和執(zhí)行的規(guī)則,而非討論該種經(jīng)濟利益是否應當?shù)玫椒傻某姓J。這是按照法經(jīng)濟學指引對現(xiàn)實需求的必要回應,也是邏輯周延的必然選擇。
關鍵詞:藝格敷詞;人工智能生成物;合理使用;獨創(chuàng)性
一、前言
作為一項劃時代的發(fā)明,人工智能給各行業(yè)都帶來巨大變革,調(diào)整社會關系的法律制度也受到很多挑戰(zhàn),讓人不禁憂慮,人工智能“不僅與已有法律秩序形成沖突,凸顯現(xiàn)存法律制度產(chǎn)品供給的缺陷,甚至會顛覆我們業(yè)已構成的法律認知”,最嚴重后果可能造成“法律規(guī)制失靈”“法律秩序失調(diào)”。此種憂慮在知識產(chǎn)權領域尤為突出,其中最受學界關注的是生成式人工智能相關問題,其一是輸入端,即模型訓練所用數(shù)據(jù)侵權問題;其二是輸出端,即人工智能生成內(nèi)容是否具備作品要件問題。
在理論和實踐層面,關于這兩方面問題的爭議不斷,海外已有多起涉及生成式人工智能的集體訴訟,主張人工智能公司在數(shù)據(jù)訓練中涉嫌侵犯版權、不當獲取和使用個人信息、生成侵權作品等。我國法院作出的“奧特曼”案及“AI文生圖”著作權侵權案判決分別從輸入和輸出兩端給出了審判結果?!皧W特曼”案中,法院認為,AI生成圖片保留了奧特曼形象的獨創(chuàng)性表達,侵害了復制權和改編權;“AI文生圖”著作權侵權案中,法院認為AI作為創(chuàng)作工具,使用者通過提示詞、參數(shù)調(diào)整具備“獨創(chuàng)性”要件,故而生成的圖片符合《著作權法》關于“作品”的定義。相關案件亦受到業(yè)界和學界廣泛關注和熱烈討論。
從宏觀政策層面審視,中國政法大學法治研究院等七家單位專家起草發(fā)布的《人工智能法(學者建議稿)》第二十三條、第三十六條規(guī)定了人工智能生成內(nèi)容的知識產(chǎn)權保護原則,肯定了以使用者作為主體,人工智能生成內(nèi)容可作為作品獲得著作權法保護;第二十四條規(guī)定了模型訓練數(shù)據(jù)的合理使用原則,允許不同目的或功能的訓練使用。歐盟議會近期通過的《人工智能法》“鑒于”部分規(guī)定:開發(fā)和訓練人工智能所使用受版權保護內(nèi)容都必須獲得相關權利人的授權,除非適用相關的版權例外和限制,并且還要公開所使用內(nèi)容的摘要,以便權利人檢視。本文擬從“以文生圖”生成式人工智能原理切人,以期解決輸入一輸出兩端的一些法律問題。
二、生成式人工智能技術原理的延伸思考
有業(yè)內(nèi)學者認為,如果人工智能生成物沒有在真實的人與人之間建立“對話”關系,該生成物就無法反映人的主體性,因而不具備獨創(chuàng)性,并建議獨創(chuàng)性判斷引入審美要素。此論合理與否暫且不論,至少反映出版權領域與藝術領域存在一定的共通。
(一)語圖關系的新發(fā)展
“藝格敷詞”為希臘語,是古希臘跨藝術研究領域術語,指詳細描述繪畫、雕塑或其他視覺藝術作品的一種文學手段?!耙晕纳鷪D”則正好是“藝格敷詞”的反面,即通過生成式人工智能將文字描述轉化為圖像、視頻(連續(xù)的圖像)。從藝術史的層面看,跨越古今的兩個相反概念,恰恰展示了文字與圖像的復雜關系——“后形式主義、圖像學和符號學,都將藝術的核心問題闡釋為‘語言與圖像,的問題”。人類藝術史上,對于語圖關系的討論就從未停歇,圖像是先于文字出現(xiàn)的,舊石器時代的先民用石塊在巖壁上刻畫自己的表達,信息通過巖畫這樣的介質(zhì)和表現(xiàn)形式流傳至今。語言文字出現(xiàn)后,占據(jù)了信息傳遞的主流。錄音、攝影技術出現(xiàn)后,圖像因其相比語言編碼更豐富具體,成為了重要的輔助傳播形式。
生成式人工智能給“語圖關系”帶來了新的變化,借助人工智能工具,通過設定提示詞,以語言文字這一媒介,將思想用圖像符號表達,普通人即使未經(jīng)繪畫訓練,也可以將自己的思想映入現(xiàn)實,這是語圖關系的新發(fā)展。人工智能專家的課題是通過深度學習技術實現(xiàn)文本特征動態(tài)地轉化成圖像特征,并在這個過程中通過提升圖像一文本語義一致性來彌補文本和圖像之間的語義鴻溝,最終目標是根據(jù)自然語言描述生成對應并具有足夠視覺細節(jié)的圖像,且在語義上與文本的描述保持一致。這一點與其說依靠算法,更多依靠的是標注。
(二)機器學習技術延伸分析
機器學習的核心是訓練數(shù)據(jù),訓練的材料庫圖片中,主要對圖片要素進行框選和標注,大量的標注與圖像一一對應,最終讓人工智能得以實現(xiàn)視覺與文本的特征對齊。如下圖所示:
聯(lián)系到當前“以文生圖”輸入端的核心問題,即生成式人工智能深度學習素材對受版權保護內(nèi)容是否構成侵權問題。前文已述,立法的可能走向是通過合理使用制度,特別是“轉換性使用”來達成權利人和人工智能之間的利益平衡?!稗D換性使用”源于美國《版權法》,是指“以不同目的或方式使用作品,并在原作品基礎上增加了新表達、新意義或新功能”。討論思想與表達二分法和合理使用制度,不得不談到安迪沃霍爾案。該案中,對于同一表達(照片)的不同解構,美國最高法院認為并未增加不同目的,未產(chǎn)生新的表達,從而改判該案。這種邏輯還是基于思想與表達二分法,即相同表達的不同解構屬于思想范疇,在藝術領域值得認可,但在法律特別是版權領域,仍然不得超越相同表達的保護范圍。安迪沃霍爾對藝術領域的沖擊來自他揭示了“藝術創(chuàng)作也不再是藝術家個人的創(chuàng)作技藝的實現(xiàn)過程而是集體生產(chǎn)線式機器操作與復制流程。同樣,藝術家也不再是天才的個人而是文化工業(yè)中的生產(chǎn)者之一?!睆倪@個意義上講,將安迪沃霍爾與生成式人工智能、將安迪沃霍爾案中的合理使用問題與數(shù)據(jù)訓練侵權問題結合討論,具有現(xiàn)實意義和啟示作用,下文將具體展開討論。
三、機器學習數(shù)據(jù)的侵權問題
(一)機器學習對訓練素材的使用方式
較為主流、智能較強的生成式人工智能,在機器學習階段使用訓練素材,使用方式和目的是通過標注將圖片各個要素進行語圖對應,其使用目的與原圖片并不相同,只是統(tǒng)計學意義上的使用和收集,并不會從訓練數(shù)據(jù)中復制受保護的表達并輸出。
根據(jù)Meta發(fā)布的論文,其開發(fā)的生成式人工智能Emu學習分為知識學習和質(zhì)量學習,知識學習階段,人工智能通過11億張圖像一文本訓練素材,預訓練了一個潛在擴散模型;質(zhì)量學習階段,通過過濾器過濾出高質(zhì)量照片,再聘請精通攝影原理的專業(yè)注釋人員,遵循構圖、照明、色彩、有效分辨率、焦點和故事性審美原則,篩選出高審美質(zhì)量的圖片,實現(xiàn)了語圖對齊外,還實現(xiàn)了美學對齊。訓練素材提供的只是要素性、概念性的圖文對齊統(tǒng)計信息,即形成以自然語言生成圖像的能力,而訓練素材標注過程,依靠的是人類的認知能力和知識體系,至于后續(xù)專業(yè)注釋人員的干預和篩選,從結果上大幅提高了生成圖片的視覺表現(xiàn)和語圖一致性表現(xiàn),這個過程也涵蓋了專業(yè)注釋人員的專業(yè)知識和審美水平。
語圖對齊并不是人工智能時代的特殊產(chǎn)物,貢布里希等傳統(tǒng)的藝術史家也認為圖畫應被“閱讀”,因為圖像并非自然的、不證自明的,而是依照必須加以破譯的視覺語言創(chuàng)造的。其本意并非強調(diào)文本重于圖像,而在于更充分地關注圖像的視覺本性。藝術研究領域的“后形式主義”,也已經(jīng)關注到圖像的視覺語言問題,這跟人工智能對于圖片的意涵標注后進行機器學習異曲同工。
(二)“圖式”概念的引入
康德在《純粹理性批判》中提出“圖式”概念,認為我們不能直接將純粹的、普遍的范疇一般地應用于感性的、具體的現(xiàn)象之上,需要兼具二者性質(zhì)的“圖式”來充當中介。他舉例稱,任何“狗”的形象或圖像只有根據(jù)“狗”這個概念的“圖式”才能得以對應,它們也只有與這個“圖式”相符才能被歸入此概念。因此圖式是概念規(guī)則的表象,它將概念與諸多對象聯(lián)結到一起。西文生圖人工智能模型訓練核心是語圖一致,在圖到文再到圖的兩次轉換中,知識學習階段類似“藝格敷詞”的過程,用文字描述訓練圖片中的各個要素,經(jīng)過大量的訓練讓文本與圖像趨于一致。用戶使用時是反向過程,根據(jù)給定文字生成對應的圖像。文生圖人工智能模型通過大量“狗”圖像的訓練,總結出“狗”這個概念的“圖式”,用戶發(fā)出生成“狗”圖像的指令后,按照“圖式”和用戶其他要求生成圖像。
(三)是否構成轉換性使用
從版權角度出發(fā),在這種基于標注一訓練一語圖對齊的情形下,即便訓練素材可能包含權利人作品,人工智能對于訓練素材的使用也并非作品意義上的使用,而是圖中各意向語義特征意義上的使用,使用目的和方式均與原作品不同,匯總海量訓練素材形成的統(tǒng)計信息集合,構建出人工智能數(shù)據(jù)庫中各個概念之“圖式”,使得人工智能具備生成圖片的能力,符合“轉換性使用”要e538f0af7048dcca28ed6a3d59b08fbd件,應屬于合理使用。
在前述藝術、技術、法學以及法哲學討論的基礎上,可以得出結論,在知識學習即“圖式”歸納階段,如果文生圖模型對于訓練素材的使用旨在實現(xiàn)要素提取構建“圖式”的功能,而非再現(xiàn)作品本身的文學藝術價值或實現(xiàn)其內(nèi)在的表意功能,則符合版權制度中轉換性使用的情形,屬于合理使用。對于訓練數(shù)據(jù)權利爭議案件,核心是要求公布算法和對于訓練素材的使用情況,以此判定是否屬于合理使用。
四、人工智能生成內(nèi)容的版權問題
遇到新的問題、新的挑戰(zhàn),例如討論人工智能生成內(nèi)容的版權問題,需要從版權制度的功能和定位出發(fā),回歸立法本意去考量如何因應。
(一)版權制度的功能定位
在版權制度產(chǎn)生之前,人類的璀璨文明白有其生長流傳的合理途徑,著作權法的功能定位,應當符合民事法律制度本意,我國版權制度是隨著市場經(jīng)濟、改革開放而誕生,版權制度亦是為了保護私有財產(chǎn)權促成交易、激發(fā)創(chuàng)作產(chǎn)生的一項創(chuàng)設性制度,故其功能應該表述為“分配基于智力創(chuàng)造成果形成的市場利益”。除該項功能外的其他功能均不應等同于立法本意和價值追求。近代版權是基于出版商保護需求產(chǎn)生,版權制度的真正功能是維系作品與資本的結合,后者屬+近代的產(chǎn)業(yè)結構。
從歷史的維度看,因政治體制和知識壟斷,古代只有少部分人方可著書立作,此所謂立言?,F(xiàn)如今,任何人都可以借助互聯(lián)網(wǎng)技術通過社交媒體留下自己的獨特表達,進入了“人人都是創(chuàng)作者的時代”。在AI技術的幫助下,公眾不用經(jīng)過長期的專業(yè)訓練,也能生成符合自己心中所想的圖片和視頻,促進了表達的多元化,這種情況下,創(chuàng)作欲望已經(jīng)得到了激勵。與此同時,如果生成一幅作品,將思想轉化為表達是簡單易行的事,那么也無侵害他人權利、復制剽竊他人作品的必要。發(fā)展至今的版權制度,還肩負了繁榮社會主義文化,滿足人民群眾日益增長的精神文化需求的責任。版權制度在面臨新技術、新客體是否應當納入保護范圍的時代之問時,應當采取包容審慎的態(tài)度,妥善應對。
(二)作品構成要件的客觀性
我國《著作權法》對于作品定義是“文學、藝術和科學領域內(nèi)具有獨創(chuàng)性并能以一定形式表現(xiàn)的智力成果”。《著作權法實施條例》第二條規(guī)定:“美術作品,是指繪畫、書法、雕塑等以線條、色彩或者其他方式構成的有審美意義的平面或者立體的造型藝術作品”。其中的“審美意義”要件僅出現(xiàn)在美術作品和建筑作品中,故對于美術作品,需具備的要件為:1.具有一定表現(xiàn)形式;2.具備獨創(chuàng)性;3.具備審美意義。從構成要件和理論淵源看,除了審美意義外,并不存在主體要件,即是否構成作品仍然屬于客觀判斷。例如德國攝影師鮑里斯·埃爾達森的一幅作品贏得了“2023年索尼世界攝影獎”創(chuàng)意類別優(yōu)勝獎。然而,獲獎攝影師卻公開表示,這幅作品其實是由人工智能生成的,并拒絕接受該獎項。該事例恰能說明,如果作者不予披露,無論憑借專業(yè)還是審美方面進行客觀審查,一般情況下難以分辨作品是否由人工智能生成。即便證明作品構成要件包含(或隱含)主體要件,前例足以證明該要件僅有宣示意義,缺乏實際操作意義,如過度強調(diào)主體問題,則可能會對于作品概念、獨創(chuàng)性概念的自洽帶來沖擊。故“獨創(chuàng)性是一種客觀概念,旨在保護作品本身所具有的創(chuàng)造力,而不是創(chuàng)造力的具體來源”。
獨創(chuàng)性是一個擬制概念,很難精準界定其含義,諸多學者都希望能夠抽象出一個既能體現(xiàn)法律色彩而又不失人文情懷的獨創(chuàng)性概念,但都未能“盡其全貌”。獨創(chuàng)性和創(chuàng)作,其區(qū)別在于“獨”,關于“獨”的解釋有“獨立創(chuàng)作”和“獨特表達”等不同解釋。世界知識產(chǎn)權組織認為“作品是作者自己的創(chuàng)作,完全不是或基本上不是從另一作品抄襲來的?!边@個定義對于解釋獨創(chuàng)性具有啟示意義,即非抄襲的個人創(chuàng)作成果為作品。人工智能的出現(xiàn),對于“獨創(chuàng)性”又有了新的挑戰(zhàn),用人工智能創(chuàng)作,是否屬于“獨立”創(chuàng)作,通過人工智能生成的內(nèi)容,是否是使用者的“獨特表達”。
在判例法中,每一個判例因事實部分不同,法官對獨創(chuàng)性概念的解釋也會有所不同,這種在概念解釋上的靈活性和不確定性是中國法律制度所不允許的。隨著科學技術尤其是數(shù)字化技術的發(fā)展,作品的種類不斷增加,每一種新作品種類的出現(xiàn)都會對版權保護提出新問題,迫使人們從版權保護的目的出發(fā)重新認識創(chuàng)作的本質(zhì),檢驗、調(diào)整獨創(chuàng)性標準,以適應新形勢下版權保護的需要。有司法工作者認為,應對更加具體的案例,應當將“智力投入”作為衡量所有作品獨創(chuàng)性的一般標準,即只要作者在作品中投入了智力勞動,就認為該作品具備獨創(chuàng)性。這種觀點有可取之處,并且可以從《著作權法實施條例》的規(guī)定找到依據(jù),《著作權法實施條例》第三條規(guī)定“著作權法所稱創(chuàng)作,是指直接產(chǎn)生文學、藝術和科學作品的智力活動?!?/p>
(三)人工智能生成物的權利問題
需要厘清的是,人工智能生成物是否能夠構成作品,和人工智能程序是否能成為作者是不同的法律問題,前者涉及作品的構成要件,后者涉及著作權法人本屬性和關于權利人的規(guī)定。法律可以拒絕賦予人工智能作者身份,但是對于生成物是否構成作品應當采用客觀標準。
文本空間與圖像空間之間存在較大的語義鴻溝,正如“藝格敷詞”之所以形成一種獨特的藝術概念,就是因為文本和圖像之間的鴻溝。那么作為“藝格敷詞”的反面,“以文生圖”的價值,就在于通過人機對話的往復,實現(xiàn)從文本到圖像的轉換。可以說人工智能極大地降低了藝術的門檻,進一步促進了文藝的民主化和平等化。
通過前文對生成式人工智能部分原理的描述,不難勾勒出人工智能生成物的產(chǎn)生過程。從圖片標注文本形成一致性,到通過算法生成圖片,再到模型質(zhì)量控制時的選擇、干預,生成的過程不是憑空而出的隨機造物,也不是難以理解的“點石成金”,而是基于人類認知水平、知識、審美、風格的綜合運算,人工智能本身的生成過程就充滿了人的智力活動。至于人工智能使用者,本身的文本描述就屬于其獨特表達,對于生成物的選擇、干預、修改,亦體現(xiàn)其自主取舍,均屬于智力活動。人工智能生成物是符合作品定義,具備獨創(chuàng)性要件的,應當作為《著作權法》保護的作品。
有學者認為,使用者無法控制人工智能生成過程,故對生成結果不具備支配性,不能視為其智力成果。但是否有脫離表達的思想,或沒有思想的表達呢?“形式不是普通的感覺對象或事物的直接屬性,而是人和物交融合一的產(chǎn)物,其中既包括現(xiàn)實性,又有藝術家的虛擬性?!辈煌磉_的關鍵,正在于虛擬性,而非現(xiàn)實性。實際上從作品一旦生成,其表達就已經(jīng)固定,但是其意涵還需要讀者、觀者的參與,對作品的理解也構成了作品解構的一個方面。著作權法并未拒絕無意識表達成為作品——例如使用顏料即興潑灑產(chǎn)生藝術品等,但對于安迪沃霍爾的波普藝術,是對現(xiàn)有作品的復制,只是更改顏色和印刷方式,雖然產(chǎn)生后現(xiàn)代結構新的藝術含義,但拒絕認為構成作品。著作權法考量的不是因為對于思想與表達一致性程度,或表達過程是否可控制,歸根結底是遵循思想表達二分法,核心是考察是否屬于獨特表達。
(四)人工智能生成物的權利主體問題
至于主體問題,互文理論認為,文本間的界限被打破之后,成為一個整體的話語的平臺,寫作不是所謂“創(chuàng)作”,而是詞語的重新分配和重構。巴爾特認為:“一切文本都是互文本;其他的文本以不同的程度在它身上是在場的,或多或少可以得到辨認?!被ノ睦碚搶ⅰ拔谋尽边M行生產(chǎn)資料式的解構,弱化了作者概念,而機器學習對海量素材的分析積累,正是將這種互文性踐行到極致的新模式,對于何為創(chuàng)作提出了新的哲學藝術思辨,最終的解答或許要經(jīng)過曠日持久的探討,但法律面對的時代之間亟待解答。
人工智能缺乏自主的創(chuàng)作動機,需要人下達指令或設定程序,故其不能也不應當成為作者。《著作權法實施條例》第三條第二款規(guī)定,“為他人創(chuàng)作進行組織工作,提供咨詢意見、物質(zhì)條件,或者進行其他輔助工作,均不視為創(chuàng)作。”人工智能最多視為物質(zhì)條件和輔助工作,不屬于創(chuàng)作行為,人工智能的純機器行為,也不屬于其“智力成果”。此外,人工智能需要大量的學習、應用、反饋,其營利模式和迭代升級并不依托于出版者體系,開發(fā)者缺乏成為作者的動機,也可以通過用戶協(xié)議即合同來解決人工智能生成物的作者署名問題。就目前而言,使用者作為作者符合法律和事實邏輯,亦不存在障礙。
(五)人工智能生成物的侵權問題
對于人工智能生成物侵害他人版權問題,如果不能確定權利人,誰來承擔侵權責任就會成為難題。前文認為人工智能標注性機器學習構成合理使用,生成物構成作品,人工智能使用者為作者的結論,符合權利義務一體的內(nèi)在邏輯,在討論人工智能生成物的侵權問題時更能體現(xiàn)出這種邏輯自洽帶來的體系價值。對于人工智能生成物侵權問題,如認定輸入端機器學習階段對訓練素材的使用不構成合理使用,則人工智能開發(fā)者需承擔相應侵權責任;如構成合理使用,技術提供者則無需承擔訓練開發(fā)階段的責任,僅需考慮生成物的直接侵權問題,鑒于使用者對生成物的決定性作用,人工智能本身的輔助屬性,生成物的產(chǎn)生是由使用者決定,該種情形下應當由使用者承擔侵權責任。
對于他人侵害人工智能生成物版權的情形,除遵循一般的版權侵權判定原則外,還應考慮人工智能生成作品的特殊性,注意以下兩個方面問題。一是使用者對風格、參數(shù)等生成環(huán)節(jié)不具權利。二是因相同人工智能模型的表達空間可能相對有限,是否構成侵權的實質(zhì)性近似判斷標準應當有一定的限制,使用者僅對其最終生成作品的選擇、干預部分享有權利。被訴侵權人如提出證據(jù)證明其系獨立使用人工智能生成而非直接復制,則應堅持較高的實質(zhì)性近似標準。
五、結語
知識產(chǎn)權在現(xiàn)代經(jīng)濟中愈發(fā)重要,尤其在網(wǎng)絡時代和人工智能時代,非實體性注定了知識產(chǎn)權制度是實現(xiàn)法治的重要工具.經(jīng)濟學家約拉姆·巴澤爾將產(chǎn)權定義為兩種權利“經(jīng)濟權利”和“法律權利”。經(jīng)濟權利是最終目標,而法律權利則是達到最終目標的手段和途徑。一般來說,法律權利會增強經(jīng)濟權利,但是法律權利不是經(jīng)濟權利存在的充分必要條件,法律權利的主要作用是第三方的裁決和執(zhí)行。新的權利對應于新的經(jīng)濟力量而產(chǎn)生。權利從財產(chǎn)獲益的能力意義上來說,很大程度上是一個經(jīng)濟價值,而不是法律概念的問題。面對生成式人工智能的時代之問,面對已經(jīng)產(chǎn)生的經(jīng)濟利益,法律制度應當提供裁決和執(zhí)行的規(guī)則,而非討論該種經(jīng)濟利益是否應當?shù)玫椒傻某姓J。這是按照法經(jīng)濟學指引對現(xiàn)實需求的必要回應,也是邏輯周延的必然選擇。
(作者系中國司法雜志社編輯)