徐麗芳 何倩
摘 要:人工智能在自然語言理解和生成上不斷取得突破,在出版領(lǐng)域的應(yīng)用也隨之逐漸深入?;谶@些人工智能技術(shù)的Authors A.I.能夠自動(dòng)閱讀和評(píng)價(jià)小說作品,甚至提出改進(jìn)意見,因此實(shí)際上可視為作者的自編輯平臺(tái),或者出版企業(yè)的編輯輔助平臺(tái)。本文介紹其從一本書到一家公司的創(chuàng)立過程,以及支撐該平臺(tái)運(yùn)行的自然語言和技術(shù)原理;闡述了其所提供的AI分析報(bào)告,特別是敘事原型和情節(jié)轉(zhuǎn)折、敘事節(jié)拍和敘事進(jìn)程、主要人物性格和主題分析以及情緒色輪等要素的可視化分析;最后指出人工智能的發(fā)展為出版業(yè)提供了很好的機(jī)遇,基于AI,出版價(jià)值鏈有望在各方面得到改進(jìn)。
關(guān)鍵詞:人工智能 Authors A.I. 暢銷書 數(shù)字出版 自編輯
人工智能正在顛覆金融、醫(yī)療、交通等各個(gè)行業(yè),出版業(yè)也不例外:市場(chǎng)營銷部門可以使用新工具來為更廣泛的受眾制作個(gè)性化廣告,編輯部門可以通過大數(shù)據(jù)和智能分析輔助選題策劃和校對(duì)工作,機(jī)器自動(dòng)化寫作在新聞?lì)I(lǐng)域也已經(jīng)實(shí)踐多年。小說創(chuàng)作似乎最不可能受到人工智能的影響,畢竟它具有復(fù)雜的敘事線和情感表現(xiàn),似乎難以量化成計(jì)算機(jī)可處理的數(shù)據(jù)。迄今為止,雖然已有許多用人工智能創(chuàng)作小說的實(shí)驗(yàn),但幾乎都以失敗告終,因?yàn)槿斯ぶ悄苌傻奈谋救源嬖谠S多不合邏輯的內(nèi)容,或文本雖符合邏輯卻缺乏可讀性和內(nèi)在意義??萍汲鮿?chuàng)公司智能作家(Authors A.I.)于是轉(zhuǎn)變視角,不再執(zhí)著于利用人工智能生成文本,而是將人工智能的洞察力與人類的創(chuàng)造力結(jié)合起來,利用暢銷書數(shù)據(jù)對(duì)小說書稿內(nèi)容進(jìn)行分析并給出建議,以幫助作家寫出能登上暢銷書排行榜的書。
一、Authors A.I.概況
2016年,美國圣馬丁出版社(St. Martin Press)出版了《暢銷書密碼:大熱門小說解剖學(xué)》(The Bestseller Code:Anatomy of the Blockbuster Novel)一書。該書作者喬迪·阿徹(Jodie Archer)和馬修·L.約克斯(Matthew L. Jockers)耗時(shí)五年用文本挖掘算法對(duì)2萬多部《紐約時(shí)報(bào)》暢銷小說進(jìn)行數(shù)據(jù)分析,試圖揭示出暢銷書在內(nèi)容上的共同特征。[1]兩位作者在斯坦福大學(xué)相識(shí),分別擁有出版行業(yè)背景和數(shù)字人文學(xué)術(shù)背景。他們?cè)谒哪甑臅r(shí)間里構(gòu)建并完善了算法,聲稱其能以80%的準(zhǔn)確率推斷出一份沒有標(biāo)記的手稿是否登上了《紐約時(shí)報(bào)》暢銷書排行榜。[2]
作為將機(jī)器學(xué)習(xí)原理和文本挖掘技術(shù)應(yīng)用于長(zhǎng)篇小說分析的世界領(lǐng)先的專家之一,約克斯并不是用人工智能算法去自動(dòng)生成小說,而是將其作為分析人類創(chuàng)作的小說作品的有力工具。2019年6月,他和作家約瑟夫·丹尼爾·拉西卡(Joseph Daniel Lasica)開始致力于為圖書愛好者創(chuàng)建新的社交中心,并為小說家們提供一套新工具。Authors A.I.公司由此成立。拉西卡是驚悚小說作家,同時(shí)也是新聞工作者。他對(duì)約克斯與喬迪·阿徹合著的《暢銷書密碼》非常感興趣;而約克斯希望與一群才華橫溢的作家合作,對(duì)其人工智能算法進(jìn)行實(shí)測(cè)和改進(jìn)。兩人一拍即合。隨后,暢銷言情小說家亞歷山德拉·托雷(Alessandra Torre)作為第三位創(chuàng)始人加入。在短短幾個(gè)月內(nèi),Authors A.I.組建了一個(gè)由120多位暢銷書作者和專家顧問組成的團(tuán)隊(duì)來改進(jìn)和擴(kuò)展約克斯的原始算法。同時(shí),他們不再只專注于《紐約時(shí)報(bào)》暢銷書排行榜,而是在各種流行小說排行榜中廣泛地尋找成功案例,不斷優(yōu)化算法以使其適于分析流行小說市場(chǎng)[3]。
2020年1月,Authors A.I.公司用其小說分析算法創(chuàng)造出名為Marlowe的小說智能機(jī)器人,并進(jìn)入封閉測(cè)試階段。6月,Authors A.I.正式推出官方網(wǎng)站authors.ai;Marlowe 1.0正式發(fā)布。Marlowe是一個(gè)集讀者測(cè)試、策劃編輯和文字編輯等功能和角色于一身的精通小說藝術(shù)和技巧的智能機(jī)器人,可以在15分鐘內(nèi)閱讀一本小說,并對(duì)其做出評(píng)價(jià)。評(píng)價(jià)工作主要基于該小說與數(shù)據(jù)庫中數(shù)萬本暢銷小說的比較。評(píng)價(jià)內(nèi)容包括主題分析、敘事原型與情節(jié)結(jié)構(gòu)分析、高低潮分析、主要人物性格特征、潛在冒犯性語言、句子統(tǒng)計(jì)和可讀性分?jǐn)?shù)、對(duì)話和敘述比率、動(dòng)詞選擇和被動(dòng)語態(tài)使用、可能的拼寫錯(cuò)誤、標(biāo)點(diǎn)數(shù)據(jù)等。作者可以根據(jù)Marlowe給出的分析報(bào)告對(duì)作品進(jìn)行修改,在送呈專業(yè)編輯審查之前完善自己的手稿。次年6月,Authors A.I.發(fā)布Marlowe 2.0。這次升級(jí)增加了一些新功能,可將手稿與4本具有相似情節(jié)線索或?qū)懽黠L(fēng)格的暢銷書進(jìn)行比較,從而給作者提供更加精準(zhǔn)的寫作建議。除此之外,還增加了故事節(jié)奏、情感色彩和語言使用頻率分析等功能。[4]
Authors A.I.目前提供3個(gè)版本的產(chǎn)品和服務(wù),分別為基礎(chǔ)版、會(huì)員版和一次性支付版?;A(chǔ)版為免費(fèi)服務(wù),用戶不需要支付費(fèi)用就可以無限制地獲得基礎(chǔ)分析報(bào)告。該報(bào)告內(nèi)容比較簡(jiǎn)單,主要為單詞和短語重復(fù)性識(shí)別、語法分析等。會(huì)員版又分為2類:按月訂購為每月29.95美元,按年訂購為每年199美元。會(huì)員用戶每個(gè)月可以獲取2份會(huì)員版分析報(bào)告,以及無限制地獲得基礎(chǔ)分析報(bào)告。此外,用戶也可以選擇在不加入會(huì)員的情況下購買一次性報(bào)告,價(jià)格為每份89美元。會(huì)員版分析報(bào)告和一次性報(bào)告比基礎(chǔ)版報(bào)告多9項(xiàng)內(nèi)容,包括主題、情節(jié)、人物性格等作品分析的核心內(nèi)容。Authors A.I.還為會(huì)員作者提供額外的社區(qū)服務(wù),包括加入作者臉書群組、參加網(wǎng)絡(luò)研討會(huì)和特別活動(dòng)、獲得BingeBooks網(wǎng)站的營銷機(jī)會(huì)等。BingeBooks是Authors A. I.旗下一個(gè)由作者和書籍愛好者創(chuàng)建的在線社區(qū)。它推薦各種類型的書籍,旨在為用戶提供發(fā)現(xiàn)新書和新作者的渠道。除了為個(gè)體用戶服務(wù),Authors A.I.還為出版機(jī)構(gòu)提供行業(yè)通行證。有了行業(yè)通行證,出版商、編輯、學(xué)術(shù)機(jī)構(gòu)和教育機(jī)構(gòu)每季度可以生成多達(dá)25份AI分析報(bào)告。
二、工作原理:從文本到模式
人工智能(Artificial Intelligence, AI)是一個(gè)寬泛的術(shù)語,涵蓋了多種技術(shù)。這些技術(shù)使計(jì)算機(jī)能夠感知、理解、行動(dòng)和學(xué)習(xí)。目前,人工智能在出版業(yè)的所有應(yīng)用都涉及機(jī)器學(xué)習(xí)(Machine Learning,ML)或深度學(xué)習(xí)(Deep Learning,DL)——要么單獨(dú)使用,要么與自然語言處理(Natural Language Processing, NLP)、文本數(shù)據(jù)挖掘(Text Data Mining,TDM)、語音識(shí)別或計(jì)算機(jī)視覺等其他技術(shù)結(jié)合使用。Marlowe的技術(shù)基礎(chǔ)為自然語言處理和深度學(xué)習(xí),兩者在相關(guān)過程中是相互依賴、相互滲透的。
自然語言處理包括自然語言理解(Natural Language Understanding,NLU)和自然語言生成(Natural Language Generation,ULG)兩部分。Marlowe比較側(cè)重NLU功能。其實(shí)質(zhì)是對(duì)人類閱讀的模仿。機(jī)器無法像人類一樣理解所閱讀內(nèi)容的意義,只能將人類認(rèn)為有意義的單位——字母、單詞、句子、標(biāo)點(diǎn)符號(hào)和章節(jié)當(dāng)成二進(jìn)制符號(hào)輸入計(jì)算機(jī)。自然語言處理中最基本的任務(wù)是分詞、句子識(shí)別、詞性標(biāo)注(Part-Of-Speech tagging,POS tagging)和依存句法分析(Dependency Syntactic Parsing)。分詞和句子識(shí)別看似簡(jiǎn)單,但其實(shí)有許多困難的情況需要解決,如英文縮略語會(huì)用到下腳點(diǎn),而機(jī)器可能會(huì)把這個(gè)標(biāo)點(diǎn)當(dāng)作句號(hào);一些英文復(fù)合名詞有時(shí)會(huì)由空格隔開,機(jī)器可能把它當(dāng)成兩個(gè)詞;而中文詞匯不像英文單詞由空格隔開,機(jī)器分詞也就更為復(fù)雜。在分詞和句子識(shí)別完成后,就可以計(jì)算每個(gè)詞出現(xiàn)的頻率、平均句子長(zhǎng)度以及對(duì)話句與純敘述句的比例。詞性標(biāo)注是分詞的下一步,其中名詞識(shí)別是小說主題識(shí)別算法建模的前提條件。完成部分詞性標(biāo)記后,就可以總結(jié)不同作者使用的名詞、動(dòng)詞和形容詞的類型及頻率,確定特定作者寫作的典型模式。由于人類語言的復(fù)雜性,很難編寫一個(gè)程序處理所有情況,因此許多自然語言處理和文本挖掘研究工作已經(jīng)從基于語法規(guī)則的句法分析轉(zhuǎn)向基于統(tǒng)計(jì)推理的方法。這種方法不再編寫一大堆規(guī)則去處理所有可能的語言書寫方式,而是從統(tǒng)計(jì)學(xué)視角讓機(jī)器學(xué)習(xí)不同句子結(jié)構(gòu)和單詞組合出現(xiàn)的概率。[5]依存句法分析被用來識(shí)別句子中詞匯與詞匯之間的相互依存關(guān)系,找出哪些單詞一起構(gòu)成短語,哪些單詞構(gòu)成句子中的主語、賓語和動(dòng)詞,然后通過角色的動(dòng)作可以分析其性格特征。文本情感分析(Text Sentiment Analysis)目前在商業(yè)領(lǐng)域應(yīng)用廣泛,在Marlowe中則被用來繪制故事的情節(jié)線索。機(jī)器會(huì)識(shí)別每個(gè)句子的情感傾向,而肯定句或否定句的出現(xiàn)頻率可以揭示主人公的命運(yùn)以及情節(jié)走向。自然語言處理完成文本的初步處理,為下一步深度學(xué)習(xí)提供基礎(chǔ)數(shù)據(jù)。
對(duì)于Marlowe來說,深度學(xué)習(xí)就是對(duì)輸入計(jì)算機(jī)的成千上萬本暢銷書內(nèi)容進(jìn)行分析,發(fā)現(xiàn)和提取關(guān)于每本書的詳細(xì)信息及特征,識(shí)別這些故事的相似之處,總結(jié)其寫作模式,包括主題、故事節(jié)奏、情感起伏、角色特征和故事結(jié)構(gòu)等,以及一些語言統(tǒng)計(jì)數(shù)據(jù)。該過程在機(jī)器學(xué)習(xí)領(lǐng)域被稱為模式識(shí)別(Pattern Recognition)。它指“基于已經(jīng)獲得的知識(shí)或從模式和它們的表示中提取的統(tǒng)計(jì)信息對(duì)數(shù)據(jù)進(jìn)行分類”[6],核心是計(jì)算機(jī)算法理解所“看”到的東西,對(duì)事物進(jìn)行分組,并最終識(shí)別出模式。對(duì)Marlowe而言,就是篩選在文本挖掘階段挖掘出的特征,確定哪些特征會(huì)影響一本書成為暢銷書。識(shí)別過程需要經(jīng)過反復(fù)多次訓(xùn)練,也就是機(jī)器學(xué)習(xí)的過程;輸入數(shù)據(jù)越多,訓(xùn)練時(shí)間越長(zhǎng),Marlowe的信息識(shí)別和處理能力就越強(qiáng)。當(dāng)用戶上傳作品后,Marlowe會(huì)提取該書的文本特征,并與數(shù)據(jù)庫中的暢銷書特征數(shù)據(jù)進(jìn)行比對(duì),通過比對(duì)結(jié)果給出詳細(xì)的圖表分析,并根據(jù)分析數(shù)據(jù)給出相應(yīng)的修改建議,然后將完整報(bào)告通過電子郵件發(fā)送給作者。
三、AI報(bào)告:小說特征可視化
Authors A.I.提供的最終產(chǎn)品為一份人工智能分析報(bào)告。Marlowe要求作者提交的手稿長(zhǎng)度不少于2萬字,且文件格式要求為MS Word(.doc,.docx)或純文本(.txt)。最后生成的報(bào)告是可視化的,每個(gè)特征對(duì)比都以圖表形式展現(xiàn)。下面以其官網(wǎng)提供的案例《達(dá)·芬奇密碼》(The Da Vinci Code)為例,介紹報(bào)告的主要內(nèi)容。[7]
(一)敘事原型和情節(jié)轉(zhuǎn)折
敘事原型的概念最早由德國學(xué)者古斯塔夫·弗賴塔格(Gustav Freytag)于19世紀(jì)提出,其提出的金字塔敘事原型包括開場(chǎng)(Exposition)、上升(Rising action)、高潮(Climax)、回落(Falling action)和解決(Resolution)五個(gè)部分。[8]Marlowe對(duì)語料庫中的流行小說內(nèi)容進(jìn)行分析后,歸納得出了七種敘事原型。以《達(dá)·芬奇密碼》為例,智能報(bào)告將其敘事脈絡(luò)進(jìn)行了可視化處理,并將之與最相似的敘事原型進(jìn)行對(duì)比(見圖1)。圖中水平虛線表示平穩(wěn)狀態(tài),線條向上表示故事向積極方向發(fā)展,線條向下則表示事態(tài)惡化。通過對(duì)比圖,可以清晰地看到該書與名為“緊急情況”(Emergence)的故事原型最為吻合。該故事原型通常遵循從消極開端到積極結(jié)果的路徑。[9]敘事原型從宏觀角度進(jìn)行對(duì)比,情節(jié)轉(zhuǎn)折則涉及更多細(xì)節(jié)。情節(jié)轉(zhuǎn)折的可視化報(bào)告也包含與最接近的一本暢銷書進(jìn)行的對(duì)比(見圖2)。與《達(dá)·芬奇密碼》情節(jié)轉(zhuǎn)折最相似的是托馬斯·麥圭恩(Thomas McGuane)的《陰暗處的九十二》(Ninety-Two in the Shade)。
(二)敘事節(jié)拍和敘事進(jìn)程
在戲劇創(chuàng)作中,故事通??煞譃槲鍌€(gè)結(jié)構(gòu)層次:節(jié)拍(Beat)、場(chǎng)景(Scene)、序列(Sequence)、幕(Act)和故事(Story)。敘事節(jié)拍是故事的最小單元,指角色動(dòng)作與其引起的反應(yīng)之間的行為交流瞬間。這些瞬間往往伴隨場(chǎng)景中的情緒或關(guān)系變化,使故事發(fā)生轉(zhuǎn)折。[10]《暢銷書密碼》指出:暢銷書大都具備穩(wěn)定的敘事節(jié)奏,故事轉(zhuǎn)折點(diǎn)之間的間隔通常是均勻的。[11]《達(dá)·芬奇密碼》敘事轉(zhuǎn)折點(diǎn)之間的篇幅間隔約為10%,其中,向下轉(zhuǎn)折意味著沖突的發(fā)生,向上轉(zhuǎn)折表示沖突得以解決(見圖3)。此外,報(bào)告還提供了敘事進(jìn)程圖(見圖4)。它模擬讀者跟隨作者敘事時(shí)的閱讀體驗(yàn):高峰區(qū)代表敘事推進(jìn)快、讀者緊緊跟隨,低谷區(qū)代表敘事節(jié)奏慢,讀者翻頁也隨之慢下來。良好的敘事節(jié)奏可以持續(xù)吸引讀者閱讀,持續(xù)的快節(jié)奏或慢節(jié)奏敘事則都會(huì)引起讀者的疲勞。從圖4可以看出,《達(dá)·芬奇密碼》的敘事進(jìn)程快慢有致、起伏均勻。這樣的節(jié)奏顯然更符合大多數(shù)讀者的閱讀偏好。
(三)主要人物性格、主題分析和情緒色輪
性格分析由Marlowe基于人物動(dòng)作和行為得出。Marlowe分析了《達(dá)·芬奇密碼》中蘭登(Langdon)、賽拉斯(Silas)、索菲(Sophie)和提賓(Teabing)四個(gè)主要人物的主要性格特征,包括“招人喜歡”“自信”“快樂”“勤奮”“思維敏捷”“現(xiàn)實(shí)”“被動(dòng)”“敏感”等指標(biāo)。主題分析圖則列出小說十個(gè)重要主題及各自所占百分比,同時(shí)標(biāo)注語料庫中所收錄暢銷書使用這些主題的數(shù)量?!哆_(dá)·芬奇密碼》的重要主題依次為宗教、藝術(shù)、恐怖主義和夢(mèng)想等,它們?cè)谠摃兄黝}中約占30%。心理學(xué)家羅伯特·普魯契克(Robert Plutchik)曾提出情緒之輪(Wheel of Emotions)模型,其中包含八種基本情緒:憤怒、期待、厭惡、恐懼、喜悅、悲傷、驚訝和信任。就像顏色一樣,原始情緒可以用不同的強(qiáng)度表達(dá),并可以相互混合形成新的情緒,如期待和喜悅結(jié)合起來就是樂觀。[12]Marlowe據(jù)此提供了八種主要情緒的分布評(píng)估。在《達(dá)·芬奇密碼》中,主要傳達(dá)的情緒是喜悅、信任、恐懼和驚訝。此外,報(bào)告還包括對(duì)話和敘事比例、冒犯性語言和不良內(nèi)容數(shù)量、陳詞濫調(diào)、重復(fù)性短語、句子統(tǒng)計(jì)和可讀性得分、詞性統(tǒng)計(jì)、標(biāo)點(diǎn)符號(hào)統(tǒng)計(jì)等內(nèi)容,以及主題和語言風(fēng)格與此書相似的四本書的對(duì)比。
四、智能編輯:人工智能改變出版業(yè)
目前人工智能已被廣泛用于整個(gè)出版產(chǎn)業(yè)鏈,滲入內(nèi)容獲取、內(nèi)容生產(chǎn)、產(chǎn)品營銷、客戶服務(wù)等諸環(huán)節(jié)。常見的應(yīng)用領(lǐng)域如內(nèi)容識(shí)別和文本標(biāo)記,機(jī)器可以自動(dòng)生成任意長(zhǎng)度的元數(shù)據(jù)標(biāo)簽來標(biāo)記書籍及其簡(jiǎn)介。這些標(biāo)簽與推薦引擎一起可以提高內(nèi)容的可發(fā)現(xiàn)性。同時(shí)還包括使用人工智能識(shí)別市場(chǎng)趨勢(shì)、輔助翻譯和支持推薦平臺(tái)等。國際電子書和有聲讀物分銷平臺(tái)書線(Bookwire)使用人工智能工具分析出版物在各個(gè)歷史數(shù)據(jù)點(diǎn)的價(jià)格,并追蹤每本圖書的銷售表現(xiàn),然后可在任何給定時(shí)間提出有關(guān)定價(jià)的建議。它還根據(jù)標(biāo)題相似性和用戶偏好自動(dòng)將推薦廣告集成到電子書中。該技術(shù)推動(dòng)了Bookwire銷售額的顯著提升。[13]眾所周知,將已出版作品翻譯成不同語言可以擴(kuò)大作品的受眾范圍。目前許多翻譯服務(wù)提供商開始向細(xì)分行業(yè)提供服務(wù),比如勞雷特(Laoret)就采用機(jī)器和人工相結(jié)合的方式為傳媒、出版和娛樂行業(yè)提供翻譯服務(wù)。人工智能圖書營銷平臺(tái)博克斯比(Booxby)等則應(yīng)用自然語言處理和機(jī)器學(xué)習(xí)技術(shù)解析作者的獨(dú)特風(fēng)格,然后預(yù)測(cè)讀者對(duì)該風(fēng)格的體驗(yàn),從而幫助作者和出版商有效地定位書籍,實(shí)現(xiàn)精準(zhǔn)營銷。
人工智能在編輯環(huán)節(jié)的早期應(yīng)用主要為語言檢查和剽竊檢查。自動(dòng)文本分析可以檢測(cè)出剽竊段落和句子,減少版權(quán)糾紛,還可用于監(jiān)控第三方出版平臺(tái)上的版權(quán)侵權(quán)行為,維護(hù)出版商和作者利益。在Authors A.I.之前,一款名為“Grammarly”的人工智能寫作助手程序允許用戶檢測(cè)并修正英文拼寫、語法和標(biāo)點(diǎn)符號(hào)錯(cuò)誤,并于2019年發(fā)布了語氣檢測(cè)和修正功能,允許用戶根據(jù)文本的使用情境來調(diào)整文字的語氣。相比之下,Authors A.I.更具有針對(duì)性,因?yàn)樗粚W⒂谛≌f特別是長(zhǎng)篇小說的分析,而且分析內(nèi)容也更加深入。它不再只提供語法和拼寫的校對(duì)檢查功能,而開始涉及作品主題、情節(jié)和人物分析。在此之前,這些工作都是人類編輯的職責(zé)。Authors A.I.拓展了人工智能在編輯環(huán)節(jié)的作用范圍,使其開始涉足編輯的核心工作。它不僅可以幫助編輯減少校對(duì)工作量,提升總體錯(cuò)誤檢測(cè)準(zhǔn)確率,還能將作者手稿特征與暢銷書特征進(jìn)行比較,以找出可以改進(jìn)的地方,并預(yù)測(cè)小說的暢銷潛力,幫助編輯專注于最具市場(chǎng)價(jià)值的內(nèi)容。
五、小結(jié)與討論
人工智能編寫非小說類書籍、博客文章和新聞文章已經(jīng)成為現(xiàn)實(shí),甚至可以編寫代碼模仿J.K.羅琳的風(fēng)格自動(dòng)生成內(nèi)容,但目前并沒有產(chǎn)生一部由人工智能創(chuàng)作的優(yōu)秀小說作品。[14]因此,Authors A.I.拓展了AI技術(shù)的應(yīng)用方式和范圍。它不是直接根據(jù)數(shù)據(jù)計(jì)算寫出一本暢銷書,而是將人工智能從作者的對(duì)手轉(zhuǎn)變?yōu)橹?,以使作者更好地了解讀者、市場(chǎng)和競(jìng)爭(zhēng)對(duì)手,幫助其寫出更符合市場(chǎng)需求的作品,并拉近與讀者的距離。這種模式似乎是一種雙贏的方案:既保留了作者的創(chuàng)作主體地位,同時(shí)發(fā)揮了人工智能的優(yōu)勢(shì),可以增強(qiáng)而不是取代人類智能。
但是,Authors A.I.挖掘的暢銷書模式可能會(huì)進(jìn)一步導(dǎo)致暢銷文學(xué)作品的同質(zhì)化和套路化,消解或阻礙作者的創(chuàng)造力以及作品的創(chuàng)新性。其實(shí),暢銷文學(xué)作品本來就沒有一般人想象的那樣天馬行空。此前已有許多人提出有關(guān)故事結(jié)構(gòu)或模式的觀點(diǎn)??死锼雇懈ァげ伎耍–hristopher Booker)在《七個(gè)基本情節(jié):我們?yōu)槭裁粗v故事》(The Seven Basic Plots: Why We Tell Stories)中提出從古代神話到戲劇小說再到流行影視劇,各種故事都可被歸納在七種原型中。[15]美國著名作家?guī)鞝柼亍ゑT內(nèi)古特(Kurt Vonnegut)認(rèn)為故事具有普遍形式,除了少數(shù)例外,經(jīng)典文學(xué)和現(xiàn)代文學(xué)故事可以歸納為少數(shù)幾個(gè)原型。這些原型可以簡(jiǎn)單地用坐標(biāo)圖來表示,橫軸表示敘事時(shí)間,從故事開始到結(jié)束;縱軸表示故事的起伏波折,隨著情節(jié)推進(jìn),故事線索通常會(huì)經(jīng)歷危機(jī)、復(fù)雜情況、戲劇性轉(zhuǎn)折和解決方案等過程。[16]計(jì)算機(jī)是模式識(shí)別專家,可以在人類無法顧及的尺度和粒度級(jí)別上研究模式,甚至比最老練的文學(xué)評(píng)論家更接近小說細(xì)節(jié)。因此,Authors A.I.對(duì)馮內(nèi)古特提出的故事原型理論進(jìn)行了擴(kuò)展應(yīng)用,除了情節(jié)結(jié)構(gòu)和情感節(jié)奏,還對(duì)故事主題、人物性格特征和敘事節(jié)奏等進(jìn)行分析。
Authors A.I.是人工智能在輔助小說寫作和編輯應(yīng)用上邁出的重要一步。它利用算法為人類作者提供改進(jìn)小說創(chuàng)作的建議。顯然,把人工智能當(dāng)作人類助手而不是人類對(duì)手在現(xiàn)階段更為現(xiàn)實(shí)。但從Authors A.I.目前提供的分析報(bào)告來看,其呈現(xiàn)結(jié)果仍較為有限,圖表內(nèi)容不夠詳細(xì),分析的準(zhǔn)確性有待提升。如敘事原型和情節(jié)轉(zhuǎn)折等都只有一個(gè)大概趨勢(shì),并沒有精細(xì)到具體章節(jié);與四本暢銷書的對(duì)比數(shù)據(jù)也只是通過雷達(dá)圖簡(jiǎn)單呈現(xiàn);提供的修改建議仍較為寬泛,缺乏針對(duì)性;只有一個(gè)人物的名字出現(xiàn)得足夠頻繁,Marlowe才能夠識(shí)別該人物并根據(jù)其行為判斷其性格特征,而且它無法判斷人稱代詞所指,因此人物性格判斷準(zhǔn)確性還有待提高;總結(jié)歸納的主題存在交叉和重疊等。但無論對(duì)于作家還是編輯,這都是有益的嘗試。技術(shù)總是不斷向前發(fā)展的,隨著人工智能領(lǐng)域研究的不斷進(jìn)展,Marlowe在未來或許可以變得更加有效。
參考文獻(xiàn):
[1]陳銘,徐麗芳.Archer Jockers:用機(jī)器算法解密暢銷小說基因[J].出版參考,2019(03):12-15.
[2]Tolentino J.“The Bestseller Code” Tells Us What We Already Know[EB/OL].(2016-09-23). https://www.newyorker.com/books/page-turner/the-bestseller-code-tells-us-what-we-already-know.
[3]Authors A.I.About Authors A.I.[EB/OL]. [2021-07-12].https://authors.ai/about/.
[4]Authors A.I.Writing Analysis Platform Authors AI Releases Major New Features[EB/OL].[2021-06-07]. https://authors.ai/writing-analysis-platform-authors-ai-releases-major-new-features/.
[5][11]Archer J.,Jockers M. L.The Bestseller Code:Anatomy of the Blockbuster Novel[M].New York:St.Martin's Press,2016:177-194,77-9.
[6]Murty M. N., Devi V. S.Pattern Recognition:An Algorithmic Approach[M].London:Springer London, 2011:1-6.
[7]Marlowe. Marlowe analyzes The Da Vinci Code [EB/OL].[2021-07-12].https://authors.ai/.
[8]Boyd R. L., Blackburn K. G., Pennebaker J. W.The Narrative Arc:Revealing Core Narrative Structures Through text Analysis[J].Science Advances,2020,6(32):a2196.
[9]Lasica J. D. Examples of Narrative Arcs in Modern Fiction[EB/OL].[2021-02-22].https://authors.ai/examples-of-narrative-arcs-in-modern-fiction/.
[10]Beemgee.Story Structure and Plot Beats[EB/OL].[2021-07-31].https://www.beemgee.com/blog/story-structure-plot-beats/.
[12]Six Seconds. Plutchik's Wheel of Emotions: Exploring the Emotion Wheel[EB/OL].[2021-07-31]. https://www.6seconds.org/2020/08/11/plutchik-wheel-emotions/.
[13]Team WNiP.“The Impact Will Be Immense”:How AI Is Reshaping the Publishing Industry[EB/OL].(2019-11-07).https://medium.com/whats-new-in-publishing/the-impact-will-be-immense-how-ai-is-reshaping-the-publishing-industry-16dea969c299.
[14]Rutkowska A.How AI Is Disrupting The Publishing Industry[EB/OL].(2020-10-20).https://www.forbes.com/sites/forbesbusinesscouncil/2020/10/20/how-ai-is-disrupting-the-publishing-industry/?sh=48cef68f5237.
[15]Booker C.The Seven Basic Plots:Why We Tell Stories[M].New York:Bloomsbury Continuum,2019:1-13.
[16]Lasica J. D. Do Stories Have a Universal Shape? [EB/OL].[2021-02-02].https://www.janefriedman.com/do-stories-have-a-universal-shape/.
(作者單位系武漢大學(xué)數(shù)字出版研究所;武漢大學(xué)信息管理學(xué)院)