張健 王雨心 袁哲
摘要:文章旨在探討web3.0時代背景下AIGC在傳統(tǒng)文化傳承過程中的作用和影響。文章通過分析國內外AIGC在各領域的使用情況以及AIGC生成模型、擴散模型和人際耦合關系等關鍵技術與方法,總結了AIGC在傳統(tǒng)文化傳承設計中的流程。以山西省永樂宮數(shù)字化展示中心設計方案為例,與AIGC共創(chuàng)生成設計方案。該方法可為傳統(tǒng)文化傳承設計方案和流程創(chuàng)新提供參考。
關鍵詞:生成式人工智能 傳統(tǒng)文化 藝術設計 永樂宮 人機共創(chuàng)
中圖分類號:TU984.14 文獻標識碼:A
文章編號:1003-0069(2023)17-0030-04
Abstract:The aim is to explore the role and influence of AIGC in the inheritance of traditional culture in the context of the web3.0 era. By analyzing the use of AIGC in various fields at home and abroad,as well as key technologies and methods such as AIGC Generative model,Diffusion model and interpersonal coupling,this paper summarizes the process of AIGC in traditional culture inheritance design. Take the design scheme of Yongle Gong Digital Exhibition Center in Shanxi Province as an example,and create a design scheme together with AIGC. This method can provide reference for the design scheme and process innovation of traditional cultural inheritance.
Keywords:Generative AI Traditional cultural Art design Yongle Gong Co Creation
AIGC(AI-Generated Content,生成式人工智能)基于生成對抗網絡GAN、大型預訓練模型等人工智能技術,通過已有數(shù)據尋找規(guī)律,以適當?shù)姆夯芰ι上嚓P數(shù)字內容。其內容生成技術已全面覆蓋文本、圖像、音視頻、代碼、游戲、3D及多模態(tài)內容生成領域,并融合到to C、to B等商業(yè)場景下使用。如在圖像生成領域,國外有Disco Diffusion、DALL-E 2、Make-A-Scene、Midjourney、Stable Diffusion等,國內有ZMO.ai、圖宇宙、文心一格(百度)、視覺中國、創(chuàng)意畫廊(藍色光標)等;視頻生成領域,國外有Meta的Make-AVideo,谷歌的 Imagen Video和Phenaki等,國內有剪映(字節(jié)跳動)、云剪(快手)、藍標分身(藍色光標)、影譜科技等;虛擬人生成領域,國外有Stable Diffusion、StyleGAN(英偉達)等,國內有倒映有聲等;在室內設計領域,國外有CollovGPT 0.2、Design Generator、AI Dream Home等,國內有模袋云、真家AIGC、小白設計家等。AIGC正在成為繼專業(yè)生成內容(Professional Generated Content,PGC)、用戶生成內容(User Generated Content,UGC)之后,一種更為高效、便捷的新型內容創(chuàng)作方式。
(一)AIGC工作原理及特點
AIGC生成式人工智能利用深度學習、虛擬現(xiàn)實等生成合成類算法制作文本、圖像、音頻、視頻、虛擬場景等數(shù)字內容。[1]作為AIGC內容生產平臺的核心引擎,常見的有生成模型有GAN、VAE、Flow Models等,擴散模型有Diffusion Model等。其中,生成模型通過給一組隨機噪聲,借助某種概率模型下的變換,可隨機輸出大量具有一定語義信息的數(shù)據(如圖像、文本等)。[2]如BigGAN可生成更高分辨率和更多樣化的圖像;StyleGAN可生成具有更高層次的細節(jié)和紋理的圖像;CycleGAN可實現(xiàn)圖像風格轉換,將一張圖片的風格轉換為另一張圖片的風格等。擴散模型則通過逐漸給圖片添加高斯噪聲,直到最后獲得純噪聲;然后訓練一個神經網做圖像去噪,從純噪聲開始,直到獲得最終圖像。如Diffusion Model可生成高質量的圖像,并且可以控制生成圖像的多樣性,也可用于圖像修復和圖像合成等任務。AIGC具有高度智能化、多樣化、個性化、實時性、交互性和多模塊結合等特點,其中高度智能化是指其借助深度學習、機器學習和自然語言處理等先進技術,使得藝術設計的生成過程能夠更加智能化和自動化。通過深入學習和分析大量圖像、藝術品和設計作品,AIGC能夠感知并學習各種風格和創(chuàng)意元素,從而能夠創(chuàng)造出更具有藝術性和創(chuàng)意性的作品,以更高效的生產方式滿足人們不斷增長的需求和創(chuàng)新的應用場景。
(二)AIGC設計流程
AIGC作為一種迭代設計過程和方法,主要依托生成器程序,程序依據算法或規(guī)則將滿足需求的參數(shù)設計進行可視化輸出,而設計者通過修改參數(shù)值來改變設計方案。其工作原理基于語義分析(Semantic Analysis)、深度學習(Deep Learning)、智能算法(Intelligence Algorithms)三環(huán)節(jié)。[3]其中,語義分析利用計算機來學習或理解一段文字或關鍵詞所表示的語義內容,并根據語義內容建立有效的模型或生成系統(tǒng);深度學習模擬人的真實思維,借助海量數(shù)據分析來實現(xiàn)正確的預判或構建預估目標;智能算法通過機器運算,對圖像進行邊緣檢測、識別、匹配、分割和圖像分類,對數(shù)字圖像自動制作過程實現(xiàn)函數(shù)優(yōu)化和模糊控制,有效實現(xiàn)智能圖像的自動生成過程。[4]
AIGC作為一種更為智能化的設計輔助技術,其模糊了設計師與計算機輔助設計間的邊界,很多新型關系也正處于重新定義中,如主輔關系、設計分工、工作流程等。其中,設計者的設計行為從單一的“設計”外延到評估與決策。在設計輸出中對AIGC計算結果進行判斷和評估,不斷引導算法來完成最終解決方案。具體而言,AIGC設計流程包括以下幾個步驟(見圖1):
1.確定設計目標(idea):明確設計的目標和要求,包括設計用途、應用場景、用戶需求和預期效果等,把計劃使用的信息文本化與參數(shù)化。
2.選擇合適的生成模型(model):根據設計目標和數(shù)據特點,選擇合適的生成模型。視情況不同,可選擇單一模型或結合多個模型。
3.設計輸出(output):由計算機通過算法規(guī)則和代碼,做出符合設計要求和參數(shù)設置自動生成的解決方案。
4.反復迭代(iteration):依據設計師意圖對前述步驟的重復。
上述步驟構成了AIGC的主要設計流程,實際操作中需根據具體設計項目和要求進行調整和擴展。同時,也要求設計師在設計過程中保持持續(xù)優(yōu)化和改進,達成AIGC設計創(chuàng)新的有效性。
(一)永樂宮及其文化分析
永樂宮原名大純陽萬壽宮,興建于公元1247年至1358年間,為紀念道教全真派北五祖之一的呂洞賓所建,是現(xiàn)存最大的元代道教宮觀,被譽為道教圣地。[5]永樂宮以其道教壁畫藝術而馳名中外,現(xiàn)存壁畫面積1005.68平方米,為世界古代壁畫藝術寶庫之一,尤以主殿三清殿內的《朝元圖》壁畫為精。整幅壁畫長達95米,人物多達286位,將著名的歷史人文神性化,展現(xiàn)他們化身各路道教神仙朝謁元始天尊的宏大場面;壁畫探索宇宙自然規(guī)律,體現(xiàn)著道教“天人合一,萬物歸元”的宇宙哲學觀。因此,圍繞該壁畫展開的文旅IP打造成為該項目設計的核心重點之一。[6]
(二)永樂宮數(shù)字化設計目標
永樂宮數(shù)字化建設旨在以數(shù)字化展示為手段,通過全方位、多模態(tài)、富信息的呈現(xiàn)方式,進行文物保護、文物共享、擴張體驗和文化傳播,打造以永樂宮為載體的“道教、建筑、壁畫、搬遷”精神一體化的一流數(shù)字化展示中心。其設計目標如下:(1)功能目標:構建數(shù)字孿生系統(tǒng)。以數(shù)字技術對文物本體及相關環(huán)境進行保護,包括將永樂宮文物藏品數(shù)字化復原保存,減少文物原件損傷,建設文書數(shù)字化數(shù)據資料庫,并與實體文物建立虛實交互關系;(2)體驗目標:打造具有可視、沉浸、交互、教育性的展覽體系。通過信息可視化技術、人工智能技術、全息投影技術等,以互動內容、沉浸氛圍、多感官體驗等演繹文物知識,講述文物故事;(3)文化內容目標:以歷史文脈、在地藝術、科普知識等為主題,以多元化學習方式,傳達有用知識與信息。
(一)與AIGC結合的兩類設計
永樂宮數(shù)字化展示中心設計方案包括展廳功能區(qū)劃分、整體布局規(guī)劃、傳統(tǒng)文化數(shù)字化展項設計、永樂大景區(qū)構建、永樂宮傳統(tǒng)文化IP打造五大模塊。整個設計通過大量效果圖來進行方案展示與溝通,項目組選擇Mid Journey進行實驗性設計共創(chuàng)與出圖,實驗模塊包括兩個子項:1.“元動永樂”展示空間設計;2.“道一”非遺數(shù)字人(IP形象)設計。
在展示空間設計中,效果圖扮演著至關重要的角色。作為通過視覺呈現(xiàn)來展示設計概念、想法和創(chuàng)意的工具,在傳統(tǒng)設計過程中占用了大量的人力與時間資源。其需通過計算機輔助設計(CAD)和三維建模軟件等共同協(xié)作完成,從平面布局圖繪制、3D建模,材質和燈光調整、渲染,到PS后期細節(jié)調整。一張好的設計效果圖通常需具備:1.良好的氛圍感。所有特定環(huán)境或場景都應給人一種精神表現(xiàn)的強烈感覺;2.準確的光照和陰影效果。用以增加圖像的立體感和逼真度;3.合理的材質和質感表達。使觀眾能夠感受到設計方案的觸感和質感;4.精心的構圖和視覺引導。使設計的重點和特色突出,吸引觀眾的注意力;5.逼真和精確的比例感。使設計方案的尺度和空間關系準確呈現(xiàn);6.恰當?shù)纳蔬\用和配色方案。傳達設計方案所要表達的情感和氛圍。
在展示空間(如博物館)設計引入虛擬人物角色的作用是增強參觀者的體驗和互動性。傳統(tǒng)借助3D建模的方法在表情和動作的逼真性,滿足個性化需求的靈活性,生產與渲染的高效性等方面都存在諸多限制。而一個好的數(shù)字人應具備以下要素:1.高度逼真的外貌和動作表現(xiàn),以展現(xiàn)傳統(tǒng)文化的特征和美感;2.準確的歷史和文化背景知識,以提供準確的教育和解說服務;3.多樣化的故事和展示方式,以滿足不同觀眾的需求和興趣;4.融合傳統(tǒng)文化元素與現(xiàn)代技術的設計,以創(chuàng)造獨特的體驗和效果。
因此,相關人工智能工具對上述兩個設計子項要求的實現(xiàn)程度,成為我們判斷其設計及作圖有效性的重要依據。
(二)以“元動永樂”展示空間設計為例的AIGC效果圖生成設計
“元動永樂”屬于整個設計中的“諸仙朝元”篇章,主要以新媒體的方式來展現(xiàn)《朝元圖》中所蘊含的道教文化,通過對諸神朝元時期的歷史和文化的解讀和展示,讓參觀者能夠深入認識和感受盛元景象及其文化特色。AIGC輔助設計步驟如下:
1.前期資料準備
1)相關信息資料分析。該階段主要進行信息資料收集,本項目結合道教文化主題和AI工作要求兩方面推進。一方面,圍繞永樂宮和道教內在關系,主要從道教歷史、道教文化、永樂宮道教壁畫、永樂宮道教建筑等幾個議題展開資料收集,資料來源包括史料、學術研究文獻等,以確保其知識典型性、有效性與權威性。另一方面,圍繞構想的設計效果組織相關詞匯語料庫。資料主要來源于設計師的專業(yè)認知經驗,也可借助一定的效果圖圖例來幫助進行詞語描繪的組織。如結合展廳主要展陳設計,對紗幕、投影、朝元圖壁畫,以及主要建筑材料如混凝土等的關注。
2)詞頻分析。通過詞頻分析(Word Frequency Analysis)提取上述文獻中相關關鍵詞,在此基礎上依據AIGC算法的邏輯進行推導,凝練成具有語義信息的數(shù)據。項目共分析總字數(shù)10514個,總詞數(shù)2119個,這表示文本中可能有重復出現(xiàn)的詞匯,也可能有一些專業(yè)術語或特定內容的高頻詞匯。詞頻分析的目的是為了找出文本中出現(xiàn)頻率最高的詞匯,以便更好地幫助AIGC理解文本的主題和關鍵信息。最后優(yōu)化出高頻關鍵詞:朝元圖(76次)、壁畫(49次)、道教(32次)、永樂宮(31次)、神仙(28次);同時,結合項目風格定位甄選出紗幕、混凝土等詞。綜上結合設計師對設計畫面的初步構想,此次項目設計效果圖描述性內容的排序優(yōu)先級設定為:A.室內展廳設計;B.建筑本身的混凝土材質與道教天人合一的結合;C.神仙縹緲輕盈之感的紗幕材質;D.壁畫朝元圖;E.朝元圖所描繪的神仙景象。
2.與AIGC共創(chuàng)
與AIGC的設計共創(chuàng)主要考慮以下幾個問題:
1)人機耦合關系。在設計中要明確定位AIGC在共創(chuàng)過程中的角色和功能,Midjourney主要作為輔助工具來生成永樂宮數(shù)字化展廳的啟發(fā)性創(chuàng)意、效果圖制作等。設計師則以專業(yè)知識、創(chuàng)意思維和審美判斷來確保人機協(xié)作的順暢、互補和意義產生。
2)避免同質化。AIGC的應用可能會對設計師的創(chuàng)造力、文化理解和價值觀產生影響,也會干擾文化多樣性和個性化的表達,導致形式同質化或失真。合作過程中創(chuàng)新性和新鮮度的發(fā)掘至關重要。
3)隨機表現(xiàn)的無限與有限問題。AIGC設計由于算法具有一定的隨機性,這種基于海量數(shù)據的隨機性不斷涌現(xiàn),帶來新鮮度與創(chuàng)新感,但也可能與預期的設計目標不完全一致。因此設計者需根據具體需求和目標,選擇適當?shù)乃惴ê驼{整算法的參數(shù)來校正AI。
3.出圖過程分析:本次AIGC設計中運用MidJourney來輔助效果圖生成,主要包括以下步驟:步驟一,將分析得出的關鍵詞根據AIGC算法邏輯轉化成提示詞(prompt)文本(本例中主要包括1)interior design;2)exhibition;3)concrete;4)murals;5)gauze curtains;6)Chinese immortals,描述想要生成的畫面,提供給Midjourney。步驟二,使用BERT等模型將輸入的提示詞(prompt)編碼為神經網絡可理解的代碼。步驟三,將編碼后的代碼輸入到生成器模型,指導其不斷生成符合描述的圖像,由判別器判斷是否足夠真實。步驟四,如未達到理想預期,輸入新的描述,或對已有圖像進行編輯,重新執(zhí)行1-3步驟,最終生成符合需求的圖像。如在本次設計中,初步生成的圖像對提示詞:紗幕以及神仙形象等表現(xiàn)不足,則設計師對關鍵詞進行了調整之后再次生成,并多次重復,最終篩選出了符合預期的圖像。圖2是基于條件生成對抗網絡設計的CGAN結構示意圖。
本方案在AIGC生成圖像(lmage)過程中,通過甄別不斷調整參數(shù),最終生成41張永樂宮道教文化展廳效果圖,并從中選擇3張進行進一步篩選,從中挑選最能體現(xiàn)設計思想和概念的圖,其余的作為備選,豐富創(chuàng)意拓展選擇空間。在初步篩選圖像的過程中,圖像存在色調、構圖、紗幕質感表現(xiàn)不足、朝元圖內容展現(xiàn)欠缺等諸多問題,設計師通過調整紗幕、神仙人物等這幾個元素在畫面中的重要性比值,逐步將畫面調整至符合預期構想的圖像,如圖3。
在篩選出符合意向的最終AIGC設計效果圖后,仍需設計師充分發(fā)揮專業(yè)知識,最后修正效果圖中與設計意向不符的部分。本例中AIGC最終篩選出的圖像對朝元圖內容的展現(xiàn)不夠準確,仍然需要設計師后期處理紗幕畫面的局部神仙人物細節(jié),如圖所示,人工處理后的效果圖在畫面內容上更好、更真實地展現(xiàn)出設計核心《朝元圖》的畫面內容,使效果圖達到更好傳遞設計概念的作用。
4.設計總結:AIGC生成的室內展廳效果圖和消耗相同時間成本的傳統(tǒng)設計成果對比,AIGC借助深度學習和機器學習等技術,使得創(chuàng)作更具創(chuàng)新性和多樣性。同時,AIGC可智能地優(yōu)化效果圖的細節(jié),使得圖像的色彩、構圖和細節(jié)更加精準和協(xié)調。包括自動調整圖像的光影、對比度和色彩平衡等,從而產生更具藝術感和美感的效果圖。但在設計過程中發(fā)現(xiàn)AIGC的出圖結果受到輸入數(shù)據質量和偏見的影響極大。如果數(shù)據存在不完整、偏倚或不準確的情況,AIGC的生成結果可能帶有同樣的問題。故在前期資料準備階段要盡量確保數(shù)據的準確與完善。同時,由于AIGC使用的算法復雜且多樣,具有一定的復雜性和隨機性,設計者需要根據實際使用情況選擇恰當算法,同時持續(xù)監(jiān)測和優(yōu)化其輸出結果。
(三)以“道一”為例的非遺數(shù)字人生成
“道一”屬于本項目的“多元宇宙”篇章,主要以虛擬數(shù)字人的形式來具象化永樂地區(qū)的道教文化,使游客能更自然、親密地與永樂宮歷史和文化互動。
1.前期資料準備
1)相關文史資料分析。在前期資料準備上圍繞道教主要從道教歷史、道教文化、永樂宮道教文化幾個議題展開資料收集。資料來源主要為學術研究文獻。另一方面,對于“道一”形象設計的構想組織相關詞匯語料庫,資料主要來源于設計師的專業(yè)認知經驗,也可通過效果圖的圖例來協(xié)助詞語描繪的組織。如結合虛擬人形象設計,對道教、建筑、壁畫等的關注。
2)詞頻分析。通過詞頻分析,對“道一”虛擬人設計所收集的資料提取關鍵詞,幫助AIGC理解設計的主題和需要突出的重點。項目共分析總字數(shù)21384個,總詞數(shù)3791個,最后分析出高頻關鍵詞:道教(129次)、鴟吻(82次)、天人合一(47次)、永樂宮(41次)、呂洞賓(34次)。因此在數(shù)字人設計中,“道一”形象將結合道教文化與永樂宮建筑構建鴟吻,同時表達“天人合一”境界。
2.與AIGC共創(chuàng)
1)共創(chuàng)核心邏輯設定。對AIGC在主題,服裝配飾、面容情緒,動作姿態(tài)等一系列數(shù)字人設計要素上進行約束,并在純文本約束的基礎上修改文本或增加圖片參考約束,進一步校正AIGC。
2)共創(chuàng)內容基本設定。從服飾上,參考永樂宮的建筑構建琉璃鴟吻和道教傳統(tǒng)形象;從面部表情上,表現(xiàn)道教文化所追求的平靜、內斂和慈祥,以溫和而祥和的面容,明亮而富有智慧的眼神,彰顯出道教智慧和人文關懷的特質;從動作和姿態(tài)上,借鑒道教儀式和道術的形態(tài),如抱手合十、閉目冥想、手持符咒等,表達對道教文化傳統(tǒng)的尊重和敬畏,并給人一種平和與超然的感覺。
本方案在AIGC生成圖像過程中,通過甄別不斷調整參數(shù),最終生成30張數(shù)字人“道一”效果圖,并從中選擇3張進行進一步篩選,從中挑選最能體現(xiàn)設計思想和概念的圖,其余的作為備選,豐富創(chuàng)意拓展選擇空間。
在初步篩選圖像的過程中,出現(xiàn)人物形象與中國道教文化不符,構圖過偏,主體“道一”人物形象不突出等問題,設計師通過調整人物形象、畫面占比、構圖描述等重要性比值對畫面進行調整,最終選出符合初步構想的圖像。
3.出圖過程分析:基于上述共創(chuàng)邏輯,本案中“道一”數(shù)字人形象的設計尋求與永樂宮特色和道家文化的充分結合,以傳達道教的神秘、莊嚴和智慧等核心特質。
步驟一,收集與“道一”虛擬人相關的大量傳統(tǒng)文化數(shù)據,包括圖像、文本、音頻等。同時對數(shù)據進行預處理,清洗和標準化,確保數(shù)據的質量和一致性。步驟二,“道一”虛擬人的生成涉及多個特征的提取與組合,如面部特征、服飾風格、姿勢等。項目借助AIGC提取并組合這些特征,形成虛擬人的綜合特點。步驟三,對生成“道一”虛擬人圖像的精細調整及后期處理,包括調整姿態(tài)、增加細節(jié)等,使虛擬人更加逼真和生動,優(yōu)化虛擬人的外觀和效果。
4.設計總結:相比傳統(tǒng)手工繪制或建模渲染方式對大量時間和人力的耗費,AIGC可在較短的時間內生成虛擬人,通常只需要幾秒鐘或幾分鐘,使虛擬人的制作過程更為高效。但大量時間和精力投入到對人機溝通的有效性上,需通過不斷摸索與相互適應來逐步提升出圖有效率。同時,在借助AIGC的虛擬人生成過程中,還應注重對傳統(tǒng)文化的傳承和保護,尊重傳統(tǒng)文化的價值觀和特點,使虛擬人的生成與傳統(tǒng)文化相契合。項目組通過深入研究永樂地區(qū)道教文化的歷史、建筑風格、儀式和符號等,來確?!暗酪弧睂τ罉返澜涛幕卣骱途璧臏蚀_表達,避免對相關文化特征的誤讀或夸大,這種度量和平衡點的把握也對設計師提出了新的要求。
Web3.0時代,AIGC提供了一種全新的設計方法,其拓展了傳統(tǒng)文化傳承設計創(chuàng)作空間和可能性。通過機器學習、生成式模型和算法優(yōu)化等技術,結合大數(shù)據分析、圖像處理和自然語言處理等,靈活、高效地發(fā)掘、創(chuàng)造新的設計元素、形式和表達方式,為設計師提供更多的靈感和創(chuàng)意支持。同時,通過整合多種技術和算法,自動化或輔助設計過程,AIGC提升了設計效率和質量,促進傳統(tǒng)文化的傳承、創(chuàng)新和可持續(xù)發(fā)展。
基金項目:本文系國家社科基金藝術學一般項目資助項目“沉浸式影像空間交互設計方法研究”(項目編號:22BG133)的研究成果之一。
參考文獻
[1]互聯(lián)網信息服務深度合成管理規(guī)定[J].中華人民共和國國務院公報,2023,1795(04):22-25.
[2]Agnese J,Herrera J,Tao H,et al. A survey and taxonomy of adversarial neural networks for text to image synthesis[J]. Wiley Interdisciplinary Reviews:Data Mining and Knowledge Discovery,2020,10(4):e1345.
[3]Frolov S,Hinz T,Raue F,et al. Adversarial text-to-image synthesis:A review[J]. Neural Networks,2021,144:187-209.
[4]BALLEGAARD E,KAJITA M,NICHOLAS P.Users experience in digital architectural design:combining qualitative research methods with a generative model[J].Stud Health Technol Inform,2021,282:315-332.
[5]陳恩惠.永樂宮的建筑藝術與園林特色[J].藝術百家,2006(07):83-85+88.
[6]于娟娟. 淺析道教壁畫的審美思想[D].陜西師范大學,2011.
[7]李韻如.人工智能背景下非物質文化遺產情感化展示設計研究[J].設計,2022,35(24):133-135.
[8]李韻如.基于增強現(xiàn)實技術的現(xiàn)代織錦非物質文化遺產數(shù)字化展示設計研究[J].設計,2022,35(17):122-124.