【摘 要】隨著深度學(xué)習(xí)技術(shù)在各個領(lǐng)域的廣泛應(yīng)用,人工智能與書法藝術(shù)的結(jié)合也越來越緊密。目前,人工智能主要應(yīng)用在手寫文字識別領(lǐng)域,一般采用“選用數(shù)據(jù)集—搭建網(wǎng)絡(luò)—模型訓(xùn)練”的方法,依據(jù)輪廓、骨架相似性等原理,構(gòu)建手寫文字識別系統(tǒng)。當(dāng)下,在書法評價領(lǐng)域,我們通過自建專用書法作品數(shù)據(jù)集進(jìn)行深度學(xué)習(xí)訓(xùn)練,努力構(gòu)建全面的書法智能評價系統(tǒng)。隨著科技和工業(yè)制造水平的不斷提高,人工智能將會在書法作品的評價、書寫乃至創(chuàng)作方面有很好的應(yīng)用前景,迎來書法藝術(shù)發(fā)展的春天。
【關(guān)鍵詞】人工智能;深度學(xué)習(xí);書法評價
【中圖分類號】G420? 【文獻(xiàn)標(biāo)志碼】B? 【文章編號】1005-6009(2021)30-0007-03
【作者簡介】王開玲,江蘇省鹽城市日月路小學(xué)(江蘇鹽城,224005)副校長,高級教師,鹽城市小學(xué)語文學(xué)科帶頭人,鹽城市小學(xué)語文基本功大賽一等獎。
技術(shù)與藝術(shù)一向被視為光譜的兩端。技術(shù)意味著可量化、可復(fù)現(xiàn)、可批量產(chǎn)出,藝術(shù)則恰恰相反。大多數(shù)人都認(rèn)為藝術(shù)本身的創(chuàng)造性很難被取代,而人工智能的可解釋性、可遷移性、可靠性同樣非常重要。如果將可解釋性人工智能應(yīng)用到藝術(shù)領(lǐng)域,可以提升人對藝術(shù)的理解,比如什么樣的藝術(shù)能夠產(chǎn)生美感、如何創(chuàng)造美的藝術(shù),甚至影響藝術(shù)品的評價內(nèi)容和估值等。
基于機器學(xué)習(xí)的書法評價是非常復(fù)雜的系統(tǒng)問題,需要大量的數(shù)據(jù)和訓(xùn)練才能得以驗證,從而取得有效的評價結(jié)果。目前,國內(nèi)外已有不少學(xué)者在文字識別領(lǐng)域取得了顯著成果,文字識別技術(shù)已經(jīng)在印刷體和部分手寫體文字識別方面得到了很好的應(yīng)用。但是目前在基于機器學(xué)習(xí)的書法評價體系方面,相關(guān)研究還非常少,處于起步階段。
一、深度學(xué)習(xí)在手寫文字識別領(lǐng)域的應(yīng)用
筆者在國內(nèi)近幾年文字識別方面的研究中發(fā)現(xiàn),當(dāng)前對于書法字的識別大多采用輪廓相似性以及骨架相似性的方法。吳媛等人提出的一種基于數(shù)學(xué)形態(tài)學(xué)的脫機手寫體漢字識別方法,在識別率方面有顯著的提升,但移植到數(shù)據(jù)量很大的書法字的檢索系統(tǒng)中時,會出現(xiàn)檢索速度變慢,檢索的效果不如手寫的字好等問題。在此方法的基礎(chǔ)上,俞凱等人提出一種基于骨架相似性的書法字檢索方法,在保證查全率與查準(zhǔn)率的基礎(chǔ)上,檢索速率有了顯著的提升,但是建立的特征數(shù)據(jù)庫比較大,并不能滿足系統(tǒng)的設(shè)計要求。為了解決相關(guān)算法計算量大、耗時長、效率低等問題,章夏芬等人提出根據(jù)樣本字特征進(jìn)行動態(tài)變化的自適應(yīng)匹配法,在效率沒有改變的前提下,查全率與查準(zhǔn)率得到了一定的提升,但隨著數(shù)據(jù)量增大,檢索所需的時間也會呈線性增長。
目前,很多大公司,比如科大訊飛和百度AI都已經(jīng)推出了成熟的手寫文字識別系統(tǒng)。系統(tǒng)可基于深度神經(jīng)網(wǎng)絡(luò)模型端到端文字識別系統(tǒng),將圖片(來源于掃描儀或數(shù)碼相機)中的手寫字體轉(zhuǎn)化為計算機可編碼的文字。
以上所述的研究和實現(xiàn)方法都是大同小異的,基本上都是先選用數(shù)據(jù)集,再搭建網(wǎng)絡(luò),對數(shù)據(jù)集進(jìn)行模型訓(xùn)練。
1.搭建網(wǎng)絡(luò)。
其實文字識別就是一個多分類任務(wù),如一個手寫漢字?jǐn)?shù)據(jù)集的分類就屬于文字識別任務(wù)。用來定義它的網(wǎng)絡(luò)非常簡單,基本就是LeNet網(wǎng)絡(luò)。LeNet由Yann LeCun等人于1989年提出,它是一種用于手寫體字符識別得非常高效的卷積神經(jīng)網(wǎng)絡(luò),推動了深度學(xué)習(xí)的發(fā)展。LeNet5通過巧妙的設(shè)計,利用卷積、參數(shù)共享、池化等操作提取特征,避免了大量的計算成本,再使用全連接神經(jīng)網(wǎng)絡(luò)進(jìn)行分類識別。這個網(wǎng)絡(luò)是卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)的起點,后續(xù)許多網(wǎng)絡(luò)都以此為范本進(jìn)行優(yōu)化。
2.模型訓(xùn)練。
訓(xùn)練之前應(yīng)設(shè)計好數(shù)據(jù),使其能高效地喂給網(wǎng)絡(luò)訓(xùn)練。首先,創(chuàng)建數(shù)據(jù)流圖,這個數(shù)據(jù)流圖由一些流水線的階段組成,階段間用隊列連接在一起。第一階段將生成文件名,我們讀取這些文件名并且把他們排到文件名隊列中。第二階段從文件中讀取數(shù)據(jù)(使用Reader),產(chǎn)生樣本,再把樣本放在一個樣本隊列中。根據(jù)個人的設(shè)置,實際上也可以拷貝第二階段的樣本,使得他們相互獨立,這樣就可以從多個文件中并行讀取。在第二階段的最后是一個排隊操作,就是入隊到隊列中去,在下一階段出隊。我們一旦開始運行這些入隊操作的線程,訓(xùn)練循環(huán)就會使得樣本隊列中的樣本不斷地出隊。流程如圖1所示。
<f:\教育8本書\江蘇教育2021\江蘇教育4期\書法4期\書法4期圖片\2.論人工智能在傳統(tǒng)書法藝術(shù)的中的應(yīng)用與探索(1)(1)-357D\image1.png>[enqueue_many][dequeue][enqueue][Decoder][圖1 數(shù)據(jù)讀入流程]
二、深度學(xué)習(xí)在書法評價領(lǐng)域的探索
目前在書法作品評價方面,大多采用將要評價的樣本與標(biāo)準(zhǔn)書法作品進(jìn)行相似度計算的方法。例如,湖北工業(yè)大學(xué)的邵榮堂對書法練習(xí)作品中書法字的骨架與字帖中書法字的骨架進(jìn)行相似度的計算。他首先采用本文中提出的一種基于Z-S 算法改進(jìn)的單像素化處理的骨架提取的算法,從而得到基于整體結(jié)構(gòu)特征的相似度值;而后采用一種九宮格的形式對書法字的骨架進(jìn)行切分,將每一部分的骨架對比字帖中書法字相同位置的骨架,利用Hu矩與皮爾遜相關(guān)系數(shù)對相似度進(jìn)行計算,得到基于筆畫形體特征的相似度值;最后利用書法字距離邊框的值與整個書法字在邊框中的布局來綜合計算字體布局特征面的相似度值。整體評判的標(biāo)準(zhǔn)依據(jù)書法初級考試的標(biāo)準(zhǔn)制定。
現(xiàn)有的許多書法評價系統(tǒng)都要先區(qū)分書法作品的字體,如行、草、隸、篆、楷五種字體,使用者可以根據(jù)自身喜好選擇合適的書法字體以及書寫風(fēng)格。系統(tǒng)利用基于向量誤差的書寫評析模型,通過書法字跡智能提取、智能書法評分、智能書寫指導(dǎo)等過程,將單字書法中書寫失誤部位用紅色標(biāo)記,將書寫準(zhǔn)確部位用綠色標(biāo)記。
但以上方法有局限性。當(dāng)選取小學(xué)生書法作品進(jìn)行評價的時候,很難通過識別字體來評判優(yōu)劣。并且目前大多是以學(xué)者和研究人員為對象的書法評價系統(tǒng)研究,都是采用現(xiàn)有的局限性較大的公共數(shù)據(jù)集來進(jìn)行模型訓(xùn)練的,沒有大量的中小學(xué)生書法作品數(shù)據(jù)集,很難更準(zhǔn)確地實現(xiàn)人工智能打分的目的。因此,中小學(xué)書法教師在自建專用書法作品數(shù)據(jù)集進(jìn)行深度學(xué)習(xí)訓(xùn)練方面還需要展開相關(guān)工作。
三、深度學(xué)習(xí)在書法創(chuàng)作領(lǐng)域的展望
很多藝術(shù)家認(rèn)為機器不會取代藝術(shù)家的所有藝術(shù)創(chuàng)作,實際上人工智能藝術(shù)取代一部分藝術(shù)創(chuàng)作是有可能的。這一部分到底是多少?誰又有可能被率先取代呢?
就目前音樂創(chuàng)作情況來看,機器人已經(jīng)能作曲,并取得了不錯的應(yīng)用效果。隨著3D打印和雕刻機械的智能化,部分雕塑也要面臨人工被機器取代的趨勢。接下來可能就是書法了。
理論上講,與書法評價一樣,只要有足夠的深度學(xué)習(xí)數(shù)據(jù)集,有足夠好的算法,深度學(xué)習(xí)就可以讓人工智能學(xué)會書法創(chuàng)作,再結(jié)合靈活高效的機械控制裝置,人工智能很有可能完成甚至超過人類的書法創(chuàng)作。從目前機器手臂書寫我們可以看出,唯一阻礙機器不能像人一樣流利書寫的瓶頸就是筆。機器書寫字形和提按比較輕松,而控制筆在書寫過程中筆毛形狀的變化和筆的干濕度把握是機器的短板。隨著科技和工業(yè)制造水平的不斷提高,日后應(yīng)該可以逐步解決機器控制筆的問題,到那時,書法領(lǐng)域?qū)兄卮笞兏铩?/p>
人工智能對人類造成的沖擊,將使人們對自身的生命價值產(chǎn)生新的焦慮與追問,從而迫使人們靜下心來審視書法以及其他藝術(shù)的本質(zhì)意義,到那時,自然的書寫、精神的交流與創(chuàng)造將成為人們內(nèi)在的迫切需求。人們迫切需要以審美的力量解答心靈歸屬問題,對心靈的渴望予以真正的滿足,給焦躁孤獨和漂泊的靈魂以意義和價值的安頓,對人類困境給出審美的精神層面的回應(yīng)和引導(dǎo)。
若真的如此,書法的春天就真的來臨了。就算機器人能寫出漂亮的書法,但它無法完成人們通過書寫來抒發(fā)真情實感而創(chuàng)造的內(nèi)在精神需求。從唯物辯證法的視角看,事物總是遵循否定之否定的規(guī)律,在螺旋式上升的過程中向前發(fā)展,從古代書家的自然書寫,到當(dāng)下的功利性書寫,再到人工智能時代的全新歷史階段的自然書寫與精神創(chuàng)造,或?qū)⒂瓉頃ㄋ囆g(shù)發(fā)展的全新境界。<F:\教育8本書\江蘇教育2021\江蘇教育4期\書法4期\KT1.TIF>
【參考文獻(xiàn)】
[1]劉仁坤.利用現(xiàn)代信息技術(shù)提高書法教學(xué)實效[J].基礎(chǔ)教育論壇,2019(3):58-60.
[2]邵榮堂. 基于機器學(xué)習(xí)的書法字識別與智能評判[D].武漢:湖北工業(yè)大學(xué),2020.
[3]顧剛. 漢字識別關(guān)鍵算法研究與應(yīng)用[D].杭州:浙江大學(xué),2017.
[4]殷良鷹. 非線性度量學(xué)習(xí)算法研究[D].北京:北京理工大學(xué),2016.
[5]周潤物,李智勇,陳少淼,等.面向大數(shù)據(jù)處理的并行優(yōu)化抽樣聚類K-means算法[J].計算機應(yīng)用,2016,36(2):311-315,329.
[6]曲延直.基于深度學(xué)習(xí)的漢字書法識別研究[J].電子測試,2019(24):44-46,61.