任敏
訴別離,它說,“離別恨難分,琵琶不忍聞。斷腸空有淚,明月已無魂?!痹伌喝?,它說,“三月初春雪未消,東風(fēng)吹送柳絲飄。綠楊枝上鶯聲急,紅杏梢頭蝶夢遙?!?/p>
它是誰?它是“熟讀”詩歌90萬首,通曉平仄、押韻、對仗等“潛規(guī)則”,只需輸入關(guān)鍵詞句,即可在數(shù)秒之內(nèi)出口成詩的人工智能機器人,名日九歌。這位古詩界的“最強大腦”,誕生于清華大學(xué)自然語言處理與社會人文計算實驗室,其主要研發(fā)者矣曉沅,是清華園里一位輪椅上的博士。九歌,寄托了他的志向,也帶領(lǐng)他抵達詩意的遠(yuǎn)方。
6歲起,矣曉沅身體就被類風(fēng)濕性關(guān)節(jié)炎糾纏。無法自由行走的曉沅,多了思考的時間,他是名副其實的學(xué)霸。2012年高考,曉沅以云南省理科第16名的成績考入清華計算機系。2016年8月,成績優(yōu)異的曉沅開始讀研究生。
近年來,隨著深度學(xué)習(xí)的興起,人工智能與文學(xué)藝術(shù)碰撞出炫目的火花。那在人類語言高度凝練的詩歌領(lǐng)域,AI表現(xiàn)如何?曉沅與他的導(dǎo)師孫茂松教授二人一拍即合,何不做一個自動作詩機器人?他們鄭重地為機器人取名九歌。曉沅解釋,《九歌》既是自己名字的來源,也是《楚辭》名篇,這一命名意在致敬屈原。
當(dāng)時,人工智能作詩,是比較小眾的研究領(lǐng)域。九歌研發(fā)團隊白手起家,他們借鑒詩歌寫作、語言學(xué)、心理學(xué)等方面的理論,設(shè)計出專門的模型結(jié)構(gòu)。
古詩文是篇章結(jié)構(gòu),講究上下文一致,前后呼應(yīng)。這是他們要解決的頭號難題?!耙灰箵P州月,凄涼萬里心。故鄉(xiāng)無限意,惆悵暮云陰?!边@首機器生成的五言絕句,看似文從字順,首尾卻露出馬腳,第一句“月”字點明時間為夜晚,第四句卻變成“暮云”,前后矛盾。嘗試不少思路之后,他們設(shè)計出了顯著性線索機制模型。在此模型主導(dǎo)下,上文的詩有了改進:“憶昔揚州月,于今又一秋。故人何處是,落葉滿汀洲?!?/p>
第二關(guān),扣題。對于自動作詩系統(tǒng),主題一般以用戶輸入的一個或多個關(guān)鍵詞來確定,如“春風(fēng)”“寒月”“相思”等?,F(xiàn)有的系統(tǒng)要么漏詞,要么將用戶給定的關(guān)鍵詞直接生搬硬套地嵌入生成的詩歌中。他們從心理語言學(xué)角度切入,提出了基于工作記憶模型的詩歌生成方法。該方法使用不同的記憶模塊存儲用戶輸入的不同關(guān)鍵詞和生成的詩文內(nèi)容。模型不斷動態(tài)讀取和更新“自我”記憶,以此來提升扣題的緊密度和靈活性。
攻下一個又一個難關(guān)后,2017年年底,九歌1.0版正式上線,系統(tǒng)內(nèi)錄入了從唐代到清代數(shù)千名詩人的30多萬首詩,能自動創(chuàng)作出集句詩、絕句和藏頭詩。那年年底,坐著輪椅的曉沅登上了央視舞臺。曉沅帶著自己的作品迎戰(zhàn)青年詩人,他的九歌會用“機智過人”四個字作一首藏頭詩,也能以“心有靈犀一點通”打頭作集句詩,且速度遠(yuǎn)超人類?;诰鸥瑁瑫糟溥B續(xù)兩年獲得中國計算語言學(xué)大會的“最佳系統(tǒng)展示獎”。一年半之后,九歌2.0版上線。曉沅說,通過改進算法,九歌2.0版既能作律詩,又能生成蕭瑟凄涼、憶舊感喟、孤寂惆悵、思鄉(xiāng)憂老、渺遠(yuǎn)孤逸五種風(fēng)格的絕句。
如今,九歌系統(tǒng)的訪問量已超過1000萬人次。九歌3.0新版本正在緊鑼密鼓地開發(fā)。曉沅透露,目前系統(tǒng)已錄入從魏晉南北朝到近現(xiàn)代所能找到的90萬首詩歌,未來,他們還計劃讓這個“腹有詩書”的機器人學(xué)會看圖作詩、觀視頻作詩,也將嘗試作現(xiàn)代詩。