王越,彭詠梅
(江西中醫(yī)藥大學 人文學院,江西 南昌 330004)
中醫(yī)藥是一個不可估量的寶藏,為人類的生命健康做出了不可估量的貢獻。近年來,中醫(yī)藥的發(fā)展越來越受重視,國家扶持中醫(yī)藥發(fā)展的力度持續(xù)加大。自“一帶一路”發(fā)展戰(zhàn)略提出以來,文化自信與文化走出去被提上議程,中醫(yī)藥文化作為我國五千年文明中一朵璀璨的奇葩,更是其中的杰出代表。中醫(yī)藥在過去幾千年的歷史長河中救黎民百姓于水火,現(xiàn)如今,我們依舊從中醫(yī)藥典籍中受益無窮。2003年非典型肺炎以及2019年爆發(fā)的新冠疫情,中醫(yī)經(jīng)方的療效顯著。新冠疫情的抗擊實踐展示了中西醫(yī)結(jié)合療法的獨特優(yōu)勢,為世界所關注。
社會更迭時代進步,守正創(chuàng)新才是中醫(yī)藥重煥“青春”的關鍵。為了在新時代謀求新發(fā)展、傳承精華,不斷探索中醫(yī)藥現(xiàn)代化道路,中醫(yī)藥必須適應且依托不斷更新的信息技術,融合先進科技和創(chuàng)新方法,走向國際舞臺。截至2020年3月,中國網(wǎng)絡新聞用戶規(guī)模達7.31億,較2018年底增加5 598萬,占網(wǎng)民整體的80.9%。與此同時,自媒體隨著網(wǎng)絡媒體的迅猛發(fā)展,充分激發(fā)了內(nèi)容的產(chǎn)出,并為現(xiàn)代信息技術等各行業(yè)提供了新的發(fā)展機遇。本文以此為視域,建立中醫(yī)藥文化多模態(tài)語料庫,分析中醫(yī)藥文化傳播特征,以期在后續(xù)助力中醫(yī)藥文化傳播的工作中,提出更多切實可行的建議和策略設計藍圖。
中醫(yī)藥多模態(tài)語料庫是集合中醫(yī)學、語言學、統(tǒng)計學及計算機科學等多個學科知識的交叉融合產(chǎn)物。簡而言之,中醫(yī)藥多模態(tài)語料庫是一個收集中醫(yī)藥語言材料的數(shù)據(jù)庫,也是關系型數(shù)據(jù)庫應用的擴展與延伸。該數(shù)據(jù)庫依托簡明的數(shù)學理論基礎和描述性的操作語言提高了系統(tǒng)開發(fā)的生產(chǎn)率,優(yōu)化了事務查詢管理技術,同時也提升了研究效率。相對于當前依然占據(jù)主體地位的文本語料庫,多模態(tài)語料庫在實時性、完整性和多樣性方面略勝一籌,更符合當下的學習需求。在軟件技術的輔助下,成其為當前單模態(tài)語料庫的補充方案。通過構(gòu)建中醫(yī)藥多模態(tài)語料庫,可使各界人士學習了解中醫(yī)藥,為中醫(yī)藥在國內(nèi)的傳承與創(chuàng)新發(fā)展的研究提供一定的參考依據(jù)。
在中國知網(wǎng)、萬方數(shù)據(jù)庫、維普數(shù)據(jù)庫等全國知名文獻檢索網(wǎng)站中,查詢2000年至今與中醫(yī)藥語料庫相關的文獻,高級檢索主題包括“中醫(yī)藥語料庫”或“中醫(yī)語料庫”,且文獻類型為全庫資源中的學術期刊以及學位論文等。最終所得的檢索式為:TI=中醫(yī)藥語料庫OR中醫(yī)語料庫。
自2000年以來,國內(nèi)學者開始對中醫(yī)藥語料庫方面的研究進行探索。通過CNKI可視化分析可知,國內(nèi)中醫(yī)藥語料庫研究大致可以總結(jié)為初步探索期(2000~2011),逐步發(fā)展期(2012~2014),繁榮增長期(2014~2017),并且在2017年發(fā)文量達到頂峰,到2018年進入持續(xù)回落期(2018~2020),再到穩(wěn)步回升期(2020至今)五個階段。聞永毅教授(2003)對中醫(yī)藥術語語料庫建設領域進行研究;隨后,程玲(2005)探討了在中醫(yī)英語語料庫視角下的創(chuàng)建及教學意義等相關研究;另有學者對中醫(yī)藥語料庫的應用進行研究(杜雪琴,2018;王世杰,2019);徐春捷等學者(2015)又基于中醫(yī)翻譯的框架,研究英漢翻譯平行語料庫的建立。當前中醫(yī)藥語料庫相關研究已經(jīng)涉及多個學科和領域,但還未出現(xiàn)中醫(yī)藥相關多模態(tài)語料庫的研究,需要做進一步的探討與補充。
Elan(EUDICO Linguistic Annotator)是由荷蘭馬普心理語言文字學科研所建設的一款語言標注工具。對于語言學者而言,因其適用范圍廣而采用。Elan能夠?qū)τ耙暫驼Z音等多種文件同時執(zhí)行構(gòu)建、剪輯、可視化和查找的標注任務,也可以提供聲音技術等多媒體后期制作功能,還能夠?qū)φZ句、手語、姿勢等語料進行相應的處理。研究決定以Elan軟件作為技術平臺,構(gòu)建中醫(yī)藥多模態(tài)語料庫。
本文中醫(yī)藥多模態(tài)語料庫采集內(nèi)容為微信、微博、抖音等自媒體APP中與中醫(yī)藥相關的視頻,包括中醫(yī)治病理念、中藥知識、養(yǎng)生小貼士,以及中醫(yī)藥典故等。
在本研究建立的中醫(yī)藥多模態(tài)語料庫中,標注層共有11層。標注信息如表1所示,包含中醫(yī)藥的表達方式、影像、圖像、音樂等類別。
表1 標注信息
如表1所示,根據(jù)Thibault和Baldry的多模態(tài)廣告語篇轉(zhuǎn)錄框架,分為旁白、獨白、對話、人物、中藥、人物&中藥、文字、圖片、文字&圖片、主觀音樂、客觀音樂。將視頻文件的音頻生成,將視頻與音頻文件同時導入ELAN軟件,再進行人工視頻標注,如圖1所示為使用ELAN軟件進行標注的界面。
圖1 標注界面
整個工作內(nèi)容分為以下四個方面:手視頻語料采集、語料的標注、語料專家校驗及語料庫的更新和存儲,中醫(yī)藥視頻語料庫的建立總體流程如圖2所示。具體內(nèi)容如下:
圖2 構(gòu)建流程圖
(1)確定采集內(nèi)容,對視頻進行采集與切分。首先將MP4文件導入ELAN標注軟件;其次按照時間段和鏡頭環(huán)境的切換對各個視頻進行切分。
(2)建立轉(zhuǎn)寫標注層。本研究在建立中醫(yī)藥多模態(tài)語料庫時,確定了11層的標注層級,以此為參考進行標注。
(3)進行校驗。再次對采集內(nèi)容和標注者信息等進行確認,并對標注內(nèi)容進行校驗。校驗的目的是為了提高語料庫的質(zhì)量,以保證語料庫的科學性。
(4)修正。最后再次核驗語料庫存在的問題,檢查是否存在標注時段有誤、標注信息誤填等情況,并進行修正,最終形成中醫(yī)藥多模態(tài)語料庫的雛形,將最終的MP4文件及標注轉(zhuǎn)寫語料EAF文件進行存儲,如圖3所示。
圖3 文件存儲
Elan軟件簡單易用易上手,整個標注操作可分解為以下五個步驟,以供參考:
(1)啟動ELAN6.3,點擊新建并導入視頻。
(2)點擊Tier并增加tier,輸入層名、參與人、標注人、日期等信息;選擇default,更改層屬性,并輸入新的標注信息。
(3)設置標注段。左鍵點擊進度條,拖動鼠標到目標位置,再次點擊進度條,形成一個標注段,雙擊標注段并進行命名。
(4)回放視頻語料,進行多次轉(zhuǎn)寫與標注工序。
(5)點擊View,選擇Annotation Statistics,可查看并得到各層數(shù)據(jù),點擊保存,如圖4所示。
圖4 數(shù)據(jù)輸出
本文從構(gòu)建背景、構(gòu)建意義、構(gòu)建方法、構(gòu)建步驟等四個方面對自媒體APP中醫(yī)藥多模態(tài)語料庫的構(gòu)建進行了分析探討。在當前自媒體蓬勃發(fā)展的背景下,利用Elan軟件對中醫(yī)藥相關視頻、音頻等語料進行切分、轉(zhuǎn)寫以及多層級標注,最終得以構(gòu)建中醫(yī)藥多模態(tài)語料庫?;诒菊Z料庫的構(gòu)建,期望未來可延伸至其他研究領域,輔助中醫(yī)藥相關交叉學科研究成果的拓展及應用,并對未來的中醫(yī)藥交叉學科研究給以啟發(fā)。
中醫(yī)藥多模態(tài)語料庫的構(gòu)建可輔助國內(nèi)中醫(yī)藥文化傳播實證研究。通過構(gòu)建自媒體APP中醫(yī)藥多模態(tài)語料庫,得出的分析結(jié)論能夠更加全面地從語言學角度呈現(xiàn)國內(nèi)媒體關于中醫(yī)藥的立場,加強對中醫(yī)藥傳播效果的調(diào)查,探索有利于中醫(yī)藥傳播的途徑和手段,從而為中醫(yī)藥的傳播研究提供助力,并在一定程度上為中醫(yī)藥文化傳播政策的制定提供證據(jù)支持和參考思路。
綜上所述,基于中醫(yī)藥多模態(tài)語料庫的模態(tài)多樣性與語境再現(xiàn)等特性,在未來可為中醫(yī)藥國內(nèi)的傳承與發(fā)展提供一定的創(chuàng)新嘗試,并提出相應的措施及建議,致力于提高大眾對中醫(yī)藥的關注度,提升中醫(yī)藥文化在國內(nèi)的影響力,從實證的角度促進中醫(yī)藥文化在國內(nèi)的傳播與發(fā)展,為講好“中醫(yī)”故事貢獻力量。