趙生輝
(西藏民族學(xué)院管理學(xué)院,陜西咸陽,712082)
我國語言資源極為豐富,境內(nèi)現(xiàn)有五大語系的129 種語言。作為國家通用語言的漢語源遠流長、分布廣泛,使用人口眾多,漢語方言的種類和數(shù)量極其豐富,一般可以分為北方、吳、湘、贛、閩北、閩南、粵等方言區(qū),各方言區(qū)內(nèi)部的典型方言不勝枚舉。少數(shù)民族語言當(dāng)中的絕大多數(shù)也存在因地域的不同而出現(xiàn)的語音差異化現(xiàn)象,如壯族、侗語、土族語、哈薩克語有2 種方言,藏語、苗語、蒙古語、維吾爾語、佤語有3 種方言,黎語有5 種方言,彝語、朝鮮語有6種方言[1]。
近年來,隨著方言成為弱勢語言趨勢的不斷加劇,越來越多的機構(gòu)已經(jīng)認(rèn)識到通過建立數(shù)字化檔案方式進行方言保護的重要性,一些地區(qū)的語言文字工作機構(gòu)、檔案管理機構(gòu)在各自業(yè)務(wù)范圍內(nèi)開展了方言建檔方面的實踐探索。然而,由于方言建檔工作本身的復(fù)雜性,兩類機構(gòu)對這項工作學(xué)科屬性的認(rèn)識還沒有達成共識,存在著學(xué)科關(guān)系不清、協(xié)作程度不夠、任務(wù)交叉重復(fù)等問題。因此,從方言建檔工作理論基礎(chǔ)的角度剖析兩類支持性學(xué)科之間的關(guān)聯(lián)互動關(guān)系,明確各相關(guān)學(xué)科的職責(zé)定位,構(gòu)建跨學(xué)科相互協(xié)作的工作機制,是保證這項工作科學(xué)性和可持續(xù)性的重要舉措。
方言建檔是一項涉及多學(xué)科知識的復(fù)合性工作,根據(jù)我國學(xué)者和相關(guān)部門對這項工作學(xué)科屬性的認(rèn)識,我們可以大致將其分為語料開發(fā)和語言記錄兩種不同的學(xué)科視角。
第一,語料(Language Corpus)開發(fā)視角下的方言建檔工作。由于語言建檔與語言學(xué)研究的密不可分性,目前語言檔案領(lǐng)域絕大多數(shù)的研究都是語言學(xué)領(lǐng)域的學(xué)者或研究機構(gòu)從語料開發(fā)的視角推動的。該視角認(rèn)為語言檔案建設(shè)的主要目標(biāo)是為語言學(xué)科學(xué)研究提供基礎(chǔ)語料,因而側(cè)重于在語言學(xué)理論和知識指導(dǎo)下按照語言學(xué)規(guī)則有選擇、有目的地采集和整理語料資源。在實踐領(lǐng)域,我國的臺灣地區(qū)很早就已經(jīng)創(chuàng)建了一系列語言的數(shù)位典藏庫,如閩客語數(shù)位典藏庫,南島語數(shù)位典藏庫等等[2]。1997年4月,中央民族大學(xué)語言學(xué)系、電教中心和香港中國語文學(xué)會聯(lián)合錄制的“中國少數(shù)民族語言音檔”制作完成,它包括音系錄像和詞匯錄音兩部分內(nèi)容[3]。暨南大學(xué)文學(xué)院的范俊軍教授就少數(shù)民族語言瀕危語言有聲語檔建設(shè)問題發(fā)表多篇研究成果,主持了國家社科基金項目“中國瀕危語言有聲語檔建設(shè)的理論體系、實踐規(guī)程與技術(shù)準(zhǔn)則研究”[4]。中國社會科學(xué)院民族學(xué)與人類學(xué)研究黃行研究員主持國家自然科學(xué)基金項目“瀕危少數(shù)民族語言語音數(shù)據(jù)庫及聲學(xué)分析”。2008年,國家語言文字工作委員會啟動了“中國語言資源有聲數(shù)據(jù)庫建設(shè)”項目,調(diào)查收集當(dāng)代漢語方言、少數(shù)民族語言和帶有地方特色的普通話的實態(tài)、有聲語料,并進行科學(xué)整理、加工和有效保存,這是一項具有深遠意義的國家重大語言文字工程。2010年,云南省開始實施“云南少數(shù)民族語言文字資源數(shù)據(jù)庫”建設(shè)項目,旨在加強民族語言文字規(guī)范化、標(biāo)準(zhǔn)化和信息化建設(shè)的同時,記錄、搶救和保護少數(shù)民族的語言文字[4]。
第二,語言記錄(Language Documenting)視角下的方言建檔工作。持語言記錄視角的研究者主要是來自檔案管理領(lǐng)域,從檔案學(xué)專業(yè)背景看待方言建檔工作,認(rèn)為方言本身屬于社會記憶的組成部分,方言檔案建設(shè)的主要目標(biāo)在于全方位記錄語言現(xiàn)象而不是用語言學(xué)知識去解構(gòu)和解釋語言現(xiàn)象。浙江省檔案局從2011年開始率先進行方言語音檔案建設(shè)工作的試點,下發(fā)了《浙江省檔案局關(guān)于開展浙江方言語音檔案建檔工作的通知》(浙檔發(fā)[2011]18號),通過對浙江方言的語音、詞匯、語法以及由此延伸的說唱、語音故事、民間歌謠、戲曲等的整理建檔,建立內(nèi)容完備、體系健全的浙江方言語音檔案資料庫,使浙江方言得到有效系統(tǒng)的記錄傳承。該項工作分四個步驟進行:第一,開展普查。省檔案局組織對各市、縣(市、區(qū))檔案部門相關(guān)人員進行專業(yè)操作知識培訓(xùn),后由各市、縣(市、區(qū))檔案局組織開展地方方言資源普查;第二,制定文本。征集選定當(dāng)?shù)刈畹氐?、最老派、最正宗的方言語音發(fā)音人,會同語言專家對當(dāng)?shù)胤窖缘恼Z音、詞匯、語法等內(nèi)容進行整理,制定由400至500個左右當(dāng)?shù)胤窖猿S迷~匯、語句和語法組成的自選文本;第三,制作音檔。選定最具代表性的方言語音發(fā)音人(不少于2人),根據(jù)省檔案局統(tǒng)一的規(guī)定文本要求,結(jié)合自選文本內(nèi)容錄制語音,并可同時錄制視頻(視頻標(biāo)準(zhǔn)不作要求)。對錄制語音標(biāo)注國際音標(biāo);第四,整理歸檔。各市、縣(市、區(qū))檔案部門對地方方言音檔、文本進行整理歸檔。各地將具代表性的方言音檔匯交省檔案局,由省檔案局組織專家進行評估論證,對最具代表性的浙江方言,由省檔案館存檔[5]。目前,這項工作已經(jīng)在浙江全省順利開展,浙江地方特色方言數(shù)字化語音檔案體系初步建立,獲得國內(nèi)外媒體的廣泛關(guān)注和高度贊譽。
上述兩種視角分別反映了語言學(xué)、檔案學(xué)兩個學(xué)科對方言建檔這一問題的認(rèn)識,以各自學(xué)科的基礎(chǔ)理論為支撐,都具一定的科學(xué)性與合理性,也都存在各自的不足之處。例如,從語言學(xué)視角出發(fā)理解方言建檔問題具有語言學(xué)知識的支撐這一天然優(yōu)勢,能夠設(shè)計較為細致的語言檔案構(gòu)成體系,卻由于對檔案學(xué)理論和方法的不了解,無法有效保障語言檔案的數(shù)據(jù)質(zhì)量,無法有效滿足長期安全保存和共享需求,存在無法順利讀取的風(fēng)險。同時,在現(xiàn)有語言學(xué)知識指導(dǎo)下進行語言檔案建設(shè),也存在因為“先入為主”而不利于發(fā)現(xiàn)新規(guī)律、新現(xiàn)象的可能性。與之相對,從檔案學(xué)視角出發(fā)理解方言建檔問題的優(yōu)點在于語言檔案采集和保存處于系統(tǒng)、規(guī)范的控制之下,產(chǎn)生的語言檔案在真實性、完整性、可讀性等多個方面都可以得到保證,其缺點是檔案管理機構(gòu)對方言語言學(xué)知識的積累相對較少,對方言檔案未來的利用需求沒有深刻的認(rèn)識,會影響到方言檔案內(nèi)容選擇和質(zhì)量控制。因此,從方言建檔工作的學(xué)科關(guān)系出發(fā),構(gòu)建方言檔案跨學(xué)科協(xié)同建設(shè)機制就顯得尤為重要。
為了更好地分析方言建檔工作兩大支撐學(xué)科之間的關(guān)系,根據(jù)方言檔案的生命周期和層次支撐原理,構(gòu)建方言建檔的理論框架如圖1所示。其中,方言建檔工作被分為“方言建檔”和“方言檔案利用”兩個階段,方言建檔的過程實際上就是記錄和反映語言現(xiàn)象并將其轉(zhuǎn)換為語言檔案,方言檔案利用則是從多個角度實現(xiàn)方言檔案的社會價值。
圖1 方言建檔的理論框架
圖1 當(dāng)中,按照語言本體涉及的層面,將其劃分為發(fā)音人、語音兩個核心要素,與之相關(guān)的語匯、語法、語義、語用等信息是蘊含在語音當(dāng)中的,現(xiàn)有的語言學(xué)知識只是對語音信息所隱含知識的部分反映。方言建檔是將發(fā)音人信息、錄制的語音信息和對應(yīng)的文字或標(biāo)音符號進行歸檔保存的過程。根據(jù)層次支撐原理,數(shù)字化的方言檔案可以劃分為介質(zhì)層、編碼層、數(shù)據(jù)層、語言層、記憶層、文化層共6 個層面,底層支撐上層,上層依靠下層,構(gòu)成一個逐層支撐的層次結(jié)構(gòu)框架。其中,介質(zhì)層是指語言檔案必須依附的物理載體,例如保存數(shù)字檔案的磁性材料或光電材料;編碼層是指信息在介質(zhì)上的存儲方式,如使用1和0 構(gòu)成的字符串序列;數(shù)據(jù)層是指信息按照一定的邏輯結(jié)構(gòu)保存和管理方式,例如信息元數(shù)據(jù)的結(jié)構(gòu)等等;語言層是指數(shù)據(jù)所對應(yīng)的語言的表達方式和邏輯關(guān)系;記憶層是指語言所表達的事物和內(nèi)容;文化層是指所表達的內(nèi)容對社會的整體價值和意義。方言檔案的利用主要有語言學(xué)科學(xué)研究、事件檢索與利用、文化信息檢索與利用三個方面。方言檔案經(jīng)過語料轉(zhuǎn)換以后成為支持語言學(xué)研究的基礎(chǔ)資料,通過語料發(fā)現(xiàn)語言所蘊含的語音、文字、語法、語義、語用等方面的規(guī)律和知識。如果在方言檔案采集過程中,再將方言口述歷史(Oral History)與方言檔案結(jié)合起來,則檔案當(dāng)中所記述的事件也可以作為重要的參考資源。如果將方言檔案看作是文化信息資源的一類,則需要滿足從多個角度進行的文化信息檢索需求。
從圖1 的理論框架不難看出,方言建檔工作語言學(xué)視角和檔案學(xué)視角的主要區(qū)別在于語言學(xué)知識在檔案建設(shè)過程中參與程度和發(fā)揮作用的時間點不同。語言學(xué)視角下的方言檔案在采集之前就要考慮到語音、語義、語法、語用等語言學(xué)研究的需求,整個檔案建設(shè)過程具有明確目的和特定服務(wù)對象,以為語言學(xué)科學(xué)研究提供基礎(chǔ)語料為目標(biāo),語言檔案建設(shè)與語料開發(fā)合二為一,語言檔案可以直接作為原始語料直接使用。檔案學(xué)視角下的方言檔案建設(shè)在初期只需要少量語言學(xué)知識,側(cè)重于語言現(xiàn)象本身的全面記錄,其服務(wù)對象具有廣泛性,對語言檔案的深度語言學(xué)分析在轉(zhuǎn)換為語料之后進行。除了為語言學(xué)研究提供語料來源之外,語言檔案的利用途徑是多方面的,人類學(xué)、文學(xué)、藝術(shù)學(xué)、文化學(xué)等學(xué)科的研究人員也可能從語言檔案當(dāng)中找到有用的資料。
盡管語料本身也具有部分檔案屬性,為了更好地處理語言學(xué)和檔案學(xué)在語言檔案建設(shè)過程中的關(guān)系,必須將“語料”與“語言檔案”兩者嚴(yán)格區(qū)分開來?!罢Z料”是語言實際使用過程中真實出現(xiàn)過的語言材料;“檔案”是人類社會運行過程中直接產(chǎn)生的具有保存價值的原始記錄。兩者都具有真實性特征,都必須是某一語言的使用者真實說過的語言信息,都要經(jīng)過分類整理后長期保存,在特定情況下可以相互轉(zhuǎn)換。但是,“語料”開發(fā)的目的是支持語言學(xué)研究,按照語言學(xué)知識原則進行組織的?!皺n案”建設(shè)的目的是實現(xiàn)對語言現(xiàn)象的全方位記錄,需要考慮多學(xué)科的綜合性利用需求,按照檔案學(xué)知識原則進行組織。
綜上所述,語言學(xué)和檔案學(xué)是方言建檔工作的兩大基礎(chǔ)學(xué)科,兩者共同參與方言檔案建設(shè)的全過程。從嚴(yán)格的定義來看,從語言學(xué)視角進行的絕大多數(shù)方言建檔工作實際上屬于方言語料開發(fā),并非真正意義上的方言檔案建設(shè)。從檔案學(xué)視角來看,方言建檔工作的核心任務(wù)是完成對語言現(xiàn)象的全方位記錄,滿足多學(xué)科、多用途的利用需求。此外,語言學(xué)知識可以為語言檔案初期規(guī)劃提供指導(dǎo),而語言檔案本身也是語料的重要來源,經(jīng)過加工和轉(zhuǎn)換就可以滿足語言學(xué)研究的需要。
為了理順方言建檔工作當(dāng)中的語言文字工作機構(gòu)和檔案管理機構(gòu)之間的關(guān)系,確保方言建檔工作的科學(xué)性和一致性,對我國方言建檔工作跨學(xué)科協(xié)同機制的建立建議如下:
第一,明確檔案管理機構(gòu)在方言建檔工作中職能定位。目前我國方言檔案建設(shè)主要由各級語言文字工作機構(gòu)負(fù)責(zé)推動,項目的目標(biāo)大多是建立語料庫或者語言資源庫,對數(shù)據(jù)長期可靠保存方面的需求考慮不夠。而公共檔案管理機構(gòu)主要收集和保存各類機關(guān)單位的公文和重要資料,對方言檔案的采集和保存方面的職能還沒有明確的制度規(guī)定。建議制定語言檔案方面的政策法規(guī),明確公共檔案管理機構(gòu)在語言建檔工作中的職責(zé)范圍
第二,建立檔案管理機構(gòu)、語言文字工作機構(gòu)的協(xié)同工作機制。具體而言,在語言檔案建設(shè)整體規(guī)劃過程中,由兩類機構(gòu)共同參與制定兼顧多領(lǐng)域需求的工作方案,克服分立運作的不足之處,對語料的數(shù)據(jù)質(zhì)量和語言檔案的語言內(nèi)容提出要求;資源的采集由兩類機構(gòu)分頭負(fù)責(zé),按照統(tǒng)一的規(guī)范進行語言檔案采集和語料采集;語言檔案和語料的保存由檔案管理機構(gòu)集中負(fù)責(zé);語言檔案的深度加工和分析由語言文字工作機構(gòu)負(fù)責(zé),語言檔案的利用由檔案管理機構(gòu)主要負(fù)責(zé),語言文字工作機構(gòu)提供語言支持。按照上述模式就發(fā)揮了語言文字工作機構(gòu)語言學(xué)知識的優(yōu)勢,也發(fā)揮了檔案學(xué)機構(gòu)信息保存能力的優(yōu)勢,實現(xiàn)了兩類機構(gòu)優(yōu)勢互補,合作共贏,如圖2所示。
圖2 方言建檔工作跨學(xué)科協(xié)同機制原理圖
第三,建立方言建檔工作的標(biāo)準(zhǔn)和規(guī)范,推動方言檔案資源的共建共享。目前,我國還沒有專門針對方言建檔問題制定的國家標(biāo)準(zhǔn),各地根據(jù)自身情況建立方言檔案的過程中可能出現(xiàn)數(shù)據(jù)格式不統(tǒng)一、語言檔案不能相互調(diào)取或共享等問題。在這一領(lǐng)域,國際開放語檔聯(lián)盟OLAC(Open Languages Archives Community)[6]制定有語言檔案建設(shè)的多個規(guī)范性文件,另外我國學(xué)者針對瀕危語言數(shù)字化檔案建設(shè)問題也曾制定過一些瀕危語言田野調(diào)查和記錄方面的操作規(guī)范[7]。目前,迫切需要根據(jù)我國語言建檔工作的實際,制定出通用版本的語言檔案建設(shè)標(biāo)準(zhǔn)規(guī)范。
總而言之,方言建檔工作是語言學(xué)和檔案學(xué)相互交叉產(chǎn)生的新的研究和實踐領(lǐng)域,迫切需要來自語言學(xué)和檔案學(xué)的學(xué)者妥善處理學(xué)科之間的關(guān)系,發(fā)揮各自的長處,建立科學(xué)合理的協(xié)同工作機制,保障方言檔案的數(shù)據(jù)質(zhì)量,滿足社會各界對方言檔案的利用需求。
[1]孫宏開.中國的語言[M].北京:商務(wù)印書館,2007(6).
[2]黃成龍,李云兵,王鋒.紀(jì)錄語言學(xué)——一門新興的交叉學(xué)科[J].語言科學(xué),2011(3):259-269.
[3]趙生輝.中國少數(shù)民族語言電子文件集成管理的體系架構(gòu)研究[D].武漢:武漢大學(xué),2012.
[4]范俊軍.語言調(diào)查語料記錄與立檔規(guī)范[M].廣州:暨南大學(xué)出版社,2011.
[5]浙江省檔案局.浙江省檔案局關(guān)于開展浙江方言語音檔案建檔工作的通知[EB/OL].(2011-11-03)[2013-09-18].http://www.zjda.gov.cn/jgzw/ywzd/whjs/201210/t20121017_195017.html.
[6]范俊軍.少數(shù)民族瀕危語言有聲語檔案建設(shè)初探[J].中央民族大學(xué)學(xué)報(哲學(xué)與社會科學(xué)版),2011(1).
[7]范俊軍.少數(shù)民族瀕危語言有聲語檔案建設(shè)再探——OLAC技術(shù)規(guī)范及其適應(yīng)性[J].西北民族大學(xué)學(xué)報(哲學(xué)與社會科學(xué)版),2011(3).
[8]范俊軍.少數(shù)民族瀕危語言有聲語檔案建設(shè)三論[J].北方民族大學(xué)學(xué)報(哲學(xué)與社會科學(xué)版),2011(6).
[9]李素琴,楊炳鈞.云南少數(shù)民族瀕危語言有聲語檔建設(shè)方法探討[J].大理學(xué)院學(xué)報(哲學(xué)與社會科學(xué)版),2011(5).
[10]王桂洪.方言語音檔案建設(shè)芻議[J].中國檔案,2008(8).
[11]徐越.浙江方言音檔的構(gòu)建及預(yù)期價值[J].浙江檔案,2012(1).