摘 要:機關文書語料庫是實用文寫作教學進行運思訓練和語體訓練的教學資源庫,也是信息化時代實用文寫作者自主學習的基礎支撐。目前,語料庫的技術和理論使機關文書語料庫的建設和應用成為可能。
關鍵詞:機關文書語料庫 運思 實用文語體
建設機關文書語料庫,是筆者基于多年實用文教學的感悟而提出來的?;仡檶嵱梦膶懽鹘虒W的發(fā)展歷程,從“知識—例文—練習”這一傳統(tǒng)的教學思路到情景教學,再到重視運思訓練和語體訓練的一路變革,許多從事實用文教學的教師都做了不懈的努力。就教學對象——已具備一定語文基礎的高校學生而言,對其進行實用文運思訓練和語體訓練是提升其實用文寫作能力的有效途徑。然而,現(xiàn)實殘酷,依據(jù)筆者對部分高校(包括高職)公文寫作教學的調(diào)研,采用這種方法的寫作教學仍然無法擺脫教學過程枯燥和教學效果式微的尷尬處境。為什么被公認的有效的教學方法,卻無法成為“利器”?是實用文語體教學的缺省或偏誤是造成這種現(xiàn)象的主要緣由?,F(xiàn)階段部分教師將實用文語體教學作為實用文寫作基礎知識的一部分,講解多停留在語體知識的傳授上;也有教師把它作為文種的“語言要求”泛泛而談,缺乏實質(zhì)性、針對性的訓練。應當承認,這種狀況并非是教學對實用文語體的忽視,而是源于我們對實用文語體的模糊認知。截至目前,我們還沒有對實用文語體進行量化式的分析、總結,對實用文語體域場的依存性、表達的選擇性、語階的級差性和風格的伴隨性往往也是以個案的方式去講解和理解,沒能從宏觀的范疇中解讀。解決這些問題,真正實現(xiàn)實用文寫作教學的有效性,我們認為有必要建設機關文書語料庫。
一、機關文書語料庫的功能和作用
(一)語料庫及其作用
語料庫(Corpus)是指應用計算機技術對海量自然語言材料進行處理、存儲以供自動檢索、索引以及統(tǒng)計分析的大型資料庫。語料庫不僅僅是原始語料的集合,而且是有結構的,是標注了語法、語義、語音、語用等語言信息的語料的集合,這是語料庫區(qū)別于一般的文本數(shù)據(jù)庫的重要標志。迄今為止,我國已建成并投入使用的語料庫多達上百個,涵蓋多個類型和多方應用目標。如現(xiàn)代漢語通用語料庫、《人民日報》標注語料庫等。這些大型語料庫的建立為我國運用語料庫開展各種學術研究提供了寶貴的數(shù)據(jù)源。
語料庫發(fā)展之初,其用途主要體現(xiàn)在對語言現(xiàn)象以及語言本質(zhì)的研究上,如語言頻率統(tǒng)計、詞典編撰、詞匯搭配研究和自然語言處理等方面。隨著語料庫技術的發(fā)展,其功能和作用也躍出了語言學范疇,在其他領域如英語寫作教學等方面的應用也越來越廣。薛學彥(2004)在《語料庫與基礎英語教育》一文中就指出:語料庫不僅可為字典編撰提供可靠的依據(jù)、為教材編寫和大綱制定提供參照,還可為課件開發(fā)提供動態(tài)數(shù)據(jù),為英語外語教學誤用分析提供支撐等。
(二)機關文書語料庫的構建
構建機關文書語料庫,就是以機關文書為樣本構建語料庫,以樣本中的特殊詞語、常用句型、句式、修辭為研究對象,借助語料庫語言學的理論方法,對研究對象進行定量的統(tǒng)計、分析,系統(tǒng)地研究機關文書的語言運用特點,以期從語言學角度解讀機關文書的寫作技巧。樣本機關文書以文件規(guī)定公文(行政機關公文、中國共產(chǎn)黨黨的機關公文、軍隊公文)和常用行政事務文書為范圍。
機關文書語料庫又可依據(jù)內(nèi)容建立公文語料庫、事務文書語料庫兩個子庫。由于公文涉及到級別權限,因而在語料搜集、整理的過程中,應以國務院、省、地區(qū)三級單位某時段的公文為語料來源,規(guī)避涉密文件、行業(yè)文件。事務文書的語料搜集應注重體裁、題材的廣泛性和內(nèi)容表達的成效性。
從學習寫作的角度運用機關文書語料庫主要是通過分析語料,考察機關文書中的詞語運用情況,句型、句式及修辭的運用特點和表達效果。這樣,逐漸實證性地彰顯出實用文語體的特征及其學習掌握的要素。
一些學者近幾年一直致力于這方面的研究探索。張海龍(2008)的碩士學位論文就是以“行政公文寫作數(shù)據(jù)庫”為研究對象的。李忠朋、柳新華(2009)在《秘書之友》中也談到公文語料庫建設的問題。目前,柳新華、邵建國等學者致力于建設公文文獻數(shù)據(jù)庫,并通過這個語料庫開始進入到對公文語言的微觀分析,如分析講話稿中的修辭以及公文中的句子等。
二、機關文書語料庫的功能
(一)機關文書語料庫使教師微觀把握教學內(nèi)容成為可能
目前對實用文語體特征的闡述多數(shù)全憑直覺。實際上,我們對實用文語言的“準確、莊重、簡潔、規(guī)范”缺少量化的清晰認知。到底哪些要素可使實用文語言更加準確?哪些語言要素的運用會使文章更莊重?哪些要素使表達更簡潔?哪些更規(guī)范?什么樣的語境需要什么樣的語音、詞語、句式、辭式?和語言學語料庫關注點不同的是,寫作角度的語料庫分析需要考察語言各要素之間的配合和整體表達效果,需要考察語境類型的制約。寫作教學一直是汪洋中的一條船,不知四周的真實面容。語料庫為其提供了新的視角和思路,借助計算機技術,以海量的語言事實為研究對象,對其進行言語行為分析,從中可以找出語言運用的規(guī)律。而這恰是我們寫作教學多年來無法解決的詬病。由于語料庫可以統(tǒng)計詞頻、對比詞語搭配、追蹤新詞新語等等,這些功能促使教師不再單純地從鑒賞的角度關注范文。此外,詞語搭配研究將展現(xiàn)言語使用是否規(guī)范。大容量語料庫的問世為詞語搭配研究提供了客觀的量化分析依據(jù),使之更科學。教師在這個過程中得以梳理教學內(nèi)容。
(二)機關文書語料庫使寫作教師改變教學方法成為可能
前文已述,實用文寫作教師的教學方法多已由例文賞析式轉變?yōu)橐哉Z體、運思的訓練為主,但是教學效果依然不理想的現(xiàn)實促使我們進行深層次思考。其中,語體訓練的舉例式方法恐怕是教學中不能達到舉一反三效果的主要緣由。語料庫將使“實用文語體”的直觀性、量化性得以實現(xiàn),使實用文語體的整體面貌得以呈現(xiàn),從而使語體訓練具備了較強的操作性。
(三)機關文書語料庫為學生提供自主式學習的可能
語料庫不僅惠及教師,學生也可以利用語料庫實現(xiàn)高效的自主式學習。
語料庫使學生真正進入實用文的微觀世界。通過語料庫,學生可以自主提取人們一般審美認知中較能接受的表達;可以賞析到內(nèi)容相同而表現(xiàn)方法不同的寫作技巧;可以借助語料庫構建學生大腦中的“語料”。
三、機關文書語料庫的建設
機關文書語料庫構建的基本步驟為:規(guī)劃、語料采集、語料輸入計算機、校對、標注、賦碼、入庫。
(一)規(guī)劃和采集階段
語料庫的規(guī)劃階段首先要進行語料庫建設的必要性和可行性分析。語料庫中語料的采集并不是語言材料的簡單堆砌,而應該充分考慮材料的代表性和平衡性。為了使語料庫具有代表性,語料庫的選材結構就要具有平衡性。所謂平衡,不是指各種類型的語料在語料庫中占有相同的比例,而是指語料庫中各種類型的語料比例恰當,能代表它們對現(xiàn)實語言生活的影響。比如要考慮到公文文種類型、公文發(fā)文機關級別、公文文種使用頻度、事務文書的典型性等。理想的情況是,這種比例能和每種類型的語言對實際語言生活的影響因子相一致。為了追求這個目標,在機關文書語料庫選材時要預先設計分類指標,科學地確定每種類型的語料在語料庫中的比例。就公文而言,其語體文本的采集首先應按照行文方向分類選取。
(二)標注階段
語料庫同紙質(zhì)材料最大不同點的一個重要標志是機器可讀。為了充分發(fā)揮計算機運算速度快、計算能力強的特點,必須預先對語料庫進行標注。語料庫標注的過程是一個語言知識形式化的過程。語料庫的標注質(zhì)量以及標注深度直接影響到可從語料庫中發(fā)掘的信息的豐富性、準確性,決定了語料庫的可利用性和利用價值。機關文書語料庫的標注應該包括詞性的標注、語義的標注、句法結構的標注、篇章結構的標注等。何婷婷博士(2003)曾經(jīng)結合Leech的結論提出了標注的6項原則:1.原始語料和標記符號的數(shù)據(jù)獨立性原則;2.語料標注的公開性原則;3.語料標注的通用性原則;4.語料標注的折衷性原則;5.語料標注的一致性原則;6.標注符號的確定性原則。未經(jīng)標注、沒有做任何處理的電子文本語料庫被稱為生語料庫,其應用價值非常有限。基于機關文書語料庫的寫作指導性,語料庫需要人工標注句型、句式、修辭格等信息。
(三)檢索軟件的選擇與開發(fā)
語料庫檢索軟件很多,較成功的共享軟件有Wordsmith Tool v4、Concordance v3、Monoconcord以及WordCrucher等,自由軟件有Microconcord、Tact 2.1(基于DOS平臺)、Wconcord等。在語料庫建設的初級階段應根據(jù)需要使用現(xiàn)有的語料庫檢索軟件。但是,這些現(xiàn)有的檢索軟件不是萬能的,有可能不完全適用于實用文語體研究。在研究的過程中開發(fā)出適合于寫作學習的檢索軟件是語料庫研究的又一貢獻。
總而言之,機關文書語料庫的建設,是一個集計算機技術、實用文寫作、社會語言學于一體的開發(fā)研究項目,涉及許多專業(yè)技術,同時還需要各專業(yè)的有效配合。
參考文獻:
[1]薛學彥.語料庫與基礎英語教育[J].山東師范大學外國語學院學
報(基礎英語教育),2004,(4).
[2]何婷婷.語料庫研究[D].武漢:華中師范大學博士論文,2003.
[3]李忠朋,柳新華.公文語料庫建設淺談[J].秘書工作,2009,
(3).
[4]邵建國.基于語料庫的公文句式淺析[J].語文學刊,2009,
(12).
[5]丁善信.語料庫語言學的發(fā)展及研究現(xiàn)狀[J].當代語言學,
1998,(1).
[6]馮志偉.數(shù)理語言學[M].北京:知識出版社,1985.
[7]馮志偉.自然語言的計算機處理[M].上海:上海外語教育出版
社,1996.
[8]陳明瑤.語料庫與詞匯學研究[J].寧波大學學報(人文科學
版),2000,(1).
(王雪梅 河北廊坊 中國人民武裝警察部隊學院基礎部 065000)