車宇玲
語料庫(Corpus)是是選擇能代表一種語言特點的自然發(fā)生的語言文本的集合實證主義和經(jīng)驗主義為基礎(chǔ)的語料庫語言學(xué),起源于20世紀(jì)60年代的英美國家(Sinclair,1991)。護理英語所涉及的內(nèi)容非常廣泛,包含有放射、助產(chǎn)、口腔、公共衛(wèi)生等不同學(xué)科,要把中國傳統(tǒng)醫(yī)學(xué)推向世界,但是護理英語目前為止沒有一個完整齊全的語料庫,教師無法找到相應(yīng)學(xué)科的語料庫,其應(yīng)用于教學(xué)也即無從談起。
1 護理英語的特點
護理英語人才培養(yǎng)新模式首要解決的問題是人才培養(yǎng)目標(biāo)的準(zhǔn)確定位。樹立科學(xué)的教育質(zhì)量觀,把臨床技能、實踐能力、職業(yè)素養(yǎng)、創(chuàng)新精神培養(yǎng)協(xié)同發(fā)展作為衡量教育質(zhì)量的根本目標(biāo)。護理英語詞匯量大、結(jié)構(gòu)復(fù)雜術(shù)語過長,是當(dāng)前護理英語教學(xué)重、難點。護理英語具備以下特點:
1.1 護理醫(yī)學(xué)詞匯豐富有趣
醫(yī)學(xué)英語專業(yè)詞匯和術(shù)語大部分來源于拉丁語和希臘語。拉丁語詞匯豐富有規(guī)律,比如,拉丁 sub-(在…下面)于是就有了 suf- suffocation(窒息)和sup- suppository(栓劑),一個詞根的學(xué)習(xí)可以舉一反三,帶動一組相同詞根的學(xué)習(xí),但是護理英語術(shù)語偏長 ,過于復(fù)雜,這與中醫(yī)的四字語有沖突,護理英語語料庫勢在必行。
1.2 護理英語與中醫(yī)英語的結(jié)合
護理英語覆蓋面非常廣,單詞也較為復(fù)雜,學(xué)生很難從把握學(xué)習(xí)進度。護理學(xué)習(xí)要求加強學(xué)生查閱外文文獻(xiàn)的能力。護理英語語料庫的范圍很小,在資料庫中能搜索到的也是中醫(yī)的語料庫,對于護理英語學(xué)科涉及的很少,中醫(yī)英語和護理英語雖然是同意學(xué)科,卻很難融合在一起。
2 護理語料庫的建立初探
2.1 語料庫的規(guī)模
語料庫起源于20世紀(jì)60年代的英美國家(Sinclair,1991)。關(guān)于語料庫的三點基本認(rèn)識:語料庫中存放的是在語言的實際使用中真實出現(xiàn)過的語言材料;語料庫是以電子計算機為載體承載語言知識的基礎(chǔ)資源;真實語料需要經(jīng)過加工(分析和處理),才能成為有用的資源。筆者調(diào)查早期文獻(xiàn)發(fā)現(xiàn),大多數(shù)研究者認(rèn)為語料庫規(guī)模越大越好。隨著社會的發(fā)展,語料庫的不斷增大,大量的信息使得檢索越來越困難。所以,能夠根據(jù)自身實際建設(shè)語料庫建立固定規(guī)模的語料庫才是最適合自己的語料庫。大多數(shù)人認(rèn)為構(gòu)建語料庫是一件非常費心費力的事情,而且很多人不知道從何處著手。所以,結(jié)合實際情況,按需求構(gòu)建一個小型中醫(yī)英語和護理英語語料庫以方便自己的教學(xué)和科學(xué)研究工作。
2.2 語料庫的來源和選擇
要收集符合條件的文本,要建立的學(xué)習(xí)型語料庫,保證語料的真實性就要分析的學(xué)生的真實語言能力。護理語料可以從大量的在線語料資源、光盤資料和實際操作中收集,這些使語料庫的建設(shè)和擴充變得非??旖荨>W(wǎng)上語料豐富,可以運用各種引擎手段如Google,百度等去收集,也可以運用一些數(shù)字和電子圖書館來收集你需要的資料。筆者收集語料庫是護理英語專業(yè)學(xué)生的教材、翻譯、口語和實踐課。語料來自教材內(nèi)容中的各種疾病以及外科、婦科、兒科和基礎(chǔ)醫(yī)學(xué)等方面,當(dāng)然這些都不是書本上的知識,書本上的知識不算是語料庫的。筆者通過記錄,錄音等方式記錄學(xué)生的原始語料,再把這些原始材料轉(zhuǎn)化為文本,以確保文字詞匯的準(zhǔn)確性,真實性和完整性。
2.3 語料的標(biāo)識
標(biāo)識分為兩類:一類是對文本的性質(zhì)和特征進行標(biāo)識,另一類是對文本中的標(biāo)點符號進行標(biāo)識。大多數(shù)的語料庫研究者都認(rèn)為,任何語料庫都需要標(biāo)識。把收集到的語料整理好,如口語,筆錄,期刊等。把標(biāo)記信息通過語言編碼用多媒體數(shù)據(jù)庫標(biāo)記,統(tǒng)一命名以方便日后搜索查詢。
護理英語語料庫(Nursing English Corpus,以下簡稱NEC)分為純文本和標(biāo)記模塊。標(biāo)記模塊主要包含來源,檢索日期,類型等。經(jīng)過標(biāo)識的語料庫可以廣泛應(yīng)用于護理英語教學(xué)甚至是中醫(yī)英語教學(xué),經(jīng)過標(biāo)識的語料庫變得井然有序,隨時可以查詢。接著是借用詞性標(biāo)注軟件來搜索,筆者使用的是geniatagger,這個軟件可以進行詞性標(biāo)注和進行命名實體識別,使用方法:
在geniatagger所在的文件夾下,直接命令行執(zhí)行: .\geniatagger.exe <輸入文件路徑> 輸出文件路徑。
語料庫經(jīng)過標(biāo)識后儲存起來,簡單小型的語料庫算是完成了。語料庫以真實的面目為護理英語教學(xué)提供了一個平臺。語料庫的建立看起來很復(fù)雜,實際上它可以用于護理英語的教學(xué),為老師和學(xué)生提供相應(yīng)的查詢資源。其次,護理英語語言語料的研究以及大量語料收集,能夠幫助護理學(xué)習(xí)者和研究者進行全面的提高和掌握。
總之,迎合新時代的需求,護理英語語料庫的建立就顯得非常重要。作為語料庫的建立者和使用者,我們應(yīng)該認(rèn)識到,護理英語語料庫的建立和完善,為我們學(xué)習(xí)護理英語帶來了意想不到的效果,但是我們也不能完全依賴語料庫而忽略了護理英語的真實性,只有更好的利用語料庫,結(jié)合實際情況,按需所求,我們才能更好地建立和使用語料庫。
(作者單位:廣西中醫(yī)藥大學(xué)賽恩斯新醫(yī)藥學(xué)院)