摘要:本課題研究的主要內容是漢語-斯瓦希里語反查詞典的編纂可行性與具體方法研究,因為有《斯?jié)h速查手冊》的事先編纂完成,加上在這過程中對斯詞類詞典結構的認識與掌握,加之在此過程中對軟件使用經驗的積累,對漢斯類工具書的編纂方法有一定認識,通過制定體例、詞條表格化、詞條義項分割、斯?jié)h轉向、文件合并、詞條排序(音序法升序)、人工調序、義項合并、整體編輯、完善成書,最終完成編纂?!稘h斯反查詞典》對斯瓦希里語的學習研究都有一定的幫助,對于東非方向旅行者而言,也是較為有益的參考書,也有利于漢語使用者研究東非的文化;對斯語者也有一定參考價值。
關鍵詞:斯瓦希里語;漢斯反查詞典;編纂;方法
漢斯詞典研究,處于起始階段,近年來,我國逐步加強文化外宣,也意識到漢斯詞典研究的重要性,外文出版社一直為此而努力。目前國內市場上還沒有漢斯類詞典,因此,我選擇漢斯反查詞典為研究方向,希望一番努力,能夠有所收獲。對于東非方向旅行者而言,也是較為有益的文化參考書,可以用于學習和簡單的翻譯,也有利于漢語使用者研究東非的文化;對于斯語母語者而言,也有一定的參考價值。
一、研究述評
從編篡《斯?jié)h詞匯速查手冊》過程中所接觸到的雙語詞典來看,多種語對的斯語雙語詞典都存在,而且是雙語雙向,且有部分存在在線版,如:斯俄/俄斯,斯意/意斯,斯英/英斯等。以斯英雙語為例,常見的斯英詞典有,Edward Steere(1894), A.C.Madan(1903),Charles W.Rechenbach(1967),TUKI(2001), 英斯詞典有,TUKI(2000),R.A.Snoxall & H.B.Mshindo(2012),單語斯語詞典有TUKI(2013),我國曾有一本1971年內部使用的《斯?jié)h詞典》 ,雖然沒有公開發(fā)行,但在院校專業(yè)內部使用廣泛,影響較大,可稱為中國現代斯語研究的基石。沈玉寧編纂過《新斯?jié)h詞典》,沒有紙質出版物。市場上沒有普通的漢斯詞典 ,因此,可以參考的材料很少,但《漢斯詞典》有很高研究價值。
二、研究問題
根據資源總量和可行性考量,我們定位于《斯?jié)h反查詞典》的編纂。由于我2017年就開始相關基礎性工作,因為,到2019年報吉林省高教學會科研項目立項,已有兩年鋪墊,等到中期考查時,漢斯詞匯對照表(合并前)已經制訂完,這是最為關鍵的一環(huán)。否則這個研究問題的設定如果從2019年開始,2021年就難以完成,因此,實際研究周期為四年。
三、研究策略
這本詞典編制任務艱巨,需要較為可靠的斯?jié)h詞典類工具書作為研究基礎,還要有可靠的方法策略,才能得以省時高效的完成,研究策略離不開對基礎的認識與把握,我們先說明實踐基礎,然后再闡述方法策略。
1.研究基礎。
《斯?jié)h速查手冊》含斯語詞條14800多條,屬于比較普通的類型,國際上多數斯語雙語詞典詞條數量多是這個數量上下,詞條數量較大,可以滿足一般斯語學習者的需求。這本詞典的藍本是2001年出版的Kamusi Ya Kiswahili-Kiingereza(TUKI),這本詞典是達累斯薩拉姆大學斯瓦希里語研究所編寫,與其相配的是English-Kiswahili Dictionary(TUKI)。但是由于在編寫過程中發(fā)現TUKI版斯英詞典里有部分義項錯誤,尤其是魚類名稱,我使用了Charles W. Rechenbach主編的Swahili-English Dictionary(The Catholic University of America Press, 1967)、《標準斯瓦希里語詞典》(TUKI單語)和國外動植物網站去糾正了其中的錯誤。因此,《斯?jié)h詞匯速查手冊》的義項的準確性較高,作為研究基礎是比較穩(wěn)妥。
2.策略制定。
因為有《斯?jié)h速查手冊》的編纂經驗,因此對斯語類詞典結構有一定深度的認識與掌握,對一些英斯詞典的詞條義項和信息類型及符號使用進行了學習研究,從而構思出《漢斯反查詞典》的義項信息序列架構,通過對原有藍本的詞條和義項信息進行刪減、重整和排序制定出新體例,這是具體操作實施的指導性本件。另外,《手冊》本身也涉及EXCEL和WORD的使用技巧,對文本處理軟件EXCEL和WORD使用經驗不斷積累促成對文本與表格的靈活轉換,這都對漢斯類工具書的編纂大有裨益。
3.具體步驟。
重新審視編纂過程,可以大致整理出下列步驟:制定體例、小規(guī)模試驗、詞條表格化、詞條義項分割、文件合并、斯?jié)h轉向、詞條排序、人工調序、義項合并、整體編輯、完善成書,最終完成編纂。
步驟1:體例制定。體例參考Kamusi Ya Kiswahili-Kingereza(TUKI)并進行了調整刪減。本手冊的詞條按照詞條拼音字母順序排列(從A到Z)。每一個字母之內,同一字母組合情況下,按音調四聲順序排列,多音字按實際讀音排列。每個詞條信息包括:詞條、詞性、義項、例句。如果一個詞具有多種詞性,一般按照nm.kt.kv.kl.ku.ki.這樣的順序。另外,對于外來語,在詞條的右上角標“﹡”,“<>”用于標注外來語源信息,如:<阿>,指來自阿拉伯語。
步驟2:小規(guī)模試驗。在真正開始項目的實質操作步驟之前,曾經做過小規(guī)模試驗,就是以單個字母的一部分為樣本,以詞典體例為照,進行切割加工,除去冗余信息,重新排列位置和順序,檢測軟件對漢字排列的特點和依據,熟悉軟件、程序和操作,繪制工作路線圖。
步驟3:詞條表格化。因為《斯?jié)h速查手冊》最終的存在形式是一個WORD文件,但由于Word文件里不容易進行單個詞條操作編輯,而且增刪排序不易,因此為了便于后期編輯與分工,我們設想的操作平臺是EXCEL,并把每一個字母的詞條單獨制成一個EXCEL文件(A.xls,B.xls…Z.xls),單獨放到一個文件夾待處理。操作方法是先選擇-復制《斯?jié)h速查手冊》WORD文檔里的表格,然后把光標放到新建EXCEL表格的左上角,點擊鼠標右鍵,出現一個菜單,選擇點擊粘貼,調整列寬到合適寬度,由于單個詞條的內容有可能很長,為了讓內容顯示完整,選擇所有詞條,點擊右鍵,選擇點擊“設置單元格格式”-“對齊”-自動換行。
步驟4:詞條義項分割。這里又分為兩步,首先,把詞條列復制粘貼。這里要求兩列詞條對應,然后,按照體例要求除去冗余信息,左列只留下詞條、詞性和例句,右列只留下義項。由于《斯?jié)h速查手冊》中的一些詞條一般都有多個義項,或多種詞性,因此,對于每一個詞條切割是以義項為準,切到具體詞。但是切割之前,按照義項的數量在該行下方插入相應數量的空行,然后再切割,最終結果需要保證右列詞與左列詞性及例句對應。大致包括七步,第1步:復制為兩列。第2步:加工兩列(左斯語+例子;右中文)。第3步:插入空行(以義項詞數為準)。第4步:復制文字行+粘貼填充。第5步:切義項第6步:去除冗余信息。第7步:雙列轉向。
步驟5:文件合并。把所有的文件合并到一個文件上,具體方法是把所有字母之下的詞條兩列合并,依舊為兩列。這里面需要注意的是拷貝的過程中,因為要進行多次,極有可能會在拷貝過程中,出現漏拷、錯行的情況,所以在選擇表格的時候,一定要選全、對齊。
步驟6:斯?jié)h轉向。對已經排列好的兩列詞條變換位置,把漢語部分通過粘帖調整到左邊,從而實現斯?jié)h轉向。斯?jié)h轉向看似簡單,實際上,能做到這一步,前面已有兩年時間的準備,這一步的完成基本上表明工程完成了三分之二。
步驟7:詞條排序。詞條排序主要是通過機器排序加人工調序兩個環(huán)節(jié)進行,機器排序選擇升序,然后,把不同拼音段分開成獨立文件。在這過程中使用的軟件是Microsoft Office的EXCEL組件,選擇需要排序的列(漢語列),選擇升序排列,根據提示選擴展選定區(qū)域,這樣雖然前面只選了一列,另一列的內容(斯語列)最終會與選定列調序后內容對應。
步驟8:人工調序。由于微軟辦公軟件組件EXCEL本身拼音識別能力缺陷,有些多音字如:調diào,tiáo,都歸到一個字母之下,需要人工將其挑出分開,放回相應字母的特定位置,因為這個的情況還比較多,因此,這項工作也比較復雜瑣碎。此外,還有字母組合相同而音調不同的多音字,對于它們,為了我們沒有調整,原因是為了方便查找,雖然不完全符合語音排序,但卻避免了字形不同的干擾,字形卻統(tǒng)一了,這在查找時也是一種便利。
步驟9:義項合并。這一項工作是到中期檢查時開始進行的,后面的工作目標比較明確,方法也非常清晰,我作為項目負責人,就把上面獨立后的不同字母文件進行任務分配,因為總共四人,而總共處理詞條(行數)達到36169條,所以,平均每個人做9千多條。任務開始之前,先對參研的三位學生進行線上培訓,三位學生能夠認真學習,然而由于語言隔閡(三位學生沒有斯語基礎),加上學生學習任務重、畢業(yè)論文、考研等事情干擾,難以完全專注,開展工作時遇到不少困難,但因為這階段任務難度不大,程序性強,單調瑣碎,借助寒假時間,把所有文件處理完畢。至2021年3月,詞條義項合并完成。
步驟10:整體編輯。把所有文件拷貝到Word文檔上,對格式進行調整。雖然仍然是一個隱形表格,但是這里操作難度較大,在發(fā)現問題時,需要回到EXCEL修改。比如:在把表格復制到WORD文件中時,分兩欄時,發(fā)現有些行沒完全顯示,左欄被遮擋,這是因為分欄時,表格寬度大于欄寬,兩個表格出現了重疊,這樣,即便是選用自動換行,依然不起作用,只能采用別的方法。
步驟11:完善成書。在文件添加頁碼,在前面加添目錄、前言、體例說明、符號說明。
書稿完善之后,本人仔細閱稿,還有專人審校。
以上是《漢斯反查詞典》具體編纂過程,事實上,部分環(huán)節(jié)在實施過程中并不那么清晰,經過反思,總結時重新調序,如步驟8,原本在步驟9之后,由于多音字問題沒有事先預見,是在文件分立義項合并完后才發(fā)現,因此,處理時就在現有基礎上修改,然而,最佳時機是在整個漢斯詞匯對照表按音序排列完之后對照多音字表細細甄別調整。
結語
《漢斯反查詞典》中文詞條總數21000多條,條數最多的字母為S,達到1900多條,少的為O,27條,由于漢語拼音自身特點,Ii,Uu,Vv幾個字母之下沒有詞條,根據1988年出版的《現代漢語常用字表》,常用字2500字,次常用字1000字,共3500字,利用語料庫在線網站 字詞頻率統(tǒng)計工具,統(tǒng)計《漢斯反查詞典》包含3754個漢字和6112個詞,因此,也能滿足一般漢語詞匯的語義查詢。本項目反映了使用一般的雙語詞典基礎上編制反查詞典的一般方法,因此,它的作用和價值不僅僅局限于本項目,對其它類似項目的組織、規(guī)劃和實施都有借鑒意義。
參考文獻
1 Charles W. Rechenbach. Swahili-English Dictionary. The Catholic University of America Press, 1967.
2 Madan, A.C. Swahili English Dictionary. Asian Educational Services. New Delhi,1903.
3 Snoxall, R.A. & H.B. Mshindo. Concise English-Swahili Dictionary. Oxford University Press, 2012.
4 Steere, Edward. A Handbook of the Swahili Language. Society for Promoting Christian Knowledge, 1894.
5 TUKI. Kamusi ya Kiswahili-Kiingereza Dictionary. Chuo Kikuu cha Dar es Salaam, 2001.
6 TUKI. English-Swahili Dictionary. Chuo Kikuu cha Dar es Salaam, 2000.
7 TUKI. Kamusi ya Kiswahili Sanifu. Oxford University Press, 2013.
作者簡介:鐘磊(1979.3-),男,漢族,安徽省泗縣人,講師,系副主任,碩士研究生,吉林外國語大學吉林外國語大學英語學院翻譯系,研究方向為翻譯、語料庫、詞典學。
項目:本論為是2019年度吉林省高教學會科研項目成果,項目編號JGJX2019D332
1.該詞典序言中說內部書版,出版社是人民畫報和外文出版社,1971年。
2.國內有專業(yè)雙語詞典。
3.http://corpus.zhonghuayuwen.org/resources.aspx