李 睿,王衍軍
(1.廣東財經(jīng)大學(xué)外國語學(xué)院,廣東,廣州510320;2.暨南大學(xué)華文學(xué)院,廣東,廣州510610)
“20世紀計算機技術(shù)、信息技術(shù)和網(wǎng)絡(luò)技術(shù)的廣泛應(yīng)用給詞典編纂帶來了革命性的變革”(雍和明等,2015),紙質(zhì)詞典受到?jīng)_擊,電子詞典異軍突起。根據(jù)Lehr(1996:315),電子詞典分為在線詞典和離線詞典,其中離線詞典包括便攜式電子詞典(PEDs)和PC詞典等等。而較之離線詞典,在線詞典大多是免費的,并且無需安裝便可在電腦上使用(Pastor & Alcina,2010:313),這使得在線詞典成為電子詞典的發(fā)展主流?!坝⒚涝诰€詞典發(fā)展已經(jīng)非常成熟,創(chuàng)建了數(shù)量眾多、種類齊全、規(guī)模偌大無比的英語詞典庫”(雍和明等,2015)。然而,遺憾的是,國內(nèi)至今沒有一部外向型在線漢語學(xué)習(xí)詞典,以供學(xué)習(xí)漢語的非漢語母語者使用。
一部好的在線詞典,絕不應(yīng)該僅僅是紙質(zhì)詞典的翻版??v觀國內(nèi)近二十多年來出版的外向型漢語學(xué)習(xí)詞典,即便名氣甚大,但在留學(xué)生中的使用率卻不高①謝海江和李莉(2012:63-64)的調(diào)查涉及國內(nèi)出版的11本詞典(7本外向型,4本內(nèi)向型),它們分別是(外向型)《現(xiàn)代漢語學(xué)習(xí)詞典》《現(xiàn)代漢語常用詞用法詞典》《漢語常用詞用法詞典》《商務(wù)館學(xué)漢語詞典》《當(dāng)代漢語學(xué)習(xí)詞典》《HSK800詞詞典》《漢語水平考試詞典》和(內(nèi)向型)《現(xiàn)代漢語詞典》《新華詞典》《現(xiàn)代漢語規(guī)范詞典》《應(yīng)用漢語詞典》。而夏立新(2009:66)的研究則主要調(diào)查6部中級以上外向型漢語詞典,分別是《現(xiàn)代漢語學(xué)習(xí)詞典》《漢語常用詞用法詞典》《漢語8000詞詞典》《HSK水平考試詞典》《現(xiàn)代漢語常用詞用法詞典》和《商務(wù)館學(xué)漢語詞典》。。外向型漢語詞典使用情況的調(diào)查結(jié)果的確發(fā)人深省,隨著電子詞典用戶的激增,在線詞典的編纂與開發(fā)理應(yīng)引起足夠的重視。對于在線詞典的編纂,不能一味將紙質(zhì)版詞典“重現(xiàn)”,而是應(yīng)基于互聯(lián)網(wǎng)和電子媒介載體的特點,結(jié)合國外在線詞典編纂的理論與實踐,對傳統(tǒng)的詞典編纂模式加以變革。當(dāng)代功能詞典學(xué)作為“詞典學(xué)理論的最重要的發(fā)展之一”(Gouws,2012),很好地適應(yīng)網(wǎng)絡(luò)環(huán)境,對在線詞典的編纂有著積極的指導(dǎo)作用。文章擬將國外功能詞典學(xué)理論的前沿成果引入外向型在線漢語學(xué)習(xí)詞典的編纂、設(shè)計和構(gòu)建中,以期對我國本土在線漢語學(xué)習(xí)詞典有所借鑒。
當(dāng)代功能詞典學(xué)理論(Modern Theory of Lexicographical Functions,或Function Theory of Lexicography),是上世紀末本世紀初發(fā)展起來的不同于傳統(tǒng)詞典研究范式的詞典學(xué)理論,該理論的發(fā)展主要得益于丹麥奧胡斯大學(xué)詞典學(xué)中心的學(xué)者(參見Bergenholtz & Tarp,1995、2002、2003;Tarp,1994、1995、2008、2011、2012、2014a、2014b、2015a、2015b等)。功能詞典學(xué)理論已在歐洲的一些已上線的詞典項目中得到較好應(yīng)用,然而,令人遺憾的是,國內(nèi)學(xué)術(shù)界缺乏系統(tǒng)介紹功能詞典學(xué)理論的著作或譯介,也鮮有學(xué)者將功能詞典學(xué)理論的前沿成果引入漢語詞典的開發(fā)與設(shè)計中去。在中國對外漢語詞典編纂、在線詞典開發(fā)不足的情況下,功能詞典學(xué)理論可以為外向型在線漢語學(xué)習(xí)詞典的編纂與設(shè)計提供新的思路與技術(shù)支持。
Tarp(2008)在其專著《界于知識與非知識之間的詞典學(xué):學(xué)習(xí)型詞典通論》(Lexicography in the Borderland between Knowledge and Non-knowledge.General Lexicographical Theory with Particular Focus on Learner's Lexicography)中將功能詞典學(xué)理論的形成與發(fā)展劃分為兩個階段。第一個階段是對德國學(xué)者Wiegand及其“功能理論”中關(guān)于詞典的基本假設(shè)的發(fā)展與批判,在此基礎(chǔ)上形成了功能詞典學(xué)理論的理論框架。這一階段有三個代表性成果,其中,Tarp(1992)的博士論文是功能詞典學(xué)理論建立的首次嘗試,在此基礎(chǔ)上出版的《??圃~典學(xué)手冊》(Manual i Fagleksikografi,1994) 則基于功能詞典學(xué)的核心思想專門探討了功能詞典學(xué)理論視角下的??圃~典編纂,而Tarp(1998)《詞典學(xué)的獨立地位:分布結(jié)構(gòu)與用戶指向型視角的組成部分》(Leksikografi p?egne ben.Fordelingsstrukturer og byggedele i et brugerorienteret perspektiv)則進一步發(fā)展了該理論。第二個階段是功能詞典學(xué)理論的建立階段,在這一階段,功能詞典學(xué)理論的支持者在對Wiegand的批評中與Wiegand的“功能理論”分道揚鑣,功能詞典學(xué)理論逐步完善。
功能詞典學(xué)理論,顧名思義,強調(diào)的是詞典的功能。該理論(參見Tarp,2008;Fuertes-Olivera & Tarp,2014:Tarp,2014a)將辭書類工具的功能分為四類:(1)交際功能,旨在幫助用戶解決與交際相關(guān)的各類問題(文本的寫作、閱讀、翻譯和校正);(2)認知功能,旨在幫助用戶提升在某方面的知識;(3)執(zhí)行功能,給出切實的建議和指導(dǎo),以幫助他們實現(xiàn)一些與交際并不直接相關(guān)的活動;(4)解釋功能,旨在幫助用戶去理解非語言標識和符號?;趯υ~典功能的分類,功能詞典學(xué)理論將詞典以及其他辭書類參考工具視為實用工具,用來滿足“特定用戶”在“特定情形下”的“特定的即時信息需求”(Tarp,2014b:62)。這其中便關(guān)涉了三個重要的概念,即“特定用戶”“特定情境”及“特定的及時信息需求”。這三個概念實際上就是功能詞典學(xué)理論所提出的辭書功能四大要素中的三個詞典外要素。①“潛在用戶的類型”界定了“特定用戶”,“用戶查閱情境”界定了“特定情境”,而“用戶需求”則界定了“特定的及時信息需求”。這三個要素是詞典外要素,它們獨立于實際的詞典使用當(dāng)中,但它們卻是該理論構(gòu)建的重中之重。根據(jù)功能詞典學(xué)理論(Tarp,2008),辭書功能主要包括四大要素:(1)潛在用戶的類型;(2)用戶查閱情境;(3)用戶需求;(4)詞典輔助。對辭書功能四大要素的劃分與界定成為該理論對網(wǎng)絡(luò)詞典開發(fā)最有意義的理論貢獻之一?;趯θ齻€詞典外要素的充分分析,詞典編者便可以明確“特定用戶”在“特定情境”下所需的“特定的及時信息需求”,從而為用戶提供快速精準的辭書信息。這也是本文第2節(jié)將重點關(guān)注的問題。
隨著功能詞典學(xué)理論的不斷發(fā)展與詞典編纂技術(shù)的不斷革新,該理論在21世紀更加注重對網(wǎng)絡(luò)詞典的開發(fā),理論的發(fā)展主要致力于人性化、個性化的詞典檢索模式,從而避免“信息超載”。這種開發(fā)模式主要基于建立一個結(jié)構(gòu)復(fù)雜的大型數(shù)據(jù)庫、多樣性的信息通路、友好的界面設(shè)計等等。
在紙質(zhì)版時代,詞典空間一直是詞典學(xué)家最關(guān)注的問題之一,即如何在有限的空間里放入更多用戶需要的信息。然而,在多媒體和網(wǎng)絡(luò)環(huán)境下,詞典空間不再成為困擾;但是,信息超載隨之又成為詞典學(xué)家面臨的新問題。
功能詞典學(xué)理論強調(diào)辭書功能的四大要素,這四大要素是學(xué)習(xí)型詞典的“四個核心辭書類范疇”(Tarp,2008),即,潛在用戶類別(這里指學(xué)習(xí)者)、用戶查閱情境、用戶需求和詞典輔助。對這四個核心范疇的界定與區(qū)分,有助于詞典編者針對在線詞典的信息超載問題而實現(xiàn)詞典信息的合理調(diào)配。只有明確詞典所面向的潛在用戶群及其特征、用戶查詢詞典的即時情境與即時需求,詞典編輯們才能以最小的信息量精準推送詞典信息,避免信息冗余。然而這四個要素卻常常被詞典編輯們所忽視,降低了詞典的功用。下面將結(jié)合功能詞典學(xué)理論下的用戶類別、用戶情境和用戶需求這三個核心的詞典外要素,探討外向型在線漢語學(xué)習(xí)詞典為“特定用戶”在“特定情境”下所需的“特定的及時信息需求”所應(yīng)提供的詞典信息,從而整合外向型在線漢語學(xué)習(xí)詞典的應(yīng)收信息及其呈現(xiàn)模式。
在編寫一部詞典之前,首先要明確該詞典的“未來用戶”,并通過分析潛在用戶的特征來確定詞典應(yīng)收納的信息類型。Tarp(2008)為學(xué)習(xí)詞典的用戶特征的劃分設(shè)定了12條衡量準則,諸如,學(xué)習(xí)者的母語及母語水平、外語掌握水平、普通文化知識、外語學(xué)習(xí)動機、學(xué)習(xí)外語環(huán)境、教學(xué)方法等。這種對學(xué)習(xí)者的類別劃分可以讓詞典編纂者更加有針對性地為詞典遴選辭書信息。
對于外向型在線漢語學(xué)習(xí)詞典而言,其潛在用戶為學(xué)習(xí)漢語的非漢語母語的學(xué)習(xí)者,但是,這些用戶語言能力參差不齊,文化背景也千差萬別。遺憾的是,目前國內(nèi)出版的針對漢語學(xué)習(xí)的外向型詞典卻體系零散,沒有形成針對不同等級漢語水平的用戶的詞典系列。國內(nèi)出版的詞典要么以全概偏,即不同漢語水平等級的用戶使用同一本詞典,如《HSK水平考試詞典》;要么以偏概全,即僅出版針對某一個特定漢語水平用戶的詞典,如《商務(wù)館學(xué)漢語詞典》,其目標用戶僅僅針對中高級漢語學(xué)習(xí)者;或者《當(dāng)代漢語學(xué)習(xí)詞典》目標用戶僅是初級漢語學(xué)習(xí)者。顯然,不同漢語等級的學(xué)習(xí)者有著不同的信息需求,若是共同使用一本詞典,則會出現(xiàn)信息量不足或者冗余。而對于尚未覆蓋各個階段語言能力用戶的詞典,則會給學(xué)習(xí)者選購詞典造成困難,而隨著漢語學(xué)習(xí)者語言水平的不斷提升,詞典的更換與銜接也成為一個困擾?;诖耍惶走m用于不同漢語等級學(xué)習(xí)者的外向型漢語詞典無疑對漢語學(xué)習(xí)者幫助極大。
在網(wǎng)絡(luò)時代,無論是一部網(wǎng)絡(luò)詞典,還是一套網(wǎng)絡(luò)詞典系列,只要擁有友好的檢索界面,便可以在用戶的一個掌上設(shè)備上輕松實現(xiàn),而實現(xiàn)方式僅僅是在友好的檢索界面上設(shè)置若干個可供用戶選擇的按鍵以區(qū)分不同類型的詞典用戶。Tarp(2008)為學(xué)習(xí)詞典用戶劃定了12條衡量標準,這些標準有助于科學(xué)地區(qū)分不同類型的詞典用戶。限于篇幅,這里我們盡量簡化用戶類別的劃分,將詞典的用戶設(shè)定為英美國家的非華裔漢語學(xué)習(xí)者,將用戶類別簡單地以漢語語言能力為標準劃分為“初級”“中級”“高級”三類。不過,值得注意的是,在真實的在線詞典編纂中,劃分的標準和條件要復(fù)雜得多,這些因素是詞典編者在詞典編纂工作開始之前就應(yīng)設(shè)定完畢的。
詞典的預(yù)制界面為需求各不相同的學(xué)習(xí)者選擇適合自己的詞典提供了便利,用戶類別的界定可以有效地避免“信息超載”。比如,初級學(xué)習(xí)者需要更多英語(母語)的輔助,他們更多的是檢索一些基礎(chǔ)詞匯,并且他們大多只需要了解基礎(chǔ)詞匯的核心意義;而高級學(xué)習(xí)者往往較少地依賴母語,他們更加需要語法和語用的信息等。不過,用戶類別的界定還僅僅是第一步,因為同一個用戶在面對不同的查閱情境時仍然需要不盡相同的詞典信息。
用戶類型千差萬別,即使同樣的用戶在查閱詞典時也可能有著不同的查閱情境,從而產(chǎn)生不同的辭書需求。詞典,強調(diào)的是即時檢索,因而,詞典應(yīng)及時滿足這種具體的用戶需要,避免信息缺失或冗余。對于紙質(zhì)版詞典而言,有限的版面使得面面俱到地提供辭書信息難以實現(xiàn),而網(wǎng)絡(luò)版詞典雖然可以收納更多的信息,但“信息超載”只會加重用戶的檢索負擔(dān)。對詞典采取用戶情境的劃分,可以調(diào)和版面緊縮與信息超載之間的矛盾。
Tarp(2008)主要將用戶使用詞典的情境劃分為三大類:交際情境、認知情境、校對和批閱情境。交際情境是用戶所面對的主要情境,它還可以進一步分解成接收(reception)、產(chǎn)出(production)、翻譯(translation)等子過程。對于漢語學(xué)習(xí)者而言,這些困難或疑問主要在以下情境中發(fā)生,即,信息接收和信息產(chǎn)出。根據(jù)功能學(xué)理論,學(xué)習(xí)者因為信息接收(閱讀或“聽”)困難查閱詞典的情境為接收情境;因信息產(chǎn)出(寫作或“說”)困難查閱詞典為產(chǎn)出情境。用戶在不同的情境中會有著不同的信息需求,不同的需求應(yīng)該有著不同的信息呈現(xiàn)方式,奧胡斯大學(xué)詞典學(xué)中心的《會計詞典》便是這一設(shè)想的成功典范??闪钊诉z憾的是,國內(nèi)的在線詞典,無論是英語學(xué)習(xí)詞典,亦或是漢語學(xué)習(xí)詞典,都處于“一鍋粥”式的檢索模式。這種“一鍋粥”模式的主要特點是,數(shù)據(jù)庫即是詞典;所有用戶,無論何種外語水平等級,也無論是處于何種詞典查閱情境,均以同一檢索界面進入詞條呈現(xiàn)界面,并得到同樣的詞條呈現(xiàn)結(jié)果。這一模式的弊端顯而易見,為了滿足不同用戶的不同需求并避免信息缺失,詞典會不遺余力地、盡可能多地展示詞條信息,而用戶則需要自行“甄別”所需要的信息。功能學(xué)理論則將這一“甄別”過程留給詞典編纂者,為用戶“量體裁衣”,對特定用戶在特定查閱情境中所需要的特定信息進行選擇性呈現(xiàn),既避免了信息缺失,又能防止信息冗余。
這里仍以英美國家的非華裔漢語學(xué)習(xí)者用戶為例。即使在不考慮更細致地劃分用戶類別的情況下,這些漢語學(xué)習(xí)者不同情境中遇到的問題也是大不相同,表1①表1部分參考了Tarp(2008、2015b)的內(nèi)容。列舉了用戶在不同情境(接收與產(chǎn)出情境)下可能遇到的不同困難(A-I)以及他們需要求助的不同詞典類型(單語或雙語,L1-L2或L2-L1)。
表1呈現(xiàn)了特定類型詞典用戶在接收和產(chǎn)出兩種不同詞典檢索情境下可能遇到的問題及查求詞典時所對應(yīng)的語種。當(dāng)用戶在接收情境下查閱詞典時,他最可能遇到的是A、B、C、D四種問題,而當(dāng)他遇到這四種問題時,會檢索漢語(L2)字詞,而非英語字詞(L1),也就是傳統(tǒng)意義上所說的漢英雙語詞典(L2-L1)或漢語單語詞典(L2)。而當(dāng)用戶在產(chǎn)出情境時,他更可能會因為E、F、G、H、I這五種問題而查閱詞典。同樣,遇到F、G、H、I這四種問題亦會檢索漢語(L2)字詞。但是值得注意的是,問題E與其他幾類問題不同,當(dāng)用戶遇到問題E時,他會檢索英語字詞(L1),而非漢語(L2)字詞,因而他需要的實際上是傳統(tǒng)意義上所說的英漢雙語詞典(L1-L2)。這一分析說明了,對于處于接收情境而查閱詞典的用戶而言,一部漢英雙語詞典(L2-L1)便可滿足其需求,但是對于產(chǎn)出情境而言,僅僅一部漢英雙語詞典是不夠的,他同時可能還需要一部英漢雙語詞典(L1-L2)以解決可能出現(xiàn)的問題E。如果用戶是進行翻譯活動,那他們所遇到的問題則更為復(fù)雜。對上述不同情境下用戶所產(chǎn)生的不同問題的分析有助于詞典編者把握用戶的具體需求,可以說,對用戶需求的分析是一部在線詞典能否以最小信息量為用戶提供最大便利的核心。
外向型在線漢語學(xué)習(xí)詞典的主要功能為交際功能,這一功能重點解決用戶在接收和產(chǎn)出文本時遇到的困難。詞典對這些問題的解決體現(xiàn)在辭書信息的巧妙呈現(xiàn)和安排上,并非信息量越大越好。Tarp(2008)詳細列出了不同用戶類別和用戶情境下英語學(xué)習(xí)者作為詞典用戶的用戶需求,基于此,同時結(jié)合漢語學(xué)習(xí)中的實際情況以及表1中所羅列的用戶在接收與產(chǎn)出兩種不同情境下可能遇到的不同問題,我們列出了外向型在線漢語學(xué)習(xí)詞典的用戶①這里仍以英美國家的非華裔漢語學(xué)習(xí)者用戶為例,以便在表1的基礎(chǔ)上進行分析。在接收和產(chǎn)出兩種不同情境下可能需要的辭書信息(見表2)。表2中,下劃線所標注的是兩種不同情境下可能需要的相同類型的信息。
表1:用戶在接收與產(chǎn)出兩種不同情境下可能遇到的不同問題
由表2可知,用戶在文本接收和文本產(chǎn)出兩種不同交際活動中有著不同的辭書信息需求。即便是在文本產(chǎn)出中,對于英語和漢語兩個方向的子詞典也有著截然不同的需求。同樣,對于不同類別的詞典用戶,需求更是千差萬別。因而,區(qū)分用戶類別和用戶情境十分必要,即便僅僅是粗略地界定詞典用戶類別與情境,也可使用戶檢索詞典事半功倍?!耙诲佒唷钡木幣拍J胶托畔⒊尸F(xiàn)方式顯然不利于用戶快速準確地獲取所需信息,而這正應(yīng)是詞典學(xué)家應(yīng)該關(guān)注的問題。但是,即便如此,仍然有一些信息(下劃線的信息)交疊(如釋義、搭配等),這就意味著,如果分別獨立開發(fā)編寫“接收”型詞典和“產(chǎn)出”型詞典,會浪費大量的人力物力。在這種情況下,數(shù)據(jù)庫的優(yōu)勢顯露無疑。如果一個數(shù)據(jù)庫即是一部詞典,那么,想要編寫多少部詞典,就要創(chuàng)建多少個數(shù)據(jù)庫并充盈數(shù)據(jù)庫的信息。但是,如果一個數(shù)據(jù)庫是N部詞典,那么,只要設(shè)計科學(xué)有效的信息連接通道,就可以避免信息的重復(fù)錄入。數(shù)據(jù)庫的創(chuàng)建成為功能詞典學(xué)派對在線詞典編纂的新發(fā)展。
上述區(qū)分對詞典編纂有重要的指導(dǎo)意義,帶給我們四點啟示:(1)在不同的詞典查閱情境下,漢語學(xué)習(xí)者會有不同的辭書信息需求,比如接收情境下更多的是語義語用信息,而產(chǎn)出情境更多是的語法信息及同義詞辨析等。(2)一部詞典(如漢英詞典)不能滿足學(xué)習(xí)者的全部需求,學(xué)習(xí)者的查閱需求是一個連續(xù)統(tǒng),在寫作活動中,常常會先使用英漢詞典,再使用漢英詞典。(3)英漢詞典不能采用和漢英詞典同樣的編纂模式,因為學(xué)習(xí)者對于兩者的需求全然不同,如使用英漢詞典主要目的是尋找恰當(dāng)?shù)臐h語(L2)字詞,而使用漢英詞典則有著相當(dāng)豐富多樣的需求。(4)不同情境下需求的信息不盡相同,但仍有相當(dāng)數(shù)量的信息交疊。其中(1)~(3)關(guān)注的是用戶視角,旨在避免“信息超載”帶給用戶的不便;而(4)是詞典編者視角,對這一問題的關(guān)注旨在避免“信息重復(fù)錄入”而耗費不必要的人力物力。
表2:用戶在接收和產(chǎn)出兩種不同情境下可能出現(xiàn)的辭書信息需求
根據(jù)第2節(jié)所得到的啟示,本文提出編寫外向型在線漢語學(xué)習(xí)詞典的兩個基本原則:
(1)使詞典用戶可以以最快的速度得到所需的數(shù)據(jù);
(2)使詞典編者付出最小的努力。
Bergenholtz & Nielsen(2013)指出,當(dāng)今的詞典項目已不能離開數(shù)據(jù)庫。然而,市面上大多數(shù)的在線詞典都是多功能的,即一個數(shù)據(jù)庫便是一部詞典。多功能的詞典突破了紙質(zhì)版詞典因空間原因而簡化信息的原則,大大增加了信息量,但這種做法卻造成了信息超載,加重了用戶的認知負擔(dān),顯然不符合原則(1)。而即便將在線詞典設(shè)計成單一功能的詞典,也要面對原則(2)所提出的挑戰(zhàn)。比如,我們將表2中“接收欄”的相應(yīng)辭書數(shù)據(jù)錄入數(shù)據(jù)庫,那么我們便能夠得到一部基于某個特定數(shù)據(jù)庫生成的、針對某類用戶的“接收型詞典”,同理也可得到“產(chǎn)出型詞典”。這種做法滿足了原則(1),但是,由于兩部詞典有大量的交疊信息,分別獨立編纂開發(fā)顯然耗時耗力,從而有悖于原則(2)。
功能詞典學(xué)理論為我們提供了解決方法,即一個數(shù)據(jù)庫可以是多部詞典,每部詞典都是單一功能的(參見Bergenholtz & Nielsen,2013)。數(shù)據(jù)庫由許多“表”組成,表與表之間的關(guān)系成為數(shù)據(jù)錄入與提取的關(guān)鍵。對數(shù)據(jù)庫結(jié)構(gòu)的搭建①數(shù)據(jù)庫的前期結(jié)構(gòu)設(shè)計的科學(xué)與否會直接影響詞典的整體質(zhì)量。據(jù)此生成的數(shù)據(jù)庫,后期若是對其某些結(jié)構(gòu)進行修改則會困難重重,甚至要從頭來過,大大延誤詞典編纂工程的進展。因為若后期需要增添“域”,則會使其他“域”也要隨之調(diào)整,整個過程都將十分復(fù)雜。因此,在前期結(jié)構(gòu)的設(shè)計上必須要做足工作,詞典編纂方可開始。注意,本文為了簡化流程的原因僅設(shè)置了一個“自留域”,但詞典工程實際會設(shè)置多個“自留域”,以防止詞典編纂工程啟動之后,仍有初期設(shè)計未考慮到的“域”需要添加。在技術(shù)層面很大程度上要依賴技術(shù)人員,但是,詞典學(xué)家要確立“表”與“表”之間的關(guān)系。Bergenholtz & Agerbo(2015:6-7)指出,這種辭書信息構(gòu)建(lexicographical structuring)至少包括六個環(huán)節(jié):(1)挑選出囊括不同類型信息的“域”(field);(2)在數(shù)據(jù)庫的“域”中搜索;(3)選定在某部詞典中針對某類用戶在某種情境下所需呈現(xiàn)的“域”;(4)決定選定的“域”的呈現(xiàn)次序;(5)選定“用戶使用標簽”以便讓用戶更簡單的識別信息;(6)選擇紙質(zhì)版詞典的布局以及電子詞典的界面設(shè)計。
具體的操作方法細節(jié)參見本文圖1以及Bergenholtz & Agerbo(2015),本節(jié)將實例呈現(xiàn)辭書信息構(gòu)建的六大環(huán)節(jié)。不過值得注意的是,“域”的選擇與呈現(xiàn)對搭建數(shù)據(jù)庫結(jié)構(gòu)、后期數(shù)據(jù)錄入與提取都極為重要,而用戶類別、用戶情境、用戶需求等都是決定“域”的類型、數(shù)量、排列順序以及“域”間關(guān)系等的關(guān)鍵因素。
根據(jù)詞典的功能與性質(zhì),結(jié)合表1與表2,我們以高階在線漢語學(xué)習(xí)詞典為例,實例呈現(xiàn)檢索詞為漢語(L2)時對詞典的“域”劃分?!坝颉弊罱K被劃分23類②該部分參考了Tarp(2015a)的內(nèi)容。,這23類“域”的類型與數(shù)量、排序等列舉如下:
1.漢語詞目(一級詞目詞)
1.1 正字法
1.1.1 印刷體
1.1.2 手寫體
1.1.3 繁體
1.1.4 動態(tài)筆畫與筆畫數(shù)目
1.2 同形異義/音詞數(shù)目
1.3 語音
1.3.1 拼音標注
1.3.2 有聲發(fā)音
1.4 對等詞
1.4.1 精簡對等詞
1.4.2 更多對等詞
1.5 義項數(shù)目
1.6 詞性
1.7 漢語釋義
1.7.1 漢語釋義
1.7.2 英語對等詞
1.7.2.1 英語對等詞
1.7.2.2 英語對等詞與漢語詞目的區(qū)別
1.7.2.3 英語對等詞間的區(qū)別
1.7.3 漢語釋義的英語翻譯
1.7.4 更多釋義
1.7.4.1 更多漢語釋義
1.7.4.2 更多漢語釋義的英語翻譯
1.7.5 釋義的相關(guān)鏈接
1.7.5.1 漢語釋義鏈接
1.7.5.2 英語釋義鏈接
1.8 同義詞
1.8.1 同義詞列舉
1.8.2 同義詞辨析(L1)
1.9 反義詞、上義詞、下義詞
1.9.1 反義詞
1.9.2 上義詞
1.9.3 下義詞
1.10 語法信息
1.1 0.1詞法信息
1.10.2精簡語法信息
1.1 0.3語法信息相關(guān)漢語鏈接
1.11 搭配
1.1 1.1漢語搭配
1.1 1.2搭配的英語翻譯
1.1 1.3漢語搭配間的近義詞區(qū)分
1.1 1.4相關(guān)漢語搭配及區(qū)分
1.12 成語
1.1 2.1漢語成語
1.1 2.2成語的英語翻譯
1.1 2.3諺語和歇后語
1.1 2.3諺語和歇后語的英語翻譯
1.13 語用限制
1.14 語體標注與修辭標注
1.15 例證
1.1 5.1漢語短語例證
1.1 5.2短語例證的英語翻譯
1.1 5.3漢語句例
1.1 5.4句例的英語翻譯
1.16 圖例
1.17 各義項間關(guān)系
1.18 文化信息與背景知識(L1)
1.1 8.1首級信息(交際功能)
1.1 8.2次級信息(認知功能)
1.19 句庫(提取)
1.1 9.1漢語權(quán)威例證(設(shè)定點對點資
源提?。?/p>
1.1 9.2雙語例證
1.1 9.2.1本族語者的漢語例句
1.1 9.2.2本族語者漢語例句的英文翻譯
1.20 語義網(wǎng)絡(luò)
1.21 偏誤信息
1.22 推薦信息
1.23 自留域
限于篇幅,在此將不一一解釋設(shè)置每個“域”的具體操作。在確立了辭書信息構(gòu)建的“域”之后,設(shè)計友好的界面和連接通道①關(guān)于界面和連接通道的設(shè)計主要參考了Tarp(2015a)。便可以讓信息的錄入與提取成為現(xiàn)實。對于外向型在線漢語學(xué)習(xí)詞典系列而言,基于同一個數(shù)據(jù)庫和同一個檢索界面,該詞典可以囊括11部子詞典②實際情況要復(fù)雜的多,本文為了簡潔呈現(xiàn)詞典編纂過程與連接通道的設(shè)計,這里僅設(shè)置最基本的11部子詞典。。也就是說,用戶可以從檢索界面通過不同的按鍵進入這11部詞典中的一部,這個檢索界面實際上提供了11條連接通道,它們是:
I.漢語詞典(以漢語為檢索詞):
R1:初級水平 & 接收(閱讀)
R2:初級水平 & 產(chǎn)出(寫作)
R3:中級水平 & 接收(閱讀)
R4:中級水平 & 產(chǎn)出(寫作)
R5:高級水平 & 接收(閱讀)
R6:高級水平 & 產(chǎn)出(寫作)
R7:高級水平 & 漢英翻譯
R8:高級水平 & 英漢翻譯
II.英漢詞典(以英語為檢索詞):
R9:初級水平 & 產(chǎn)出(寫作)
R10:中級水平 & 產(chǎn)出(寫作)
R11:高級水平 & 產(chǎn)出(寫作)
關(guān)于每個子詞典所應(yīng)提取的信息類型在此不做詳述(可以參考表1與表2)。不過,值得指出的是,上述詞典中每部詞典所囊括的信息項目的類型都是詞典學(xué)家提前“預(yù)制”的,仍屬于內(nèi)省式的方法,即詞典編者早在編寫詞典前已經(jīng)對潛在用戶有了一個定位和分類,同時對這些用戶查詞時所進行的活動也預(yù)先做了分類。根據(jù)這些分類,詞典編者預(yù)制了相應(yīng)的連接通道,當(dāng)用戶選擇了自己的“身份”后,便可進入相應(yīng)的子詞典。預(yù)制通道不僅規(guī)定了所收信息項目的類型,也規(guī)定了信息呈現(xiàn)的具體方式,如隱藏式或外顯式、字體顏色與大小、是否含有超鏈接、超鏈接形式(詞典內(nèi)超鏈接或詞典外的網(wǎng)頁超鏈接)等等。
但是,不同的用戶仍然可能有著不同的信息需求或自身特殊的信息需求,針對這種情況,瑞典的萊克辛在線詞典(Lexin)為用戶提供了更為人性化的數(shù)據(jù)提取通道,即用戶可以在一個自定義界面通過自由勾選所需數(shù)據(jù)類型,來自定義詞條的微觀結(jié)構(gòu),創(chuàng)建“量體裁衣式”的人性化詞條。而Bothma(2011)更是提出了自適應(yīng)超媒體對詞典編纂的應(yīng)用設(shè)想,將前沿計算機技術(shù)、人工智能等應(yīng)用到在線詞典的開發(fā)中,為未來詞典的發(fā)展趨勢做了展望。最后,我們再回顧圖1,它展示了文章第3節(jié)所關(guān)注的關(guān)于外向型在線漢語學(xué)習(xí)詞典的構(gòu)建流程。
本文基于功能詞典學(xué)理論的最新研究成果,以外向型在線漢語學(xué)習(xí)詞典的編纂與構(gòu)建為例,探討如何將國外先進的詞典學(xué)理論與技術(shù)應(yīng)用于我國外向型在線漢語學(xué)習(xí)詞典的建設(shè)。根據(jù)功能詞典學(xué)理論,本文從對用戶類別與用戶情境的界定入手,層層遞進,以剖析“特定用戶”在“特定情境”下所需的“特定的及時信息需求”,從而分析出他們所需的辭書信息。
明確用戶所需的辭書信息有助于辭書信息的構(gòu)建,通過辭書信息構(gòu)建的六大環(huán)節(jié),可以初步搭建數(shù)據(jù)庫結(jié)構(gòu)。盡管數(shù)據(jù)庫的搭建需要詞典學(xué)家與計算機技術(shù)人員通力合作,但是詞典學(xué)家在數(shù)據(jù)庫結(jié)構(gòu)的設(shè)計以及后期信息的填充過程中起到?jīng)Q定性的作用。因而,詞典學(xué)家應(yīng)緊跟科技發(fā)展的脈搏,充分利用網(wǎng)絡(luò)平臺并積極吸收先進的理論方法,避免詞典信息不足與信息超載等在線詞典大量存在的問題,擺脫紙質(zhì)版詞典時代“一鍋粥”的編纂思路,從而為用戶提供友好的檢索界面以及快速精準的辭書信息。
文章尚存不足,僅對外向型在線漢語學(xué)習(xí)詞典進行了粗線條的理論構(gòu)建,對辭書信息構(gòu)建的細節(jié)描述的也不夠詳實等,僅求拋磚引玉,為我國外向型在線漢語學(xué)習(xí)詞典的編纂提供借鑒。