姜永超 郭 翀
摘 要:《說文解字義證》信息化過程中處理異體字是個難題,采用保真和整理相結(jié)合的原則能確保全書的系統(tǒng)性并方便計算機(jī)處理。這種方式能為古籍信息化中異體字處理提供借鑒。
關(guān)鍵詞:《說文解字義證》 信息化 異體字
古籍信息化能“將計算機(jī)對語料的形式化處理和專家對語料的分析判斷結(jié)合起來,充分發(fā)揮計算機(jī)和人的各自的特長,從而推動漢語史研究的迅猛發(fā)展?!盵1](p60)古籍信息化,首先必須實(shí)現(xiàn)文本字符的信息化,在此基礎(chǔ)上,才能利用計算機(jī)的優(yōu)勢對古籍資源信息處理以輔助漢語史研究。本文以桂馥《說文解字義證》(以下簡稱《義征》)為例討論其處理原則和具體方法。
一、《義證》中的異體字
學(xué)術(shù)界對異體字的看法不一,我們采用裘錫圭的觀點(diǎn)[2],把異體字分為狹義異體字和部分異體字。
《義證》對許慎《說文解字》(以下簡稱《說文》)做了全方位的研究,在文字訓(xùn)詁學(xué)領(lǐng)域具有重要地位;《義證》保存的異體字不僅類型多樣,而且數(shù)量巨大:首先,《說文》一書本身存在不少重文。許慎指出的就有“古文(壁中書)”“籀文(大篆)”“奇字”“或字”“今字”等多種類型,還有一些異體字沒被《說文》列入重文而是分立字頭;其次,桂馥廣泛征引古籍,而這些古籍在流傳過程中又產(chǎn)生了不少異體字。所以,處理好《義證》能為其他古籍信息化中異體字的處理提供借鑒。
二、處理原則及方法
針對《義證》信息化過程中存在的異體字問題,我們采用保真與整理相結(jié)合的原則。包括《義證》在內(nèi)的古籍信息化,主要是輔助語言學(xué)家進(jìn)行漢語史研究的,我們應(yīng)該盡量保持古籍在形式上的原貌。然而,《義證》存在的大量異體字本質(zhì)上屬于手寫文字,規(guī)范程度很低,如果追求對這類字形的保真,漢字字庫恐怕永遠(yuǎn)難以滿足需要,也根本無法實(shí)現(xiàn)真正意義上的信息化處理。所以,我們應(yīng)在保證內(nèi)容系統(tǒng)性和正確性的情況下對不規(guī)范的異體用字進(jìn)行整理。
(一)《義證》信息化過程中,碰到一改變字形就影響上下文意思或全書系統(tǒng)性時,必須保持原本字形而不必改為古籍通用形式。這包括如下幾種情況:
1.強(qiáng)調(diào)本字
(1)斯—廝
斯,析也。從斤,其聲?!对姟吩唬骸案运怪!弊只蜃鳌皬P”?!f昭曰:“析薪曰斯,炊烹曰餐?!保ǖ谒氖恚?/p>
“斯”和“廝”都有“分”義,它們是一對異體字。例(1)是強(qiáng)調(diào)“斯”的本義,所以韋昭提及的“斯”必須保留字形不能用“廝”替代。
2.《說文》的重文
《說文》中的重文分同部重文和異部重文兩種情況:
1)同部重文是指重文和正字在同一部首內(nèi)的異體字,如:
(2)糂—糣—糝
糂,以米和羹也。一曰粒也。從米甚聲。桑感切。(第二十卷)
糣,籀文糂。從朁。(第二十卷)
糝,古文糂。從參。(第二十卷)
許慎先列出“糂”字,隨后列出該字的重文“糣”“糝”。例(2)中的古文或籀文字形,如果改為通用的“糂”,則會破壞全書系統(tǒng)性,讀者將不知所云,計算機(jī)檢索結(jié)果也會出現(xiàn)問題。
2)許慎在《說文》中明確指出的重文有1163個。但是還有許多本為異體的字卻把它們當(dāng)作不同的詞分別加以分析和解說。這種與正字不在同一部,但實(shí)際是異體的字就是異部重文,如:
(3)鯁—骾
鯁,魚骨也。(第十一卷)
骾,食骨留咽中也。(第四卷)
這兩個詞前一個是名詞用法,后一個是動詞用法。體用同稱是古人用字的習(xí)慣,它們應(yīng)當(dāng)是同一個詞。段玉裁在《說文解字注》中曾經(jīng)考證出二百余處異部重文。比如木部中“楙”,解釋為:“楙,木盛也?!毕伦⒃唬骸按伺c艸部茂音義皆同,分草木耳?!睂τ谶@類異體字我們也應(yīng)當(dāng)保留其原貌。
3.用以互訓(xùn)
(4)樛—朻
樛,下句曰樛。從木翏聲。吉虯切。下句曰:“樛者與下文朻字訓(xùn)?!薄グ福簶?、朻二字,同聲相通。(第十六卷)
“樛”和“朻”是組異體字,當(dāng)它們互訓(xùn)時,不能將它們統(tǒng)一成一種字形,否則就會讓讀者迷惑不解,也給日后計算機(jī)處理造成不便。
4.強(qiáng)調(diào)形體差異
(5)罪—辠
罪,捕魚竹網(wǎng)。從網(wǎng)、非。秦以罪為辠字。徂賄切。捕魚竹網(wǎng)者。徐鍇引《詩》:“畏此罪罟。”又《瞻卬》:“罪罟不收?!眰髟疲骸霸O(shè)罪以為罟?!鼻匾宰餅檗f字者。本書辠字云:“秦以辠字似皇字,改為罪?!保ǖ诙恚?/p>
(6)逾—踰—愈—俞—癒
逾,