葛曉剛 姜寶欣
【摘要】現(xiàn)代手寫文書檔案主要包括印刷設(shè)備不普及的年代形成的行政文件、個人的隨筆日記等手稿和現(xiàn)場形成的會議記錄等。由于手寫的隨意性與書寫者字體的獨特性,往往造成該類檔案傳遞信息困難。為了方便利用,檔案工作者有時需要對手寫文書檔案進行識別。本文從查考資料的準備、識別技巧和分工方式三方面探究手寫檔案識別的有效方法。
【關(guān)鍵詞】文書檔案;繁體字;識別校對
一、精心準備查考資料
手寫文書檔案識別雖說是一項較為基礎(chǔ)的工作,但是要想漂亮完成以獲得優(yōu)秀成果,必須正規(guī)化對待,根據(jù)文獻類別的不同做好充分的準備工作。
(一)通用類查考資料的準備。1986年,在我國重新發(fā)表經(jīng)少量修訂后的《簡化字總表》以前,繁體字和異體字大量存在于人們的行文當中。所以當我們進行現(xiàn)代早期檔案的識別工作時,需要一些通用類查考資料來輔助識別,從而以簡體字的形式流暢地將檔案中的信息展示出來。由上海辭書出版社出版,張書巖主編的《簡化字、繁體字、異體字對照字典》以及由崇文書局出版,楊合鳴主編的《漢字簡繁正異對照字典》,都可以作為文書檔案文字簡體化的主要工具書。在識別的具體工作中,我們利用此類工具書主要采用偏旁部首的檢索方式,檔案中清晰規(guī)整的字可直接找出對應簡化字,較為模糊的字可以通過偏旁部首查對與其寫法接近的字并依據(jù)上下文確定該字。另外,如果手寫文書檔案形成于白話文尚未成熟的時期,可能會在行文中存在大量的古語體式,那么《王力古漢語字典》也可幫助檔案工作者提高識別效率與準確性。
(二)專業(yè)類查考資料的準備。檔案工作者還需要根據(jù)手寫檔案的內(nèi)容類別準備相應的專業(yè)類查考資料。例如識別專業(yè)檔案需要掌握相關(guān)的學術(shù)名詞才能達到最優(yōu)的識別效果;識別戰(zhàn)地日記需要知曉大量的地名;識別個人工作日記需要了解其所在單位的大致狀況。故而在識別現(xiàn)代手寫文書檔案的過程中,檔案工作者常常需要地圖、大事記、單位組織歷史沿革、專業(yè)名詞釋義詞典、相關(guān)人物志等多個類目的查考資料。在手寫文書檔案中,明確其中的人名、地名、時間、組織名稱和專業(yè)名詞,對于未來檔案的多方面利用尤為重要,這些查考資料的使用將大大提升手寫文書檔案識別的準確率。
二、靈活掌握識別技巧
識別字體模糊的現(xiàn)代手寫文書檔案,僅僅做好初步查考資料的準備,按部就班地識別很難達到理想的效果。在具體的識別過程中,需要檔案工作者具備較強的文字敏感度,能自然辨識出合理通順的句子,同時也需要較好的記憶力,能快速識別出之前已確認的文字詞匯。另外,檔案工作者還需快速適應手寫文書檔案的語言模式,以符合時代特征與檔案生成者個人書寫個性的思維邏輯來提高對檔案原件文字的識別準確率。
(一)巧妙運用漢語語法?,F(xiàn)代手寫文書檔案識別工作者在陷入識別困難時,不能只盯著一個字鉆研,要結(jié)合整句話甚至上下文去體會這個字應該是什么,從而減小識別難度。整體與局部相互依賴,結(jié)合整句話來識別一個字時,必須把以“主謂賓定狀補”為基本框架的漢語語法引入手寫文書檔案識別當中去,進一步鎖定未知字或詞的詞性范圍。但這種方法并不絕對,一般只在手寫文書檔案識別過程中起參考作用,由于部分手寫文書檔案生成者的書寫個性與隨意性,部分檔案并不完全遵循語法規(guī)則,故而字形依舊是識別手寫文書檔案的第一標準,檔案工作者需根據(jù)實際情況巧妙運用現(xiàn)代漢語語法結(jié)構(gòu)。
(二)通假字與錯別字的區(qū)分。在系統(tǒng)化的簡體字尚未完全普及以前,漢字書寫方面有許多當時與當下都使用但是用法不同的文字。當工作人員看到一個有書寫錯誤嫌疑的文字出現(xiàn)時,先要確定該文獻成文時間距今是否久遠,若久遠應該明確那個時代的文字書寫體系發(fā)展到何種程度,若與今差別較大,不能直接將該字定性為錯別字。在具體識別中,我們應該看前后文是否有同樣的字在同樣的用法中出現(xiàn),如果多次出現(xiàn),則該字在當時很可能是這一語義下的官方通用字,應具體查閱確定后在識別稿中顯現(xiàn)原字,并做一注釋加以說明,這樣既可高度還原稿件,又不影響利用者對文獻的理解。這些“通假字”的普遍特點就是與當今相同語義的文字有著一樣或類似的讀音。例如“那末”—“那么”,“皇恐”—“惶恐”,“火伴”—“伙伴”,“逃亾”—“逃亡”,“底”—“的”等。
(三)采集文獻常用字的筆法。在識別書寫不夠工整的手寫文書檔案時,常常會遇到一些難以識別的常用字,這些字在一定的前后文語境下能夠通過語言邏輯辨別出來,當出現(xiàn)在文獻其他地方時,由于語境的變換,這些字很可能難以再次識別或識別錯誤。為了提高文獻識別的質(zhì)量,檔案工作者在識別同一文獻過程中,應該對行文中出現(xiàn)頻率比較高的字進行采集匯總,制成簡易對照表以供互相傳閱,記憶常用字的筆法對整體文獻的識別有很好的串聯(lián)幫助作用。
三、合理運用分配方式
在識別不同年代、由不同人書寫的手寫文書檔案時,領(lǐng)導者需要對檔案工作者進行合理分工。這樣不僅會為檔案工作者減少壓力,同時也能降低文獻的識別難度,提高識別準確率。
(一)按文獻類型集中分配任務。檔案工作者的記憶是有限的,語言文字習慣的形成也需要時間,因此,工作組織者應該盡量將文獻歸類,將同一類型的文獻識別工作布置給同一個或同一批檔案工作者。這樣方便他們將有限的思維相對集中,更快地形成一種適合此類文書檔案識別的工作模式和思維方式,促使他們在較短的時間內(nèi)進入工作狀態(tài),逐漸提升在所識別領(lǐng)域的專業(yè)性,迅速提高工作效率和成果質(zhì)量。組織者依據(jù)需要識別手寫文書檔案群體的不同情況,可以按照文獻生成年代、文獻書寫人、文獻內(nèi)容領(lǐng)域以及文獻體裁等要素進行分類。
(二)多批次交換識別校對?,F(xiàn)代手寫文書檔案識別成果要想印發(fā)甚至出版,成為供人利用的成品,絕不能只經(jīng)過一次識別便草草了事。識別難度較低的手寫文書檔案至少需要對其進行兩次識別,難度較高的則需要進行三次以上的識別。在多次的識別過程中,由于個人難以克服的思維定式,組織者需要掌握文獻交換識別的原則。對手寫文書檔案進行第一次識別的檔案工作者要做到無差別的全文過濾識別,完畢后應交由他人進行二次識別。負責二次識別的檔案工作者可將識別重點側(cè)重于前者未識別出的文字和書寫相對模糊的文字。若需要對該手寫文書檔案進行三次識別,前一位工作者應將文獻中存在問題的地方標出,交由第三位識別人員。最后由專人對全部手寫文書檔案的識別內(nèi)容進行匯總,檔案工作者在匯總時可脫離原文獻,側(cè)重于考究識別成果的合理性、流暢性以及標點符號的使用,并將問題反饋于前幾位識別人,這樣便形成了一個閉合流程,可以最大限度地保證識別成果的質(zhì)量。
四、結(jié)語
檔案工作本身是一項平凡而枯燥的工作,細心認真是檔案工作者最重要的品質(zhì)之一,而為手寫文書檔案識別設(shè)計一套精細合理的方法,是檔案工作者尊重檔案、正視歷史的體現(xiàn)。本文從查考資料的準備、每一位工作者的識別方法、識別群體的工作流程三方面提出了一些可行的建議,希望能夠為檔案工作者提供一些思路。
【參考文獻】
[1]胡鴻杰.檔案文獻編纂學[M].北京:中國人民大學出版社, 2012.
[2]黎洪波,利來友.圖書編輯校對實用手冊[M].廣西:廣西師范大學出版社,2016.