• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      記香港中大“甲骨文電子資料庫(kù)”①的創(chuàng)建與智能

      2020-12-02 19:38:24沈建華
      甲骨文與殷商史 2020年0期
      關(guān)鍵詞:資料電子部首

      沈建華

      (清華大學(xué)出土文獻(xiàn)研究與保護(hù)中心)

      自1899年河南安陽(yáng)小屯甲骨文發(fā)現(xiàn),至今已經(jīng)有120年,這是中國(guó)近代學(xué)術(shù)史上的重要事件。從甲骨文被認(rèn)定爲(wèi)商代王室遺物的那時(shí)起,它便成爲(wèi)專門(mén)的研究物件,真正進(jìn)入了上古史的學(xué)科。經(jīng)過(guò)幾代人的努力,甲骨學(xué)如今在文字學(xué)、歷史學(xué)、考古學(xué)及古代科技史等領(lǐng)域成爲(wèi)一門(mén)顯學(xué),尤其補(bǔ)充了上古史的文獻(xiàn)不足,對(duì)恢復(fù)殷代歷史面貌意義重大,在中華文明史上有著不可估量的重要價(jià)值,可以説是祖先留給我們20世紀(jì)一份最豐厚的珍貴遺産。

      如果説半個(gè)世紀(jì)以前,先輩們的研究與開(kāi)拓,奠定了甲骨學(xué)的理論基礎(chǔ);那麼1980年代以來(lái),陸續(xù)發(fā)表的海內(nèi)外七種著録書(shū),可以説代表了甲骨學(xué)進(jìn)入資料刊布的新階段。由胡厚宣先生主持編輯的《甲骨文合集》(以下省稱《合集》)相繼出版,這部巨書(shū),將分散於國(guó)內(nèi)外185種書(shū)刊、著録和尚未發(fā)表的公私收藏甲骨,經(jīng)過(guò)精心挑選彙編成13冊(cè),總計(jì)收録甲骨41 956片,對(duì)學(xué)術(shù)界的影響和貢獻(xiàn)不可估量。隨著河南安陽(yáng)新甲骨的發(fā)現(xiàn),1980年由社科院考古所編著的《小屯南地甲骨》上下編五冊(cè)先後出版,總計(jì)著録甲骨4 589片,可以説是建國(guó)以來(lái)數(shù)量最多的一次發(fā)現(xiàn),也是最重要的甲骨新資料。以上兩種材料,我們?nèi)渴斟h到了“甲骨文電子資料庫(kù)”。這一時(shí)期出版的海外甲骨著録書(shū),一種是李學(xué)勤、齊文心、艾蘭編著的《英國(guó)所藏甲骨集》(以下省稱《英藏》,圖録與釋文共四冊(cè)),1985年在國(guó)內(nèi)出版,總計(jì)著録甲骨2674片,這是當(dāng)年我們見(jiàn)到海外著録甲骨最多的一部大型甲骨書(shū)籍,我們也全部收録到了“甲骨文電子資料庫(kù)”。另外四種海外甲骨著録書(shū),我們只收録了其中部分甲骨,分別是《懷特等氏收藏甲骨文集》(1)許進(jìn)雄: 《懷特氏等收藏甲骨文集》一冊(cè)(1 915片),加拿大皇家安大列博物館1979年版。1 044片,《東京大學(xué)東洋文化研究所藏甲骨文字》(2)天理大學(xué)天理教道友社: 《天理大學(xué)附屬天理參考館甲骨文字》一冊(cè)(692片),天理大學(xué)天理教道友社1987年版。784片,《天理大學(xué)附屬參考館甲骨文字》(3)松丸道雄: 《東京大學(xué)東洋文化研究所藏甲骨文字》一冊(cè)(1 313片),東京大學(xué)東洋文化研究所1983年版。470片,《蘇德美日所見(jiàn)甲骨集》(4)胡厚宣: 《蘇德美日所見(jiàn)甲骨集》一冊(cè)(576片,附録6片),成都: 四川辭書(shū)出版社1988年版。135片。總計(jì),“甲骨文電子資料庫(kù)”收録海外甲骨5 107片。

      1980年代,隨著甲骨新資料的不斷公布添加,甲骨研究進(jìn)入一個(gè)黃金時(shí)代。未來(lái)的甲骨學(xué)發(fā)展要想深入研究,勢(shì)必要與科技結(jié)合,面對(duì)當(dāng)時(shí)海內(nèi)外出版著録的96 545片浩瀚甲骨資料,學(xué)者們?nèi)绾卧谝延屑坠侵h中快速準(zhǔn)確地檢索到所需的甲骨文字或異體字,並及時(shí)掌握每片甲骨上的刻辭資料,已經(jīng)成爲(wèi)一個(gè)難題。能否有一種功能猶如“百度”這樣的工具,檢索起來(lái)既簡(jiǎn)便又快捷,能夠使甲骨資料被更多不同領(lǐng)域的專業(yè)學(xué)者和學(xué)生所利用呢?這是當(dāng)時(shí)亟待解決的一個(gè)難題。

      1990年代初,科技雖然經(jīng)歷著日新月異的進(jìn)步,但是甲骨文字與電腦印刷體漢字仍然有著很大距離。衆(zhòng)所周知,甲骨文字有其複雜性與不確定性,加上卜辭各時(shí)代同字異體,給電腦檢索輸入帶來(lái)極大的困難。面對(duì)近十萬(wàn)片的甲骨刻辭如何入手整理?如何尋找一個(gè)檢索便利的途徑?如何利用科技電腦手段建立一個(gè)智能電子甲骨資料庫(kù)?這對(duì)智能電腦設(shè)計(jì)程序來(lái)説,當(dāng)時(shí)是一個(gè)技術(shù)上的巨大挑戰(zhàn),也是一個(gè)亟待研究的課題。

      前輩學(xué)者一直在努力創(chuàng)建甲骨文字和甲骨刻辭的檢索系統(tǒng),這是我們創(chuàng)建“甲骨文電子資料庫(kù)”的重要基礎(chǔ)。1931年唐蘭將甲骨文字分成21大類,以字形爲(wèi)綱進(jìn)行區(qū)分歸類整理,開(kāi)啟了甲骨文自然分類法,他是第一個(gè)吃螃蟹的人。由於受當(dāng)時(shí)同仁的影響,唐蘭整理的結(jié)果,性質(zhì)雖説是文字編,但與現(xiàn)在的文字編和類纂的編輯理念不同。不過(guò),唐先生必定沒(méi)有想到他這個(gè)創(chuàng)舉竟然嘉惠幾代學(xué)者,得到海內(nèi)外學(xué)者的認(rèn)可和歡迎。

      1970年代日人島邦男先生受唐蘭的影響,立足用自然分類法的部首,將所有卜辭形體與內(nèi)容緊密結(jié)合起來(lái),編纂了一部《殷墟卜辭綜類》(以下簡(jiǎn)稱《綜類》)甲骨文工具書(shū),以類相從,獨(dú)創(chuàng)了165部首系統(tǒng)。任何一個(gè)甲骨文字都可按這165個(gè)部首進(jìn)行檢索,打破了傳統(tǒng)以《説文解字》部首檢索的局限性,把不可辨識(shí)的字形都按自然分類法部首歸類檢索,大大提高了檢索效率,使非專業(yè)學(xué)者可以利用。它的價(jià)值是對(duì)於甲骨卜辭歸類達(dá)到了比較與綜合研究之目的,在甲骨工具書(shū)史上島邦男此書(shū)無(wú)疑是一個(gè)創(chuàng)舉。在那個(gè)資料書(shū)籍分散極缺的1970年代,《綜類》的問(wèn)世,成爲(wèi)海內(nèi)外甲骨學(xué)者不可替代的重要工具書(shū),使用之便捷,資料之集中,至今讓學(xué)界受益無(wú)窮。

      1980年代中期,吉林大學(xué)姚孝遂等人編纂了《殷墟甲骨刻辭類纂》(以下簡(jiǎn)稱《類纂》),這是繼島邦男《綜類》之後,所收甲骨著録資料最爲(wèi)完備的著作,其所收甲骨數(shù)量遠(yuǎn)遠(yuǎn)超過(guò)《綜類》。(5)《綜類》引用材料從1930年至1967年著録達(dá)65種;《類纂》引用7種海內(nèi)外著録匯編至1980年共計(jì)53 000餘片(含專著80餘種,論文50餘種)。特別是原形字臨摹精義入神而且與釋文並列,受到學(xué)界歡迎。《類纂》由於歷史條件及種種限制,經(jīng)多人手工編纂,難以避免在內(nèi)容上造成不少前後不統(tǒng)一、遺漏和錯(cuò)誤的地方。如何利用科技手段將甲骨文字輸入電腦,基本上達(dá)到資料類聚完整和統(tǒng)一,是甲骨學(xué)者最爲(wèi)企盼的效果。

      1988年由中國(guó)文化研究所所長(zhǎng)陳方正和劉殿爵教授率先策劃了先秦兩漢至南北朝傳世文獻(xiàn)電子資料庫(kù)。1991年10月我離開(kāi)東京,來(lái)到香港中文大學(xué)繼續(xù)完成與饒宗頤先生合作《甲骨文通檢》五冊(cè)分類索引。1996年我們?cè)讷@得出土簡(jiǎn)帛電子資料庫(kù)經(jīng)驗(yàn)的基礎(chǔ)上,由饒宗頤教授領(lǐng)銜,所長(zhǎng)陳方正教授策劃在香港建立“甲骨文電子資料庫(kù)”。在他的積極統(tǒng)籌推動(dòng)下,我們得到了香港政府RGC資助,在長(zhǎng)達(dá)七年時(shí)間裏建立了“甲骨文電子全文資料庫(kù)”。

      建立“甲骨文電子資料庫(kù)”,關(guān)鍵是必須要有一個(gè)合理的甲骨文字檢索系統(tǒng)。在檢索方法上我們參照了《類纂》的體例,最初建立了152部首,基本可以把所有的甲骨文字形歸納入部。我們收録了七部大型甲骨文書(shū)籍,設(shè)立了字形總表。這個(gè)總表相當(dāng)於一把打開(kāi)甲骨資料庫(kù)門(mén)的鑰匙,可以顯示甲骨原形和隸定釋文,通過(guò)字形表部首下的字,可以點(diǎn)擊到當(dāng)時(shí)所輸入的七部海內(nèi)外甲骨著録的全部釋文內(nèi)容,包括著録序號(hào)、正、反、臼辭、重文片號(hào)、綴合編號(hào),同時(shí)也可以選擇檢索到該甲骨文字或字詞,在七部書(shū)內(nèi)總計(jì)出現(xiàn)有多少片、多少次數(shù)。這個(gè)電子智能檢索效果可以毫無(wú)遺漏地顯示給讀者,替代《綜類》和《類纂》手工編輯的缺漏與不足。

      與《綜類》和《類纂》不同的是,我們的甲骨資料庫(kù)可以檢索到有關(guān)該字語(yǔ)境中的每一片甲骨正反臼所記録的完整內(nèi)容,而不是像《綜類》、《類纂》那樣切割後的辭條。其優(yōu)越之處是便於專業(yè)學(xué)者進(jìn)行更深入的研究,掌握更多的完整信息。要知道編纂這類大型甲骨工具書(shū),其工作繁冗瑣碎之程度難以想象,可惜《綜類》和《類纂》的作者沒(méi)有趕上那個(gè)科技電子時(shí)代,對(duì)於刻辭中出現(xiàn)的大量習(xí)語(yǔ)詞匯,最後不得不選擇放棄部分甲骨卜辭,而這個(gè)問(wèn)題今天智能電腦完全可以解決。

      初始工作,我們意識(shí)到首先必須對(duì)《類纂》每個(gè)部首和部首下的每一個(gè)甲骨字進(jìn)行重新核對(duì)、調(diào)整、分類、編號(hào)、增補(bǔ)、歸併、取消,從而爲(wèi)紛亂複雜的甲骨文字建立一套標(biāo)準(zhǔn)化、系統(tǒng)化、相對(duì)定型的排列體系。這樣我們分列出了6 000個(gè)甲骨字,其中對(duì)同字異體用A、B、C等來(lái)區(qū)分,這樣基本上涵蓋了所有刻辭使用的文字。與此同時(shí),我們爲(wèi)每一個(gè)甲骨字都設(shè)了一個(gè)對(duì)應(yīng)的電子內(nèi)碼,爲(wèi)的是在輸入甲骨釋文遇上造字和原形字時(shí),輸入內(nèi)碼即可顯示其隸釋或原形字形。在設(shè)計(jì)總表上,盡可能有不同功能之檢索,以適應(yīng)不同層次的讀者。

      因此可以説字表的正確與否,取決於我們對(duì)96 545片甲骨、140萬(wàn)字釋文的一次次覆核校對(duì)整理。從最初的校稿,到一次又一次的修改,其中的甘苦,非當(dāng)事人無(wú)法體會(huì)。對(duì)《類纂》部首表下3 763字,我和曹錦炎每一個(gè)字頭都沒(méi)有放過(guò),從最基本的工作做起,不厭其煩地將已經(jīng)著録發(fā)表的全部拓本(或照片)逐版逐條認(rèn)真核校一遍,做出新的釋文。曹錦炎先生曾經(jīng)是《類纂》的編者之一,對(duì)於甲骨學(xué)沈潛已久,有著豐富的經(jīng)驗(yàn)和學(xué)養(yǎng),是我們邀請(qǐng)的最佳合作者。我們對(duì)《類纂》字表部首下每個(gè)字形必須詳熟闇記,如果不具備這一基礎(chǔ),資料庫(kù)就不可能增補(bǔ)800個(gè)包括異體在內(nèi)的新字頭。字表中每增補(bǔ)一個(gè)字,都像在大海中尋針,工作量之浩繁,難以想象。進(jìn)行原拓片的核對(duì),由於不斷取放沉重的《甲骨文合集》我把手都累腫了,連吃飯我都舉不起筷子。

      除了??奔坠轻屛闹?,爲(wèi)了盡可能保證資料的完整性,提供更多的信息,我們又補(bǔ)充了甲骨綴合與重片的整理結(jié)果。我們利用1999年出版的《甲骨文合集補(bǔ)編》(簡(jiǎn)稱《補(bǔ)編》)、《合集來(lái)源表》和蔡哲茂先生的《甲骨綴合集》、《甲骨綴合續(xù)集》所提供的綴合資料,對(duì)於資料庫(kù)所輸入的七本甲骨著録,凡重片或綴合的甲骨片,逐一進(jìn)行校核整理,並在該片號(hào)後附上互見(jiàn)重片和綴合號(hào)碼,方便讀者使用和更好地掌握資料。

      從《補(bǔ)編》、《合集來(lái)源表》我們統(tǒng)計(jì)出《合集》綴合和遙綴大約640組,這個(gè)數(shù)字比蔡哲茂統(tǒng)計(jì)《合集》綴合有544組稍增加一些;重片就有601組。(6)蔡哲茂: 《甲骨綴合續(xù)集》,臺(tái)北: 文津出版社2004年版,頁(yè)5、83。通過(guò)對(duì)重片和綴合的整理和校核,對(duì)比現(xiàn)已公布的《合集》數(shù)字,可知實(shí)際甲骨應(yīng)該少於41 956這個(gè)總數(shù)字,《合集》真正數(shù)字加上重片大概不到41 000片。

      對(duì)於《合集》第13冊(cè)摹本中重見(jiàn)《英藏》甲骨拓本,二個(gè)釋文號(hào)我們同樣也采取了互見(jiàn)的辦法,供讀者參考。凡《補(bǔ)編》(釋文)第五、六冊(cè)原稿,甲骨綴合號(hào)誤寫(xiě)的,就直接修訂,不再逐一注釋。

      2000年初,我和曹錦炎合編的《新編甲骨文字形總表》(7)沈建華、曹錦炎: 《新編甲骨文字形總表》,香港: 香港中文大學(xué)出版社2000年版。由香港中文大學(xué)出版,總計(jì)收入甲骨文字4 071個(gè),包括異體總計(jì)有6 000餘字。內(nèi)記有《殷墟甲骨刻辭類纂字形總表校記》和《殷墟甲骨刻辭類纂字形總表之校訂與整理》,可以説凝聚了我倆多年的心血,記録了我們整理的過(guò)程。焚膏補(bǔ)拙,必有收穫。沒(méi)想到,此書(shū)出版不久就受到學(xué)界的歡迎和關(guān)注,有學(xué)者相繼撰寫(xiě)了書(shū)評(píng)。(8)陳煒湛: 《關(guān)於殷墟甲骨文的兩個(gè)基本數(shù)字》,《中國(guó)文物報(bào)》2003年1月3日第7版(學(xué)術(shù)研究欄);孫亞冰: 《〈新編甲骨文字形總表〉簡(jiǎn)評(píng)》,《中國(guó)史研究動(dòng)態(tài)》2003年第5期。

      這部《新編甲骨文字形總表》,實(shí)際上只是甲骨文電子資料庫(kù)的一個(gè)副産品而已,同時(shí)也是甲骨文字資料入庫(kù)檢索的一把開(kāi)門(mén)鑰匙。《新編甲骨文字形總表》每個(gè)部首下的甲骨文字,每個(gè)字形除了附本字表序碼之外,下面還附有《類纂》字形表的序號(hào)碼。我們都知道《類纂》上中下三冊(cè)和《甲骨文字詁林》四冊(cè)的字頭是同一序號(hào),這樣我們不僅可以檢索甲骨文電子資料庫(kù),而且同時(shí)可以檢索《類纂》和《詁林》文字內(nèi)容,多兩個(gè)檢索途徑,方便讀者更深入了解每一個(gè)甲骨文字各家考釋的歷史,作爲(wèi)輔助資料信息。

      2004年我收到美國(guó)哈佛大學(xué)一位研究商代宗教的四川籍年輕女博士的來(lái)信,感謝香港中大所建立的甲骨文電子資料庫(kù),信中説做夢(mèng)也沒(méi)有想到非專業(yè)的她,竟然如此快完成了商代祭祀研究博士論文,她的論文資料主要依賴香港中文大學(xué)甲骨資料庫(kù)進(jìn)行便捷檢索。我問(wèn)她如何找到卜辭的祭名?她説先是通過(guò)陳夢(mèng)家的《殷虛卜辭綜述》中的祭名指引,然後在甲骨資料庫(kù)中檢索祭名字詞,這樣便能如願(yuàn)找到所需資料。這封普通的來(lái)信,卻有著並不普通的信息,説明七年來(lái)我們建立的甲骨資料庫(kù)獲得了成功,已經(jīng)受到海外學(xué)界關(guān)注,不僅嘉惠專業(yè)學(xué)者,對(duì)不同專業(yè)也開(kāi)始施惠。

      23年過(guò)去了,回想我們1990年代初建立甲骨文資料庫(kù),披荊斬棘一路走來(lái),幾經(jīng)波折,遇到許多電腦技術(shù)上的障礙,困難超出我們的想象。21世紀(jì)電子科技有了翻天覆地的進(jìn)步,如今海內(nèi)外不少院校都在建立甲骨文字電子資料庫(kù),我相信比起23年前香港中大甲骨文資料庫(kù)在技術(shù)上會(huì)更成熟;隨著社科院、故宮等甲骨資料的不斷整理刊布,甲骨文資料庫(kù)的增補(bǔ)也會(huì)越來(lái)越完備。現(xiàn)在,香港中大甲骨電子資料庫(kù)已增加至9部大型甲骨書(shū)籍,輸入甲骨總計(jì)67 683片。但是,建立智能甲骨文資料檢索,仍還有許多方面的功能有待開(kāi)發(fā),需要我們做好坐冷板凳的決心。

      當(dāng)下各院校紛紛建立電子甲骨資料庫(kù),如上海華東師範(fàn)大學(xué)、河南大學(xué)等,臺(tái)灣、香港中大等地。我們不禁緬懷78年前唐蘭先生創(chuàng)立的“甲骨自然分類法”的理論,他所産生的後續(xù)影響與重要價(jià)值,對(duì)於古文字學(xué)的推廣與普及都貢獻(xiàn)巨大。這種檢索甲骨文字的便捷方法,受到初入門(mén)的海內(nèi)外甲骨學(xué)者,尤其是書(shū)法愛(ài)好者的極大歡迎,如今已經(jīng)越來(lái)越得到學(xué)界認(rèn)可和應(yīng)用。隨著科技發(fā)展進(jìn)步,我們相信電子甲骨文資料檢索功能會(huì)越來(lái)越完善進(jìn)步。

      附記: 本文曾於2019年10月18—19日在河南安陽(yáng)舉辦的“紀(jì)念甲骨文發(fā)現(xiàn)120周年國(guó)際學(xué)術(shù)研討會(huì)”上宣讀。

      猜你喜歡
      資料電子部首
      IQ Test
      弄清偏旁與部首
      The Apple of Their Eye
      Big Jim
      電競(jìng)種植記
      補(bǔ)
      系在繩上的“冬”
      E—TRASH Talk
      DIGITIZING THE OROQEN
      電子F1
      航空模型(2016年8期)2017-05-03 10:33:14
      南靖县| 博客| 韶山市| 多伦县| 宁晋县| 龙口市| 天镇县| 边坝县| 工布江达县| 旺苍县| 申扎县| 缙云县| 历史| 彭泽县| 雷山县| 博客| 田阳县| 阜新| 耒阳市| 启东市| 玛曲县| 洛隆县| 赣州市| 得荣县| 饶河县| 双流县| 临朐县| 金溪县| 赫章县| 博白县| 普定县| 上杭县| 睢宁县| 灵山县| 新和县| 西吉县| 青田县| 青海省| 寿阳县| 黑水县| 阿巴嘎旗|