• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      模塊結(jié)構(gòu)驅(qū)動(dòng)的甲骨字場(chǎng)景預(yù)測(cè)

      2019-09-10 07:22:44金園園焦清局
      河南科技 2019年4期
      關(guān)鍵詞:復(fù)雜網(wǎng)絡(luò)場(chǎng)景拓片

      金園園 焦清局

      摘 要:未知甲骨字的語(yǔ)義破譯是甲骨學(xué)研究的重要內(nèi)容之一,也是歷史學(xué)家研究甲骨文遇到的最大瓶頸。隨著甲骨文拓片出土以及相關(guān)研究文獻(xiàn)的增多,甲骨文數(shù)據(jù)呈現(xiàn)海量化和系統(tǒng)化。大規(guī)模甲骨文數(shù)據(jù)的出現(xiàn)為利用計(jì)算機(jī)技術(shù)破譯未知甲骨字的語(yǔ)義提供可能,但現(xiàn)有的破譯未知甲骨字語(yǔ)義的方法卻寥寥無(wú)幾。本文充分利用現(xiàn)有甲骨文數(shù)據(jù)的海量化和系統(tǒng)化特性,根據(jù)拓片信息構(gòu)建甲骨字網(wǎng)絡(luò),并使用網(wǎng)絡(luò)的模塊特征分析甲骨字的場(chǎng)景。本文構(gòu)建的網(wǎng)絡(luò)和識(shí)別的場(chǎng)景信息為歷史學(xué)家和計(jì)算機(jī)學(xué)家破譯未知甲骨字的語(yǔ)義提供新的研究思路和直接的數(shù)據(jù)支持。

      關(guān)鍵詞:甲骨字;拓片;復(fù)雜網(wǎng)絡(luò);場(chǎng)景

      中圖分類(lèi)號(hào):TP399 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-5168(2019)04-0008-04

      Module Structure-driven Prediction of Oracle Character Scenes

      JIN Yuanyuan1 JIAO Qingju1,2

      (1.School of Computer and Information Engineering, Anyang Normal University,Anyang Henan 455000;2.Key Laboratory of Oracle Information Processing in Henan Province,Anyang Henan 455000)

      Abstract: The semantic interpretation of unknown oracle bone characters is one of the most important contents of oracle bone research, and also the biggest bottleneck for historians in oracle bone inscriptions research. With the discovery of oracle bone rubbings and the increase of related research literatures, oracle bone inscription data shows massive and systematic. The emergence of large-scale oracle bone inscription data makes it possible to use computer technology to decipher the semantics of unknown oracle bone characters. However, few methods exist to decipher the semantics of unknown oracle bone characters. In this paper, the author made full use of the existing oracle bone inscription data of the sea and systematic characteristics, according to the rubbing information to build oracle bone inscription network, and used the network module features to analyze the scene of oracle bone inscription. The network and scene information constructed in this paper provide new research ideas and direct data support for historians and computer scientists to decipher the meaning of unknown oracle bone characters.

      Keywords: oracle bone inscriptions;rubbing;complex network;scenes

      1 甲骨文研究現(xiàn)狀

      甲骨文是迄今為止發(fā)現(xiàn)最早的、能夠全面地記錄漢語(yǔ)言的文字符號(hào),距今已有3 500年的歷史。甲骨文所記載的內(nèi)容極其豐富,涉及商代社會(huì)生活的諸多方面,如戰(zhàn)爭(zhēng)、文化、社會(huì)習(xí)俗等內(nèi)容。甲骨文的研究會(huì)對(duì)語(yǔ)言文字學(xué)、考古學(xué)、歷史學(xué)、社會(huì)人類(lèi)學(xué)等學(xué)科產(chǎn)生深刻的影響,具有重要的文化價(jià)值和傳承意義[1]。

      甲骨字的語(yǔ)義破譯一直是甲骨學(xué)研究最為重要的內(nèi)容。一百多年來(lái),經(jīng)過(guò)幾代學(xué)者的努力,在甲骨文字的考釋方面取得了豐碩的成果[2]。孫詔讓是第一個(gè)比較系統(tǒng)地考釋甲骨文字的人,其考釋之字有57字;羅振玉撰寫(xiě)的《殷墟書(shū)契考釋》基本上將大部分常用字認(rèn)出;王國(guó)維提倡的“二重證據(jù)法”對(duì)后世破譯甲骨文字具有深遠(yuǎn)的影響;郭沫若是第一個(gè)運(yùn)用歷史唯物主義來(lái)研究甲骨文的人,他考釋之字有50字。以上列出的只是較少一部分對(duì)甲骨文考釋做出貢獻(xiàn)的學(xué)者。當(dāng)前,中國(guó)社會(huì)科學(xué)院的宋鎮(zhèn)豪、首都師范大學(xué)的黃天樹(shù)、復(fù)旦大學(xué)的裘錫圭和劉釗、清華大學(xué)的李學(xué)勤、北京大學(xué)的李家浩、華東師范大學(xué)的劉志基等人對(duì)甲骨學(xué)的研究也做出了巨大貢獻(xiàn)。

      然而,人為地考釋甲骨文存在以下問(wèn)題。第一,破譯甲骨文的語(yǔ)義需要豐富的專(zhuān)業(yè)知識(shí)和長(zhǎng)期的學(xué)術(shù)鉆研,這一周期往往需要一二十年甚至更長(zhǎng)時(shí)間。較長(zhǎng)的時(shí)間周期嚴(yán)重阻礙了甲骨學(xué)的發(fā)展。第二,人為破譯甲骨文字的語(yǔ)義遇到了較大的瓶頸,大概2/3的甲骨文字還未知其義。第三,隨著對(duì)甲骨文的研究不斷加深,甲骨學(xué)積累的數(shù)據(jù)已呈現(xiàn)海量化和系統(tǒng)性[3],而人為地研究甲骨文無(wú)法充分利用大規(guī)模的甲骨文數(shù)據(jù)。第四,甲骨字之間通過(guò)拓片信息相互聯(lián)系,形成相應(yīng)的語(yǔ)義單元,具有古文字的系統(tǒng)特性,而人為地研究甲骨字,無(wú)法很好地反映甲骨文的系統(tǒng)性。

      海量化和系統(tǒng)性的甲骨文數(shù)據(jù),為計(jì)算機(jī)學(xué)家研究甲骨文提供了數(shù)據(jù)上的支撐。近年來(lái),與計(jì)算機(jī)相關(guān)的甲骨文研究開(kāi)始逐漸增多,甲骨文的研究進(jìn)入了以人工研究為主和以計(jì)算機(jī)為輔的時(shí)代。目前,國(guó)內(nèi)以計(jì)算機(jī)為輔助的研究在甲骨文輸入和可視化、甲骨字識(shí)別、甲骨文資料庫(kù)構(gòu)建、甲骨文片綴合、甲骨文字語(yǔ)義預(yù)測(cè)等方面均取得了豐碩的成果。

      甲骨文輸入和可視化方面。2004年,劉永革[4]等人通過(guò)建立甲骨文圖片化字庫(kù),實(shí)現(xiàn)了甲骨文的可視化輸入。同年,肖明[5]等人利用模糊數(shù)學(xué)模型對(duì)甲骨文象形編碼進(jìn)行研究,并運(yùn)用熵理論得到甲骨文編碼的最佳碼長(zhǎng)度為3。2008年,通過(guò)分析甲骨文字形、讀音等特征,顧紹通[6]等人設(shè)計(jì)了一種拆分取碼和現(xiàn)代漢字拼音的方法輸入甲骨文字形。2012年,為了解決甲骨字輸入難和定量難的問(wèn)題,吳琴霞和栗青生[7]提出了一種利用有向筆段和筆元相結(jié)合的方法來(lái)描述甲骨文字。甲骨字識(shí)別方面。2014年,高峰[8]等人利用語(yǔ)境分析生成的候選字庫(kù)得到對(duì)應(yīng)的甲骨文語(yǔ)義構(gòu)件向量,然后結(jié)合基于Hopfield網(wǎng)絡(luò)的識(shí)別結(jié)果計(jì)算待識(shí)別的甲骨文模糊字的匹配度,根據(jù)匹配度識(shí)別甲骨字。2016年,顧紹通[9]通過(guò)拓片頂點(diǎn)、拓?fù)潢P(guān)系、拓片編碼相應(yīng)的數(shù)據(jù)結(jié)構(gòu)刻畫(huà)甲骨文字形頂點(diǎn)之間的關(guān)系,將其轉(zhuǎn)化為拓?fù)鋱D形,通過(guò)計(jì)算基準(zhǔn)拓?fù)浜痛錅?zhǔn)之間的歐式距離識(shí)別甲骨字形。2017年,劉永革和劉國(guó)英[10]以甲骨文圖片為基礎(chǔ)數(shù)據(jù),通過(guò)提取甲骨文字的骨架特征,并結(jié)合支持向量機(jī)對(duì)甲骨文字進(jìn)行識(shí)別。甲骨文資料庫(kù)構(gòu)建方面。2004年,江銘虎[11]等人介紹了用于計(jì)算機(jī)處理的甲骨文字庫(kù)、句法分析和綜合知識(shí)庫(kù)的建立方法以及計(jì)算機(jī)甲骨文輔助辨識(shí)分析的工作原理。2010年,毛建軍[12]撰寫(xiě)論文調(diào)查和分析了國(guó)內(nèi)外甲骨文全文數(shù)據(jù)庫(kù)的建設(shè)情況,并給出思考和建議。2015年,李志勇和高峰[13]借鑒知網(wǎng)的構(gòu)建體系,建立了一個(gè)融合甲骨文、現(xiàn)代漢語(yǔ)的語(yǔ)義數(shù)據(jù)庫(kù)。甲骨文片綴合方面。2010年,王愛(ài)民[14]等人通過(guò)提取甲骨片的輪廓信息和輪廓片段特征向量信息,建立甲骨文碎片數(shù)據(jù)庫(kù),進(jìn)而綴合甲骨文碎片。2011年,王愛(ài)民[15]等人利用位置數(shù)、碎片邊界、碎片上文字筆畫(huà)、碎片邊界上文字方面信息對(duì)甲骨文進(jìn)行綴合。甲骨文語(yǔ)義預(yù)測(cè)方面。2012年,袁冬[16]等人提出基于實(shí)例的甲骨文釋文機(jī)器翻譯方案,并實(shí)現(xiàn)了一個(gè)機(jī)器翻譯系統(tǒng)。2014年,熊晶[17]等人通過(guò)引入計(jì)算機(jī)輔助翻譯的技術(shù),將已經(jīng)過(guò)甲骨文專(zhuān)家確認(rèn)正確的現(xiàn)代漢語(yǔ)釋讀存儲(chǔ)在翻譯記憶庫(kù)中,實(shí)現(xiàn)了專(zhuān)家知識(shí)的共享和重用。2015年,高峰等人[18]首先構(gòu)建了一個(gè)融合甲骨文和現(xiàn)代漢語(yǔ)的語(yǔ)義知識(shí)庫(kù),然后通過(guò)可拓模型解決甲骨卜辭釋義問(wèn)題。同年,熊晶[19]等人在文本挖掘的基礎(chǔ)上,結(jié)合語(yǔ)義Web技術(shù),將實(shí)體及其關(guān)系資源描述框架(RDF)化,并在生成的RDF集合中進(jìn)行語(yǔ)義搜索,利用本體關(guān)系和本體推理挖掘RDF對(duì)象間顯式或隱式的語(yǔ)義關(guān)系。國(guó)際國(guó)內(nèi)合作上。2016年,中山大學(xué)、北京微軟研究院以及瑞士日內(nèi)瓦大學(xué)的研究人員通過(guò)圖像處理的方式識(shí)別甲骨字[20]。2016年,德國(guó)馬克斯普朗克研究所和上海大學(xué)的研究人員構(gòu)建了有關(guān)動(dòng)物甲骨字的認(rèn)知網(wǎng)絡(luò)[21]。

      雖然一些計(jì)算機(jī)學(xué)家在研究甲骨文方面取得了顯著的成績(jī),但還存在很多問(wèn)題需要我們深入地研究。例如,現(xiàn)有計(jì)算機(jī)學(xué)家的研究與預(yù)測(cè)未知甲骨文字的語(yǔ)義還有相當(dāng)一段的距離;現(xiàn)有的研究方法并沒(méi)有充分利用大規(guī)模甲骨文數(shù)據(jù)提高語(yǔ)義預(yù)測(cè)的正確率。

      針對(duì)以上問(wèn)題,本文利用大規(guī)模的甲骨字網(wǎng)絡(luò)和其模塊結(jié)構(gòu)特征對(duì)甲骨字的場(chǎng)景進(jìn)行預(yù)測(cè)和分析。首先,利用拓片數(shù)據(jù),通過(guò)建模構(gòu)建甲骨字網(wǎng)絡(luò);其次,利用模塊挖掘算法ClusterONE[22]識(shí)別網(wǎng)絡(luò)中的模塊;最后,通過(guò)分析不同模塊內(nèi)已識(shí)和未識(shí)甲骨字之間的關(guān)系及不同模塊之間的重疊性分析甲骨文系統(tǒng)的場(chǎng)景特征。

      2 甲骨字網(wǎng)絡(luò)構(gòu)建

      在本文中,筆者以收集的72 151片甲骨文拓片為基礎(chǔ)數(shù)據(jù),通過(guò)建模構(gòu)建甲骨字之間相互聯(lián)系的網(wǎng)絡(luò)。在構(gòu)建網(wǎng)絡(luò)之前,筆者對(duì)所有的拓片信息進(jìn)行預(yù)處理。第一,對(duì)于甲骨字之間殘缺的甲骨字,使用省略號(hào)代替。第二,如果一個(gè)拓片中只含有一個(gè)甲骨字,那么將無(wú)法獲取這個(gè)字和其他字之間的信息。因此,除去不含有甲骨字和含有一個(gè)甲骨字的拓片,共獲取71 891片拓片。第三,由于甲骨文系統(tǒng)中的“卜”被經(jīng)常使用,但“卜”卻不具有實(shí)際的語(yǔ)義信息,因此,在構(gòu)建甲骨字網(wǎng)絡(luò)時(shí),不計(jì)算此字和其他甲骨字之間的距離。在拓片中,筆者以省略號(hào)代替“卜”字。

      為了構(gòu)建甲骨字網(wǎng)絡(luò),本文需要定義甲骨字和甲骨字之間的距離(或稱(chēng)相似性)。在定義甲骨字之間的距離時(shí),筆者以拓片為語(yǔ)義單位構(gòu)建網(wǎng)絡(luò):同一拓片中的任意兩個(gè)甲骨字之間都存在距離,假設(shè)拓片中兩個(gè)甲骨字分別為i和j,那么i和j之間的距離為[dij][見(jiàn)公式(1)];如果兩個(gè)甲骨字i和j之間有殘缺的甲骨字,那么i和j之間的不僅包含[dij],而且包含它們之間殘缺甲骨字的信息length[見(jiàn)公式(2)]。

      [dij=101interal] ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (1)

      [interal=lj-li ? ? ? ? ? i和j之間無(wú)殘缺字length+lj-li i和j之間有殘缺字] ? ? ? ?(2)

      其中,公式(1)中的參數(shù)interal由公式(2)定義。在公式(2)中,[li]和[lj]分別表示甲骨字i和j在拓片中的位置且字j在字i的后面。若甲骨字i和j之間有殘缺的甲骨字,經(jīng)過(guò)試驗(yàn)驗(yàn)證length設(shè)置為2。

      對(duì)于所有的71 891片甲骨拓片,筆者以6 199個(gè)甲骨字為基礎(chǔ),構(gòu)建6 199×6 199大小的相似性矩陣D(即權(quán)重網(wǎng)絡(luò))。首先,如果兩個(gè)甲骨字i和j在同一甲骨片上出現(xiàn),使用公式(1)和(2)進(jìn)行計(jì)算,并把[dij]賦予[Dij]處;其次,如果兩個(gè)甲骨字在不同的拓片上出現(xiàn),那么把這兩個(gè)字在不同拓片上計(jì)算的相似性距離在同一個(gè)D位置上疊加。圖1給出了計(jì)算相似性矩陣D的一個(gè)簡(jiǎn)單示意圖。圖中有兩個(gè)拓片,共有9個(gè)甲骨字。以這9個(gè)甲骨字為基礎(chǔ),構(gòu)建大小為9×9的相似性矩陣。例如,利用公式(1)和(2)計(jì)算甲骨字2和甲骨字4之間的距離,然后把[d2,4]的值放在相似矩陣[D2,4]的位置上;再次,如果兩個(gè)甲骨字在不同拓片上同時(shí)出現(xiàn),需要分別計(jì)算這兩個(gè)甲骨字在不同拓片上的相似性距離,然后相加放在相似性矩陣對(duì)應(yīng)的位置上。如圖中的甲骨字5和6,分別計(jì)算甲骨字5和6在拓片1和2上的距離[d15,6]和[d25,6],然后把[d15,6]和[d25,6]相加放在相似性矩陣[M5,6]的位置上。最后,依據(jù)71 455個(gè)拓片信息,得到6 199個(gè)甲骨字之間的相似矩陣,這個(gè)矩陣共包含了160 964條有權(quán)重邊。為了保證邊信息能真實(shí)反映甲骨字之間的拓片信息,筆者保留了權(quán)重大于5的邊,共有5 474個(gè)甲骨字和75 611條邊。

      3 甲骨字場(chǎng)景預(yù)測(cè)

      3.1 模塊結(jié)構(gòu)識(shí)別算法描述

      模塊結(jié)構(gòu)是復(fù)雜網(wǎng)絡(luò)的一種典型特征。模塊是網(wǎng)絡(luò)中的一個(gè)子網(wǎng)絡(luò),其要求模塊中的結(jié)點(diǎn)之間緊密相連,而與網(wǎng)絡(luò)中其他結(jié)點(diǎn)連接稀疏。由于模塊中的結(jié)點(diǎn)具有相似的屬性,因此,模塊結(jié)構(gòu)在很多領(lǐng)域都取得了成功的應(yīng)用。在本文中,筆者以模塊中的甲骨字描述同一場(chǎng)景為假設(shè)對(duì)甲骨字網(wǎng)絡(luò)的模塊進(jìn)行識(shí)別。

      甲骨字網(wǎng)絡(luò)中的模塊結(jié)構(gòu)具有獨(dú)特之處:一是甲骨字的語(yǔ)義具有多樣性,在模塊結(jié)構(gòu)方面表現(xiàn)為,甲骨字可能會(huì)屬于不同的模塊,因此模塊具有重疊性;二是由于甲骨字的單音節(jié)詞較多,因此,描述場(chǎng)景的甲骨字個(gè)數(shù)較少。這就會(huì)造成甲骨字網(wǎng)絡(luò)中模塊的尺度較小,含有結(jié)點(diǎn)較少。在本文中,筆者使用Nepusz等人開(kāi)發(fā)的ClusterONE網(wǎng)絡(luò)聚類(lèi)算法,此算法不僅能發(fā)現(xiàn)網(wǎng)絡(luò)中較小的模塊,而且能識(shí)別模塊中重疊的結(jié)點(diǎn)。

      ClusterONE算法首先定義目標(biāo)函數(shù)凝聚度[Cohesiveness,f,見(jiàn)公式(3)],然后通過(guò)逐步迭代實(shí)現(xiàn)模塊的識(shí)別。此算法主要包含兩個(gè)部分,第一部分具體包含以下六個(gè)步驟。第一步,選定網(wǎng)絡(luò)中結(jié)點(diǎn)度數(shù)(或者權(quán)重之和)最大的結(jié)點(diǎn)[v0]作為種子結(jié)點(diǎn),令模塊[V0=v0],并設(shè)置步數(shù)[t=0]。第二步,計(jì)算模塊[Vt]的凝聚度值,令[Vt+1=Vt]。第三步,對(duì)于與模塊[Vt]中結(jié)點(diǎn)有邊相連的任意外部結(jié)點(diǎn)v,計(jì)算凝聚度[V=Vt?v]。如果[fV>fVt+1],則[Vt+1=V]。第四步,對(duì)于與模塊[Vt]中結(jié)點(diǎn)有邊相連的外部結(jié)點(diǎn)[V],計(jì)算[V=Vt/v]。如果[fV>fVt+1],則[Vt+1=V]。第五步,如果[Vt≠Vt+1],并且新的凝聚度值增加,返回步驟2;如果[Vt=Vt+1],則[Vt]是識(shí)別的模塊結(jié)果。

      [fv=winvwinV+wboundV+pV] ? ? ? ? ? ? ?(3)

      在公式(3)中,[win]表示模塊V中所有結(jié)點(diǎn)權(quán)重之和;[wbound]表示模塊V中的結(jié)點(diǎn)與網(wǎng)絡(luò)中其余結(jié)點(diǎn)連接邊的權(quán)重之和;[PP>0]表示懲罰系數(shù),可根據(jù)實(shí)驗(yàn)情況設(shè)定。

      第二部分,第一部分識(shí)別的很多模塊之間具有很大的重合性,因此,ClusterONE算法要對(duì)這些重合的模塊進(jìn)行合并。如果兩個(gè)模塊間的[ω]值[[ω]的定義見(jiàn)公式(4)]大于0.8,合并這兩個(gè)模塊為一個(gè)模塊,并逐步迭代合并前一步驟中所有的模塊得到最終的結(jié)果。

      [ωA,B=A?B2A×B] ? ? ? ? ? ? ? ? ? ? ? ? ?(4)

      其中,A和B為兩個(gè)模塊,[A]和[B]是模塊[A]和[B]中結(jié)點(diǎn)的個(gè)數(shù)。

      3.2 預(yù)測(cè)的甲骨字場(chǎng)景分析

      在本節(jié)中,筆者使用嵌套在Cytoscape軟件的ClusterONE算法對(duì)甲骨字網(wǎng)絡(luò)的社團(tuán)結(jié)構(gòu)進(jìn)行分析。含有5 474字的甲骨文網(wǎng)絡(luò)被劃分成1 393個(gè)社團(tuán),其中最大的社團(tuán)含有1 553個(gè)甲骨字。其余的社團(tuán)含有的甲骨字均為4~50個(gè),其中3個(gè)社團(tuán)含有的甲骨字在100個(gè)左右。在分析社團(tuán)時(shí),筆者除去最大的社團(tuán),即包含1 553個(gè)甲骨字的社團(tuán)。

      筆者對(duì)社團(tuán)尺度為4~50的甲骨字進(jìn)行了著重分析,通過(guò)分析筆者發(fā)現(xiàn),一些社團(tuán)的甲骨字描述了“打獵”事件。進(jìn)一步研究發(fā)現(xiàn):描述“打獵”的甲骨字極少,大概7~20甲骨字就可以描述一場(chǎng)完整的“打獵”事件;描述“打獵”事件的一些社團(tuán)存在重疊甲骨字,而這些甲骨字主要表示的是時(shí)間、地點(diǎn)、獵物的數(shù)量;而未重疊的甲骨字主要體現(xiàn)在不同“打獵”場(chǎng)景下的人名、獵物的種類(lèi)、打獵的工具、獵物的種類(lèi)等。這些分析為人們認(rèn)識(shí)未識(shí)甲骨字的場(chǎng)景語(yǔ)義提供直接的推測(cè)數(shù)據(jù)。

      除了打獵社團(tuán)之外,筆者還分析了有關(guān)“戰(zhàn)爭(zhēng)”的社團(tuán)。描述“戰(zhàn)爭(zhēng)”的社團(tuán)相對(duì)來(lái)說(shuō)比較多,共涉及約50個(gè)社團(tuán)(初步分析,更加詳細(xì)的數(shù)據(jù)需要甲骨文專(zhuān)家考證。需要注意的是,這50個(gè)社團(tuán)中的大部分甲骨字是已識(shí),其他社團(tuán)中包含的未識(shí)甲骨字也可能是描述戰(zhàn)爭(zhēng)的)。與“打獵”社團(tuán)相比,描述“戰(zhàn)爭(zhēng)”的社團(tuán)更加詳細(xì),包含的甲骨字更多。具體的分析:描述“戰(zhàn)爭(zhēng)”社團(tuán)之間也有重疊的甲骨字,這些甲骨字也是用來(lái)表示時(shí)間、地點(diǎn)等信息;描述“戰(zhàn)爭(zhēng)”社團(tuán)中未重疊的甲骨字,可能涉及戰(zhàn)爭(zhēng)人物、戰(zhàn)爭(zhēng)策略、戰(zhàn)爭(zhēng)前的祭祀、戰(zhàn)爭(zhēng)祭祀品等信息。我們進(jìn)一步的預(yù)測(cè)是,有關(guān)描述戰(zhàn)爭(zhēng)祭祀品的甲骨字在不同的社團(tuán)中也是不重疊的,這種信息意味著,不同的戰(zhàn)爭(zhēng)對(duì)當(dāng)權(quán)人的意義不同。

      4 結(jié)論

      未知甲骨字語(yǔ)義破譯不僅是歷史學(xué)家研究甲骨學(xué)的最大瓶頸,也是計(jì)算機(jī)學(xué)家研究甲骨文遇到的最大挑戰(zhàn)。本文利用大規(guī)模的甲骨文拓片數(shù)據(jù)構(gòu)建甲骨字網(wǎng)絡(luò)。構(gòu)建的甲骨字網(wǎng)絡(luò)不僅能充分反映古文字單音詞多、復(fù)音節(jié)詞少的特征,而且能捕捉甲骨文系統(tǒng)的語(yǔ)義單元及甲骨字在拓片上的同現(xiàn)信息。在甲骨字網(wǎng)絡(luò)上,利用網(wǎng)絡(luò)的模塊結(jié)構(gòu)特征,并結(jié)合ClusterONE算法識(shí)別網(wǎng)絡(luò)中的模塊。根據(jù)模塊分析甲骨字的場(chǎng)景。本文使用的方法和得到的數(shù)據(jù)為歷史學(xué)家和計(jì)算機(jī)學(xué)家破譯未知甲骨字的語(yǔ)義提供了新的思路。

      參考文獻(xiàn):

      [1]江銘虎.自然語(yǔ)言處理[M].北京:高等教育出版社,2006.

      [2]夏大兆.甲骨文字用研究[D].合肥:安微大學(xué),2014.

      [3]熊晶,高峰,吳琴霞.甲骨文大規(guī)?;A(chǔ)數(shù)據(jù)的語(yǔ)義挖掘研究[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2015(2):7-14.

      [4]劉永革,栗青生.可視化甲骨文輸入法的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與應(yīng)用,2004(17):139-140.

      [5]肖明,趙慧,甘仲惟.甲骨文象形碼編碼的模糊數(shù)學(xué)模型研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2004(3):358-361.

      [6]顧紹通,馬小虎,楊亦鳴.基于字形拓?fù)浣Y(jié)構(gòu)的甲骨文輸入編碼研究[J].中文信息學(xué)報(bào),2008(4):123-128.

      [7]吳琴霞,栗青生.基于有向筆段甲骨文輸入方法的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用,2012(8):2374-2377.

      [8]高峰,吳琴霞,劉永革,等.基于語(yǔ)義構(gòu)件的甲骨文模糊字形的識(shí)別方法[J].科學(xué)技術(shù)與工程,2014(30):67-70.

      [9]顧紹通.基于拓?fù)渑錅?zhǔn)的甲骨文字形識(shí)別方法[J].計(jì)算機(jī)與數(shù)字工程,2016(10):2001-2006.

      [10]劉永革,劉國(guó)英.基于SVM的甲骨文字識(shí)別[J].安陽(yáng)師范學(xué)院學(xué)報(bào),2017(2):54-56.

      [11]江銘虎,鄧北星,廖盼盼,等.甲骨文字庫(kù)與智能知識(shí)庫(kù)的建立[J].計(jì)算機(jī)工程與應(yīng)用,2004(4):45-47.

      [12]毛建軍.甲骨文獻(xiàn)全文數(shù)據(jù)庫(kù)的建設(shè)與思考[J].圖書(shū)館學(xué)研究,2010(12):37-38.

      [13]李志勇,高峰.基于知網(wǎng)的甲骨文可拓模型建模技術(shù)[J].計(jì)算機(jī)與現(xiàn)代化,2015(5):30-34.

      [14]王愛(ài)民,劉國(guó)英,葛文英,等.甲骨文計(jì)算機(jī)輔助綴合系統(tǒng)設(shè)計(jì)[J].計(jì)算機(jī)工程與應(yīng)用,2006(21):59-62.

      [15]王愛(ài)民,葛文英,趙哲,等.龜甲類(lèi)甲骨文碎片計(jì)算機(jī)輔助綴合研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2011(10):3570-3572.

      [16]袁冬,熊晶,劉永革.面向甲骨文的實(shí)例機(jī)器翻譯技術(shù)研究[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2012(5):48-54.

      [17]熊晶,高峰,吳琴霞.甲骨文計(jì)算機(jī)輔助翻譯技術(shù)研究[J].科學(xué)技術(shù)與工程,2014(2):179-182.

      [18]高峰,熊晶,劉永革.基于知網(wǎng)的甲骨卜辭釋義問(wèn)題的可拓性研究[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2015(7):58-64.

      [19]熊晶,高峰,吳琴霞.甲骨文大規(guī)?;A(chǔ)數(shù)據(jù)的語(yǔ)義挖掘研究[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2015(2):7-14.

      [20]Guo J,Wang C,Roman-Rangel E,et al. Building Hierarchical Representations for Oracle Character and Sketch Recognition[J]. IEEE Transactions on Image Processing,201(1):104-118.

      [21]Dress A,Stefan Grünewald,Zeng Z . A cognitive network for oracle bone characters related to animals[J]. International Journal of Modern Physics B,2016(4):1630001.

      [22]Nepusz T,Yu H,Paccanaro A. Detecting overlapping protein complexes in protein-protein interaction networks[J]. Nature Methods,2013(9):471-472.

      猜你喜歡
      復(fù)雜網(wǎng)絡(luò)場(chǎng)景拓片
      唐 豳州昭仁寺碑拓片
      唐 等慈寺碑拓片
      《韋洽墓志》拓片
      北宋《曲行殷墓志》拓片
      基于圖熵聚類(lèi)的重疊社區(qū)發(fā)現(xiàn)算法
      場(chǎng)景傳播視閾下的網(wǎng)絡(luò)直播探析
      新聞界(2016年15期)2016-12-20 09:46:44
      漢語(yǔ)語(yǔ)篇英譯中詞匯場(chǎng)理論和框架理論的應(yīng)用研究
      考試周刊(2016年93期)2016-12-12 09:34:00
      以二維動(dòng)畫(huà)短片《回家》為例,談其創(chuàng)作步驟
      基于復(fù)雜網(wǎng)絡(luò)理論的通用機(jī)場(chǎng)保障網(wǎng)絡(luò)研究
      場(chǎng)景:大數(shù)據(jù)挖掘的新標(biāo)準(zhǔn)
      今傳媒(2016年9期)2016-10-15 22:08:05
      德惠市| 澎湖县| 德昌县| 内丘县| 丽江市| 伊川县| 哈巴河县| 舞阳县| 新营市| 湖北省| 张北县| 鞍山市| 西宁市| 嘉善县| 汝州市| 时尚| 商丘市| 吉木乃县| 始兴县| 大姚县| 左云县| 集安市| 卢湾区| 孝感市| 大城县| 都昌县| 蕲春县| 陇川县| 措美县| 康乐县| 陵水| 沧源| 嘉定区| 阜南县| 安徽省| 阿鲁科尔沁旗| 咸丰县| 安溪县| 望奎县| 甘肃省| 蓬安县|