• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      中華人民共和國史本體構(gòu)建初探

      2014-04-03 22:36孫輝雷楓
      現(xiàn)代情報(bào) 2014年2期
      關(guān)鍵詞:本體

      孫輝++雷楓

      〔摘 要〕本文借鑒其他歷史本體構(gòu)建的經(jīng)驗(yàn),針對(duì)中華人民共和國史領(lǐng)域知識(shí)的特點(diǎn),在確定國史本體構(gòu)建原則的基礎(chǔ)上,提出構(gòu)建國史本體的方法和流程,構(gòu)建國史本體原型系統(tǒng),為進(jìn)一步構(gòu)建完善的國史本體進(jìn)行了探索。

      〔關(guān)鍵詞〕本體;中華人民共和國史;本體構(gòu)建

      DOI:10.3969/j.issn.1008-0821.2014.02.007

      〔中圖分類號(hào)〕G253 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2014)02-0032-05

      近年來,基于本體的知識(shí)庫被廣泛應(yīng)用于知識(shí)發(fā)現(xiàn)和基于知識(shí)的信息資源檢索,成為知識(shí)服務(wù)的主要手段。在農(nóng)學(xué)、醫(yī)學(xué)、軍事和科研監(jiān)測等領(lǐng)域信息資源服務(wù)中,本體構(gòu)建得到充分的重視,例如國內(nèi)最早開展的農(nóng)業(yè)花卉本體研究[1]和中國醫(yī)科院基于本體構(gòu)建重大傳染病信息知識(shí)服務(wù)平臺(tái)[2]以及南京理工大學(xué)的軍用飛機(jī)本體[3]等,另外,中科院文獻(xiàn)中心通過科研監(jiān)測本體輔助情報(bào)價(jià)值判斷和知識(shí)關(guān)聯(lián)呈現(xiàn)[4]。在歷史領(lǐng)域,由于知識(shí)的時(shí)空依賴性、主觀性、不確定性、模糊性和爭議性,本體建設(shè)呈現(xiàn)一定的特殊性。盡管如此,董慧[5]、吳麗杰[6]、彭煒明[7]等在國共合作歷史本體、東北抗戰(zhàn)史本體、資治通鑒本體方面均做了有益的嘗試。領(lǐng)域本體是信息技術(shù)與專業(yè)知識(shí)結(jié)合的產(chǎn)物。中華人民共和國史(即當(dāng)代中國史,簡稱國史)研究的1949年新中國成立以后的歷史,由于歷史階段不同,特定的世情國情使這個(gè)階段的知識(shí)呈現(xiàn)不同的特征。本文在借鑒其他歷史本體構(gòu)建經(jīng)驗(yàn)的基礎(chǔ)上,針對(duì)國史領(lǐng)域特色,在確定國史本體構(gòu)建原則的基礎(chǔ)上提出構(gòu)建國史本體的思路和方法,構(gòu)建國史本體原型系統(tǒng),為進(jìn)一步構(gòu)建完善的國史本體進(jìn)行了探索。

      1 國史本體構(gòu)建原則本體構(gòu)建是一項(xiàng)龐大的系統(tǒng)工程,需要領(lǐng)域?qū)<液捅倔w工程師按照一定的原則,在合理的方法指導(dǎo)下,通過便捷的工具加以實(shí)現(xiàn)。Gruber[8]于1995年提出本體“明確性”“一致性”“可擴(kuò)展性”“最小編碼傾向”“最小本體化承諾”5個(gè)原則,其余學(xué)者基本都是在這五原則基礎(chǔ)上擴(kuò)展。本文通過國史本體構(gòu)建試驗(yàn),在比較同類歷史本體構(gòu)建經(jīng)驗(yàn)的基礎(chǔ)上認(rèn)為,除了上述關(guān)于邏輯要求的五原則之外,有兩個(gè)方面尤其要注意。一是本體構(gòu)建要面向特定的應(yīng)用目標(biāo);二是同一學(xué)科的知識(shí)在不同時(shí)空下有自己特色。1949年以后,我國基本處于國家建設(shè)時(shí)期,國家重視記史存史,史料內(nèi)容翔實(shí),記載手段豐富,保存情況完好,該階段的史料比古代史和近代史的總和還要多,其所包含的歷史細(xì)節(jié)也是以往任何史料無法比擬的。這也是歷史學(xué)科的特點(diǎn),越是近期的歷史,史料越豐富。面對(duì)這么豐富的知識(shí),如果不能設(shè)定本體應(yīng)用目標(biāo),構(gòu)建本體時(shí)就會(huì)感到力不從心。本文認(rèn)為,國史本體有以下幾方面的作用,一是構(gòu)建國史知識(shí)圖譜,通過知識(shí)圖譜描繪國史的基本脈絡(luò),便于普通讀者了解國史;二是建立國史概念之間的聯(lián)系,輔助構(gòu)建基于本體的主題詞表,為基于知識(shí)的信息資源建設(shè)提供支撐;三是輔助國史研究和編纂,國史本體多維度描述國史知識(shí),將人物、事件、地點(diǎn)、機(jī)構(gòu)等放在一個(gè)模型中描述,改變傳統(tǒng)的歷史敘事模式(紀(jì)傳體以人物為主線敘述歷史,編年體以時(shí)間為主線敘述歷史),研究人員可以從多種角度來還原歷史,還可以借助本體輔助生成大事記和人物年表能編纂成果。這些目標(biāo)對(duì)本體構(gòu)建有不同的要求。前兩個(gè)目標(biāo)主要是滿足普及國史和檢索國史的要求,本體是粗粒度的知識(shí)及其表達(dá),體現(xiàn)了國史的知識(shí)輪廓。第三個(gè)目標(biāo)直接面向國史細(xì)節(jié),需要細(xì)粒度的知識(shí)和表達(dá)。二者在文本選擇、概念關(guān)系模型、本體編輯隊(duì)伍上有很大的不同。粗粒度的本體構(gòu)建時(shí),可以選擇百科類國史工具書和文獻(xiàn)統(tǒng)計(jì)數(shù)據(jù)等,其概念關(guān)系模型允許包含簡單模糊的關(guān)系,由國史專業(yè)普通研究人員進(jìn)行編輯;細(xì)粒度的本體除了上述文本外,必須通過年譜、傳記、日記等翔實(shí)的史料建立比較精確的概念關(guān)系模型,并由國史專家進(jìn)行本體編輯。盡管國史歷史細(xì)節(jié)豐富,但由于其時(shí)間短,許多方面存在不確定性,這些為構(gòu)建細(xì)粒度本體帶來難度。本文重點(diǎn)研究面向知識(shí)普及和信息組織的國史本體。基于本體的知識(shí)庫構(gòu)建離不開其所依賴的文本。古代史書的敘事內(nèi)容決定著古代史本體的特色。例如,中國古代是家天下,歷史人物之間的血緣關(guān)系是古代史本體不能忽視的概念關(guān)聯(lián);中華人民共和國是現(xiàn)代意義上的國家類型,人物之間的血緣關(guān)系不再是歷史研究的重點(diǎn),甚至是可以忽略的。近代史中戰(zhàn)爭戰(zhàn)役頻繁,將戰(zhàn)爭戰(zhàn)役作為一個(gè)大類并詳細(xì)設(shè)定其屬性是近代史本體不能省略的;當(dāng)代史以國家建設(shè)為主要內(nèi)容,某些戰(zhàn)爭戰(zhàn)役可作為實(shí)例放在事件大類中。上述這些時(shí)代特色都影響著本體的構(gòu)建。

      2014年2月第34卷第2期現(xiàn)?代?情?報(bào)Journal of Modern InformationFeb.,2014Vol.34 No.22014年2月第34卷第2期中華人民共和國史本體構(gòu)建初探Feb.,2014Vol.34 No.22 國史本體構(gòu)建方法和流程當(dāng)前,國內(nèi)外很多學(xué)者基于自身實(shí)踐提出本體構(gòu)建方法,如骨架法[9]、評(píng)價(jià)法、七步法[10]、五步法等。七步法是斯坦福大學(xué)醫(yī)學(xué)院提出的基于Protégé本體編輯工具的一種領(lǐng)域本體構(gòu)建方法,7個(gè)步驟分別是:(1)確定本體的專業(yè)領(lǐng)域和范疇;(2)考查復(fù)用現(xiàn)有知識(shí)本體的可能性;(3)列出本體中的重要術(shù)語;(4)定義類和類的等級(jí)(層次)體系;(5)定義類的屬性;(6)定義屬性的分面;(7)創(chuàng)建實(shí)例。本文在七步法的基礎(chǔ)上提出國史本體構(gòu)建流程,如圖1所示。第1步,確定國史本體構(gòu)建目標(biāo):構(gòu)建支持信息組織和國史知識(shí)普及的國史知識(shí)圖譜。第2步,確定和分析知識(shí)來源。基于上述目標(biāo),選定國史百科類工具書(如《中華人民共和國國史百科全書》和

      圖1 國史本體構(gòu)建流程

      《中華人民共和國編年史》等)為國史知識(shí)的文本來源,收集國史期刊庫中的關(guān)鍵詞,作為重要概念來源,組織一支良好的國史專家隊(duì)伍作為隱性知識(shí)來源。對(duì)上述知識(shí)來源進(jìn)行分析,對(duì)于百科詞條中文本,逐句進(jìn)行分解,提取重要的概念并分析該語句中主體、謂詞、客體以及條件之間的關(guān)系;對(duì)于期刊庫中的關(guān)鍵詞,通過詞頻統(tǒng)計(jì)和關(guān)鍵詞規(guī)范化,整理出重要的概念及其規(guī)范化表達(dá);通過專家訪談,了解國史的概貌和重要的一次文獻(xiàn)和二次、三次文獻(xiàn)。第3步至第5步,確定核心概念、確定類的層次并設(shè)定類的屬性,也就是設(shè)計(jì)國史本體概念關(guān)系模型,是建立國史本體最重要的步驟。通過對(duì)知識(shí)來源的分析和抽象,參考相關(guān)歷史領(lǐng)域本體的經(jīng)驗(yàn),確定“人物”“事件”“時(shí)間”“地點(diǎn)”“組織機(jī)構(gòu)”“歷史文獻(xiàn)”“理念”“領(lǐng)域”8個(gè)大類,其中“理念”主要指國史上黨和政府的方針政策的特有術(shù)語表達(dá),如“科學(xué)發(fā)展觀”“三個(gè)代表重要思想”。對(duì)于機(jī)構(gòu)團(tuán)體,按其性質(zhì)分為“黨的機(jī)構(gòu)”、“政府機(jī)構(gòu)”、“人大機(jī)構(gòu)”、“政協(xié)機(jī)構(gòu)”、“重要企業(yè)單位”、“重要事業(yè)單位”等,為了表示特定歷史稱謂的群體,如“江青反革命集團(tuán)”,設(shè)立“特殊群體”二級(jí)類;對(duì)于歷史文獻(xiàn),根據(jù)重要程度分為“黨政文件”“題詞講話書信”“其他出版物”等二級(jí)類。各類之間通過屬性建立關(guān)聯(lián),國史本體概念模型如圖2所示。表格為本體類及其屬性,虛線及其邊上的文字代表不同類型的概念之間的關(guān)系。例如,“事件”類通過屬性“涉及人物”與“人物”類發(fā)生關(guān)聯(lián),“歷史文獻(xiàn)”類通過屬性“起草人”“作者”“報(bào)告人”與人物類發(fā)生關(guān)聯(lián)。這些屬性都是在文本分析的基礎(chǔ)上提煉出來的,文本中的出現(xiàn)概率較高的那些“謂詞”“條件”,如“出生”“發(fā)表”“任命”“在……地點(diǎn)發(fā)生”,常常演化成“出生年月”“文獻(xiàn)出版機(jī)構(gòu)”“曾任職務(wù)”“發(fā)生地點(diǎn)”等“屬性”。圖2 國史本體概念關(guān)系模型

      猜你喜歡
      本體
      Abstracts and Key Words
      灰鑄鐵缸體本體抗拉強(qiáng)度提升的研究
      眼睛是“本體”
      對(duì)姜夔自度曲音樂本體的現(xiàn)代解讀
      領(lǐng)域本體的查詢擴(kuò)展和檢索研究
      基于本體的機(jī)械產(chǎn)品工藝知識(shí)表示
      本體在產(chǎn)品設(shè)計(jì)知識(shí)管理中的應(yīng)用研究
      《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
      一種基于本體的語義檢索設(shè)計(jì)與實(shí)現(xiàn)
      媒介生存:關(guān)于新聞史研究本體的思考
      云和县| 芷江| 滨海县| 彭阳县| 卢龙县| 柳州市| 广汉市| 元朗区| 乌恰县| 莎车县| 娱乐| 拉萨市| 凤冈县| 东兰县| 郧西县| 闸北区| 宝应县| 横峰县| 阳曲县| 巴楚县| 彭泽县| 子长县| 泸州市| 永和县| 海口市| 汨罗市| 家居| 邵武市| 金湖县| 景东| 乐平市| 祁连县| 博乐市| 山丹县| 时尚| 电白县| 浠水县| 承德县| 黄平县| 吴忠市| 武义县|