• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      本體的自動(dòng)構(gòu)建方法

      2015-03-16 09:23:32王盼卿
      電子設(shè)計(jì)工程 2015年15期
      關(guān)鍵詞:領(lǐng)域?qū)<?/a>本體自動(dòng)

      解 崢,王盼卿,彭 成

      (軍械工程學(xué)院 河北 石家莊 050003)

      本體(ontology)原本是一個(gè)哲學(xué)概念,后來信息系統(tǒng)需要世界推理的模型,因此研究者在程序中利用術(shù)語“本體”來描述目標(biāo)世界的信息。1995年意大利Padova大學(xué)的Guarino等人對(duì)本體的不同概念解釋進(jìn)行深入分析,最后得出了一個(gè)基本得到領(lǐng)域認(rèn)同的本體概念,即“某些方面概念化的明確解釋或表示”[1],雖然不是本體最終的標(biāo)準(zhǔn)定義,但是對(duì)信息系統(tǒng)的研究具有理論指導(dǎo)意義。

      本體開發(fā)步驟包含:1)確定本體的領(lǐng)域和范圍;2)考慮現(xiàn)有本體的復(fù)用;3)枚舉本體的重要術(shù)語;4)定義類和類的層次;5)定義類的特性;6)定義屬性的約束;7)生成實(shí)例。根據(jù)本體的開發(fā)步驟,傳統(tǒng)的本體構(gòu)建方法主要有骨架法、評(píng)估法、Bernaras法、METHONTOLOGY法和SENSUS法。骨架法是領(lǐng)域內(nèi)本體構(gòu)建的常用基本方法,以骨架法[2]為例,簡單介紹一下本體的傳統(tǒng)構(gòu)建方法流程:1)確定本體應(yīng)用的目的和范圍;2)本體分析;3)本體表示;4)本體評(píng)估;5)本體建立。

      本體自動(dòng)構(gòu)建技術(shù),也被稱作本體學(xué)習(xí)。其目標(biāo)是通過與數(shù)據(jù)庫的連接,實(shí)現(xiàn)對(duì)內(nèi)部數(shù)據(jù)的自動(dòng)抽取,并且轉(zhuǎn)化出相應(yīng)的本體。本體自動(dòng)構(gòu)建方法種類繁多,但是主要過程大致相同,以H.Waste方法為例:1)確定本體應(yīng)用目的和范圍;2)數(shù)據(jù)抽取,機(jī)器分析;3)本體表示;4)概念區(qū)分;5)本體建立。

      1 本體自動(dòng)構(gòu)建研究現(xiàn)狀

      通過上文以看出傳統(tǒng)的本體構(gòu)建方法與本體自動(dòng)構(gòu)建方法在構(gòu)建思路上有些相似,并沒有太大不同。但是看兩者構(gòu)建過程中的具體操作過程(見表1),不難看出,在傳統(tǒng)構(gòu)建本體的過程中,主要以專家的經(jīng)驗(yàn)分析和人工操作來生成本體,雖然這樣構(gòu)建本體的可靠性高,但是隨之而來的高成本和長時(shí)間,使得構(gòu)建本體的難度大大增加,因此國內(nèi)外都加大了本體自動(dòng)構(gòu)建的研究力度。

      表1 傳統(tǒng)本體構(gòu)建方法與本體自動(dòng)構(gòu)建方法比較Tab.1 The traditional ontology construction method compared with themethod of building ontology automatically

      雖然本體自動(dòng)構(gòu)建雖然研究時(shí)間不是很長,但是卻已經(jīng)有了很多實(shí)質(zhì)性的進(jìn)展。通過對(duì)本體自動(dòng)構(gòu)建的研究,豐富了原有的知識(shí)庫,改進(jìn)了原有本體構(gòu)建的方式方法,現(xiàn)在國內(nèi)外已經(jīng)有很多的團(tuán)隊(duì)對(duì)本體的自動(dòng)構(gòu)建和半自動(dòng)構(gòu)建的方法研究。

      H.Waste等人根據(jù)“所需即所用”的思想,認(rèn)為同一領(lǐng)域內(nèi)的人對(duì)本領(lǐng)域的本體的構(gòu)建也會(huì)有著不同的的理解,針對(duì)不同的應(yīng)用就會(huì)有不同的本體[3]。他們于1999年左右提出了一個(gè)基于領(lǐng)域的初始核本體,然后再以此為基礎(chǔ),借助語言處理工具,機(jī)器通過尋找新的相似概念不斷的擴(kuò)充核本體,最終生成所需本體。這就是本體自動(dòng)構(gòu)建中的 “中間擴(kuò)展法”,其思想值得我們學(xué)習(xí)。但是這個(gè)方法最大的問題就在于需要建立一個(gè)領(lǐng)域的初始核本體,這需要領(lǐng)域?qū)<业慕槿耄液吮倔w的標(biāo)準(zhǔn)也很難劃定。

      Jean等人在2004年提出了一個(gè)通過先構(gòu)建局部本體,再通過對(duì)局部本體進(jìn)行本體合并,最后得出全局本體的自動(dòng)構(gòu)建方法[4]。其構(gòu)建原理為通過抽取數(shù)據(jù)之間的概念關(guān)系,構(gòu)造出局部本體,再通過計(jì)算局部本體的語義間概念相似度,抽取相同概念及概念間的關(guān)系,最終生成所需本體。這種方法主要存在的問題是抽取數(shù)據(jù)進(jìn)行局部本體構(gòu)建需要事先書寫預(yù)定義規(guī)則,對(duì)基礎(chǔ)信息語義間概念的區(qū)分難度比較大。

      2005年前后德國的卡爾斯魯厄大學(xué)的AIFB研究所開發(fā)的本體自動(dòng)構(gòu)建工具TextOnt,是一個(gè)可以從不同數(shù)據(jù)庫中抽取數(shù)據(jù)源的概念及其內(nèi)部關(guān)系再合并出對(duì)應(yīng)本體的工具。它最大特點(diǎn)是可以利用機(jī)器學(xué)習(xí)功能,進(jìn)行相應(yīng)的實(shí)例學(xué)習(xí),也可以對(duì)已生成的本體進(jìn)行裁剪、分類、擴(kuò)展和比較。他們對(duì)于本體構(gòu)建的基本認(rèn)識(shí)是認(rèn)為本體構(gòu)建主要應(yīng)該通過WordNet進(jìn)行自然語言理解和關(guān)聯(lián)語義挖掘。正是由于是對(duì)概念之間進(jìn)行分析操作,導(dǎo)致其主要問題是對(duì)概念的區(qū)分比較模糊,其概念間關(guān)系也不容易清晰的區(qū)分,后期需要大量的人工操作。

      University Of Rome開發(fā)的領(lǐng)域本體的Ontolearn是一個(gè)通過統(tǒng)計(jì)的方法從文本中抽取術(shù)語,再借助語言分析工具,進(jìn)行概念的抽取和分析,最后生成本體的工具。這種方法不同于其它方法之處就在于其基于統(tǒng)計(jì)的方法進(jìn)行文本數(shù)據(jù)分析,再確定本體的生成,改變了傳統(tǒng)的以專家參與的方式進(jìn)行本體構(gòu)建,更具有科學(xué)性和可靠性。

      在國內(nèi)對(duì)于中文的本體自動(dòng)構(gòu)建的研究也有很多,在2006年,Chang-Shing li等人依據(jù)繁體中文字典抽取詞語產(chǎn)生相應(yīng)概念,再在相應(yīng)的語境下,利用模糊推理進(jìn)行機(jī)器學(xué)習(xí),但是在全局本體的構(gòu)建中,仍需相應(yīng)的領(lǐng)域?qū)<彝瓿蒣5]。中國科學(xué)院陸汝鈐院士等人以知識(shí)庫中的基本領(lǐng)域本體為基礎(chǔ)[6],集合用戶需求,采用仿生物種群進(jìn)化的方法,對(duì)基礎(chǔ)本體進(jìn)行增添、重組和刪減來半自動(dòng)豐富已有本體。劉柏嵩等人提出針對(duì)WEB數(shù)據(jù),借助WordNet等工具區(qū)分出語義概念和實(shí)例。2009年楊爭庫等人通過對(duì)國外Jean等人研究的方法進(jìn)行深化,提出了依據(jù)本體間概念間的映射[7],通過書寫映射規(guī)則,達(dá)到本體自動(dòng)構(gòu)建目的。2010年王磊等人總結(jié)國內(nèi)外經(jīng)驗(yàn)得出了根據(jù)PAT-Tree[8]進(jìn)行詞匯、領(lǐng)域特征的提取,最終基于FCA構(gòu)建本體的方法。通過將以上國內(nèi)外方法總結(jié)歸納得出表2,通過對(duì)表2的分析,我們更容易看出各個(gè)方法在主要環(huán)節(jié)相同和不同的地方。

      表2 國內(nèi)外本體自動(dòng)構(gòu)建的主要方法Tab.2 Them ain method of ontology autom ated building at home and abroad

      2 存在的主要問題

      通過表2可以看出,雖然本體自動(dòng)構(gòu)建研究至今也發(fā)展了十多年的時(shí)間,理論進(jìn)展和實(shí)際成果也有很多,但是從本體自動(dòng)構(gòu)建流程圖(見圖1)中依然可以看出,目前本體自動(dòng)構(gòu)建過程還有很多問題:

      1)現(xiàn)在研究的眾多理論,大多還是要有領(lǐng)域?qū)<业膮⑴c,屬于半自動(dòng)的成果居多,只是實(shí)現(xiàn)了局部的自動(dòng)化。以H.Waste方法為例,需要相應(yīng)領(lǐng)域?qū)<蚁冗M(jìn)行簡單的領(lǐng)域分析,從中抽取主要概念及關(guān)系,然后在此基礎(chǔ)上構(gòu)建初始核本體。再將核本體進(jìn)行領(lǐng)域內(nèi)擴(kuò)展,將領(lǐng)域內(nèi)其余本體與和本體合并。但是這中間的初始核本體構(gòu)建以及領(lǐng)域間關(guān)系的擴(kuò)展依然要人工操作來完成,并未實(shí)現(xiàn)真正意義上的“自動(dòng)”;

      2)現(xiàn)在大多研究還是理論過程偏多,實(shí)際成果偏少,具體的自動(dòng)構(gòu)建流程偏少。特別是國內(nèi)對(duì)于本體自動(dòng)構(gòu)建的研究,都集中于理論過程的討論和簡單的驗(yàn)證,并沒有系統(tǒng)的完成對(duì)本體自動(dòng)構(gòu)建的具體實(shí)現(xiàn)。雖然Chang-Shing li和陸汝鈐院士的本體自動(dòng)構(gòu)建方法已經(jīng)部分應(yīng)用,但是對(duì)于中文的領(lǐng)域內(nèi)本體自動(dòng)構(gòu)建具體應(yīng)用還是很少;

      圖1 本體自動(dòng)構(gòu)建流程圖Fig.1 Ontology automated builds flowchart

      3)大多數(shù)處理語義間概念關(guān)系都是借助原有語言分析軟件 , 如 1995 年 的 WordNet、2003 年 的 FrameNet、2006 年 的HowNet等,新的語言分析軟件缺少。語言分析軟件是實(shí)現(xiàn)本體自動(dòng)構(gòu)建的核心工具之一,然而隨著時(shí)代的發(fā)展,我們已經(jīng)步入大數(shù)據(jù)時(shí)代,日新月異的數(shù)據(jù)和新概念成指數(shù)式增長,原有的語言分析軟件的處理能力有所不足。

      3 發(fā)展趨勢

      針對(duì)現(xiàn)今本體自動(dòng)構(gòu)建中存在的主要問題,未來本體自動(dòng)構(gòu)建的工作將圍繞解決這些主要問題展開:

      1)通過對(duì)當(dāng)今世界上主流本體自動(dòng)構(gòu)建方法的總結(jié)可以看出,雖然本體自動(dòng)構(gòu)建的方法多樣,形式不同,但是并沒有為特殊領(lǐng)域提供固定的規(guī)則標(biāo)準(zhǔn)來進(jìn)行選擇。因此需要結(jié)合各類領(lǐng)域再進(jìn)一步對(duì)本體自動(dòng)構(gòu)建方法進(jìn)行分類,使得在選擇本體自動(dòng)構(gòu)建方法時(shí)可以選取最優(yōu)化的方法。

      2)H.Waste在提出中間擴(kuò)展法自動(dòng)構(gòu)建本體時(shí)就指出在自動(dòng)構(gòu)建初始核本體的過程中,仍然需要相應(yīng)的領(lǐng)域?qū)<液鸵欢ǖ目蒲腥藛T先進(jìn)行初始核本體的創(chuàng)建。現(xiàn)在不僅是H.Waste的方法,大多數(shù)本體自動(dòng)構(gòu)建技術(shù)中依然要依賴領(lǐng)域?qū)<液涂蒲腥藛T進(jìn)行人工的分析操作。因此楊爭庫等人指出隨著人工智能的發(fā)展,基于統(tǒng)計(jì)和詞匯分析能力的人工智能技術(shù)已經(jīng)有了很大的進(jìn)步和很廣的應(yīng)用,可以結(jié)合現(xiàn)今技術(shù),實(shí)現(xiàn)本體自動(dòng)構(gòu)建的全自動(dòng)。

      3)以陸如鈐院士半自動(dòng)構(gòu)建本體方法和Chang-Shing li的方法為例,可以看出隨著本體自動(dòng)構(gòu)建系統(tǒng)理論的逐步完善,應(yīng)該逐漸向?qū)嵱没较虬l(fā)展。設(shè)計(jì)領(lǐng)域內(nèi)本體自動(dòng)構(gòu)建的框架,采取合適的自動(dòng)構(gòu)建技術(shù),切實(shí)將成果應(yīng)用于實(shí)際,實(shí)現(xiàn)對(duì)應(yīng)領(lǐng)域內(nèi)信息集成中本體的自動(dòng)構(gòu)建。

      4)在當(dāng)今互聯(lián)網(wǎng)大數(shù)據(jù)云存儲(chǔ)的背景下,設(shè)計(jì)全新的針對(duì)本體自動(dòng)構(gòu)建的在線或者固定更新的語言分析軟件,實(shí)時(shí)更新社會(huì)各領(lǐng)域內(nèi)詞匯,改進(jìn)現(xiàn)有語義間概念關(guān)系算法,提高概念區(qū)分的準(zhǔn)確度。

      4 結(jié)束語

      雖然現(xiàn)在本體自動(dòng)構(gòu)建方法存在一些問題和矛盾尚未解決好,實(shí)際的成果也不是很多,但是近幾年互聯(lián)網(wǎng)大數(shù)據(jù)時(shí)代的到來,使得傳統(tǒng)的基于本體的信息集成方法已經(jīng)開始漸漸滿足不了時(shí)代的需求,本體的自動(dòng)構(gòu)建將成為時(shí)代的必然選擇。而隨著本體自動(dòng)構(gòu)建理論的不斷完善和人工智能技術(shù)的不斷進(jìn)步,本體自動(dòng)構(gòu)建方法也將會(huì)向著更自動(dòng)更快捷的方向發(fā)展。

      [1]馮志勇,李文杰,李曉紅.本體論工程及其應(yīng)用[M].北京:清華大學(xué)出版社,2007.

      [2]宋佳.基于語義的裝備領(lǐng)域信息集成框架設(shè)計(jì)與查詢研究[D].石家莊:軍械工程學(xué)院,2008.

      [3]Cimiano P,Volker J.Text20nto a framework for ontology learning and data-driven change discovery[C]//Proceedings of the 1Oth International Conference on Applications of Natural Language to Information Svstrms,2005:227-238.

      [4]Barloroush A,Shamsfard M.Hasti:a model of ontology for NLU systems [C]//Proceedings of the 7th Iranian Conference on Electrical Engineering,1999:91-98.

      [5]Lee Chang-Shing,Kao Yuan-Fang,Kuo YauvHwang,et al.Automated ontologyconstruction for unstructured text documents[J].Data&Knowledge Engineering,2006,60(3):547-566.

      [6]陳剛,陸汝鈴,金芝.基于領(lǐng)域知識(shí)重用的虛擬領(lǐng)域本體構(gòu)造[J].軟件學(xué)報(bào),2003(3):350-355.CHEN Gang,LU Ru-ling,JIN Zhi.Based on knowledge reuse in the field of virtual domain ontology construction[J].Journal of Software,2003(3):350-355.

      [7]楊爭庫.信息集成中本體的自動(dòng)構(gòu)建及映射技術(shù) [D].西安:西安電子科技大學(xué),2009.

      [8]王磊,周寬久,仇鵬.領(lǐng)域本體自動(dòng)構(gòu)建研究[J].情報(bào)學(xué)報(bào),2010,29(1):45-52.WANG Lei,ZHOU Kuan-jiu,QIU Peng.Domain ontology automatically building research[J].Journal of Intelligence,2010,29(1):45-52.

      猜你喜歡
      領(lǐng)域?qū)<?/a>本體自動(dòng)
      Abstracts and Key Words
      良好睡眠,健康同行
      對(duì)姜夔自度曲音樂本體的現(xiàn)代解讀
      自動(dòng)捕盜機(jī)
      社交網(wǎng)絡(luò)中領(lǐng)域?qū)<野l(fā)現(xiàn)模型研究
      基于STM32的自動(dòng)喂養(yǎng)機(jī)控制系統(tǒng)
      電子測試(2018年10期)2018-06-26 05:53:36
      關(guān)于自動(dòng)駕駛
      汽車博覽(2016年9期)2016-10-18 13:05:41
      《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
      基于科技文獻(xiàn)庫的領(lǐng)域?qū)<胰喊l(fā)現(xiàn)及其推薦方法
      Stefan Greiner:我們?yōu)槭裁葱枰詣?dòng)駕駛?
      阳西县| 通城县| 蒙阴县| 鹤山市| 林芝县| 海兴县| 三江| 亳州市| 盐山县| 静安区| 鹤山市| 龙泉市| 永寿县| 武定县| 安岳县| 正蓝旗| 新河县| 磴口县| 定襄县| 徐州市| 福鼎市| 凭祥市| 新巴尔虎右旗| 舟山市| 尤溪县| 鱼台县| 大邑县| 高密市| 上栗县| 漳浦县| 镇江市| 陵川县| 察隅县| 根河市| 宣威市| 永吉县| 赤水市| 射洪县| 秦皇岛市| 平乐县| 古交市|