• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一種混合的領(lǐng)域概念分類體系自動(dòng)構(gòu)建算法

      2014-12-02 01:12:38羅年潔
      計(jì)算機(jī)工程 2014年12期
      關(guān)鍵詞:層次結(jié)構(gòu)自動(dòng)概念

      羅年潔,呂 釗

      (華東師范大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系,上海 200241)

      1 概述

      領(lǐng)域概念層次結(jié)構(gòu)是對(duì)特定領(lǐng)域的概念特征化描述,可反映該領(lǐng)域內(nèi)的知識(shí)和概念關(guān)系。它不僅有助于知識(shí)推理,促進(jìn)信息分類、搜索與導(dǎo)航,而且有助于人或機(jī)器理解一個(gè)高度集中或快速變化的領(lǐng)域[1-2]。一般地,領(lǐng)域概念層次構(gòu)建主要有2 個(gè)部分:領(lǐng)域概念間關(guān)系抽取與層次構(gòu)建?,F(xiàn)有面向領(lǐng)域的概念自動(dòng)構(gòu)建方法主要有2 類:基于知識(shí)庫(kù)的方法和基于原始數(shù)據(jù)的方法。

      基于知識(shí)庫(kù)的方法是通過(guò)已有的結(jié)構(gòu)化或半結(jié)構(gòu)化的知識(shí)網(wǎng)獲取領(lǐng)域詞對(duì)關(guān)系,然后構(gòu)建概念層次。例如,文獻(xiàn)[3]使用WordNet 構(gòu)建餐飲系統(tǒng);文獻(xiàn)[4]首先從維基百科抽取領(lǐng)域詞對(duì)關(guān)系,然后采用有向無(wú)環(huán)圖(Directed Acyclic Graph,DAG)算法構(gòu)建領(lǐng)域概念圖,最后通過(guò)深度遍歷來(lái)建立層次結(jié)構(gòu);文獻(xiàn)[5]使用其構(gòu)建的知識(shí)庫(kù)Probase 獲取領(lǐng)域概念關(guān)系,再對(duì)給定的關(guān)鍵詞集使用貝葉斯玫瑰樹(shù)(Bayesian Rose Tree,BRT)[6]來(lái)構(gòu)建汽車保險(xiǎn)領(lǐng)域的層次結(jié)構(gòu)。

      基于原始數(shù)據(jù)的方法主要依賴于純文本文檔,如文獻(xiàn)[7]基于頻率來(lái)統(tǒng)計(jì)詞對(duì)的共現(xiàn)概率,大于一定閾值則具有上下位關(guān)系,然后根據(jù)其算法(Fuzzy OntoExt)構(gòu)建概念圖;文獻(xiàn)[8]基于形式概念分析的研究,首先采用FCA 算法構(gòu)建概念格,然后使用KMeans 算法對(duì)概念進(jìn)行聚類。

      基于知識(shí)庫(kù)的方法獲取領(lǐng)域概念關(guān)系比較方便且準(zhǔn)確率高,然而隨著領(lǐng)域發(fā)展,會(huì)更新很多詞意,并產(chǎn)生新詞,知識(shí)庫(kù)拓展性弱,并未能實(shí)時(shí)反饋這些改變,這樣會(huì)導(dǎo)致領(lǐng)域概念間關(guān)系的查全率降低[9]?;谠紨?shù)據(jù)的方法會(huì)忽略了低頻領(lǐng)域詞。FCA 算法比較適用于對(duì)象-屬性類型的領(lǐng)域,最后得到的是領(lǐng)域的概念格,而不是一個(gè)直接的領(lǐng)域?qū)哟谓Y(jié)構(gòu)。

      國(guó)內(nèi)開(kāi)展了中文概念層次結(jié)構(gòu)構(gòu)建研究,如文獻(xiàn)[10]構(gòu)建了中文詞典的層次結(jié)構(gòu),其主要是先定義詞典中詞的語(yǔ)義框架,取得了較好的效果,但該方法擴(kuò)展性弱,不易移植到其他領(lǐng)域。文獻(xiàn)[11]在獲取領(lǐng)域術(shù)語(yǔ)后,采用一種自頂向下的聚類算法獲取領(lǐng)域概念間的層間關(guān)系,這種方法的聚類層數(shù)需要人工確定,無(wú)法自動(dòng)獲取完整的層次關(guān)系。

      現(xiàn)有的領(lǐng)域概念層次自動(dòng)構(gòu)建方法主要存在以下兩方面的問(wèn)題:(1)領(lǐng)域概念間的關(guān)系查全率低;(2)構(gòu)建算法復(fù)雜度高。為此,本文提出一種混合的領(lǐng)域概念層次結(jié)構(gòu)自動(dòng)構(gòu)建算法(DCTA)

      2 混合的領(lǐng)域概念層次結(jié)構(gòu)自動(dòng)構(gòu)建算法

      DCTA 算法的主要步驟如圖1 所示。

      圖1 DCTA 算法流程

      本文主要采用全自動(dòng)方法構(gòu)建中文領(lǐng)域的分類體系,主要包括關(guān)系抽取和層次構(gòu)建2 個(gè)部分。

      領(lǐng)域詞對(duì)關(guān)系的抽取過(guò)程如下:(1)輸入領(lǐng)域文檔集與領(lǐng)域關(guān)鍵詞詞集,使用“領(lǐng)域詞與上下文”的模式,獲取領(lǐng)域詞對(duì)共現(xiàn)的句子;(2)使用句法樹(shù)和基于規(guī)則的方法,獲取滿足要求的詞對(duì)集;(3)對(duì)以上2 個(gè)方法獲取的詞對(duì)集合進(jìn)行合并。

      層次結(jié)構(gòu)自動(dòng)構(gòu)建是對(duì)存在關(guān)系的領(lǐng)域詞構(gòu)建層次結(jié)構(gòu),其步驟如下:(1)輸入關(guān)系詞對(duì)集,通過(guò)改進(jìn)的BRT 算法對(duì)節(jié)點(diǎn)進(jìn)行合并、吸收和連接操作;(2)將所有的子節(jié)點(diǎn)歸并到一個(gè)父節(jié)點(diǎn)下,構(gòu)建領(lǐng)域?qū)哟谓Y(jié)構(gòu)。

      2.1 領(lǐng)域概念關(guān)系抽取

      領(lǐng)域概念是在特定領(lǐng)域文檔頻繁出現(xiàn)、反映該領(lǐng)域共性的特征詞語(yǔ),具有專指性強(qiáng)、領(lǐng)域區(qū)分度高、領(lǐng)域化代表性強(qiáng)的特點(diǎn)。隨著信息的發(fā)展,領(lǐng)域不斷更新,出現(xiàn)了很多新詞,其中包括大量的復(fù)合詞,即多個(gè)詞組成的多字概念,對(duì)于這些新詞,已有的知識(shí)庫(kù)未能實(shí)時(shí)更新,而且復(fù)合詞根據(jù)構(gòu)成詞存在一定領(lǐng)域?qū)哟侮P(guān)系。根據(jù)領(lǐng)域詞對(duì)關(guān)系的特點(diǎn),本文使用分治策略對(duì)句子中的一些特定語(yǔ)法結(jié)構(gòu)進(jìn)行預(yù)處理,選擇使用句法樹(shù)和基于規(guī)則的方法。

      由于句法分析是對(duì)語(yǔ)言進(jìn)行深入理解的基礎(chǔ),它從句子結(jié)構(gòu)上分析領(lǐng)域詞對(duì)關(guān)系,具有語(yǔ)料處理快、標(biāo)注方法和算法先進(jìn)、標(biāo)注標(biāo)準(zhǔn)和其他語(yǔ)料庫(kù)的兼容性較好等優(yōu)點(diǎn)。采用句法樹(shù)可以很好地提取領(lǐng)域中詞對(duì)間關(guān)系。

      基于規(guī)則的方法被廣泛應(yīng)用于關(guān)系識(shí)別和人名識(shí)別[12]等領(lǐng)域,可以最大限度地接近自然語(yǔ)言的句法習(xí)慣,從而被快速掌握;其表達(dá)方式靈活多樣,能最大限度地表達(dá)研究人員的思想;同時(shí)也能很好地解決復(fù)合詞包含的領(lǐng)域關(guān)系。

      2.1.1 句法樹(shù)分析法

      本文采用的句法樹(shù)是一個(gè)詞匯化的概率上下文無(wú)關(guān)文法(Probalilistic Context Free Grammar,PCFG)[13]語(yǔ)法分析器,句法分析模型句法樹(shù)分析的結(jié)果一般表示為樹(shù)結(jié)構(gòu),樹(shù)的節(jié)點(diǎn)表示句子的語(yǔ)法單元的名稱,而樹(shù)的分叉表示2 個(gè)或者多個(gè)語(yǔ)法單元組成一個(gè)新的、跨度更大的語(yǔ)法單元。

      例如對(duì)“神州行幸??ㄊ且豢顚槔夏昕蛻粼O(shè)計(jì)的具有月費(fèi)低,親情號(hào)碼通話優(yōu)惠的資費(fèi)套餐。”進(jìn)行句法分析,其中,“神州行幸??ā?、“親情號(hào)碼”、“資費(fèi)套餐”是3 個(gè)領(lǐng)域詞,從句法樹(shù)圖可以得到領(lǐng)域概念關(guān)系“神州行幸??ā笔恰百Y費(fèi)套餐”,其句法分析樹(shù)結(jié)構(gòu)如圖2 所示。可以看出,句法樹(shù)對(duì)句子關(guān)系能取得很好的結(jié)果,但對(duì)于名詞復(fù)合短語(yǔ)的關(guān)系抽取卻不理想,如“神州行”與“幸??ā敝g存在著整體與部分關(guān)系。名詞復(fù)合短語(yǔ)是各種語(yǔ)言中普遍存在的一種語(yǔ)法結(jié)構(gòu),對(duì)信息抽取、機(jī)器翻譯等應(yīng)用有很大的影響,由于句法分析對(duì)此類結(jié)構(gòu)的處理不夠理想,本文對(duì)名詞復(fù)合短語(yǔ)進(jìn)行專門處理,以降低句法分析的難度。針對(duì)漢語(yǔ)名詞復(fù)合短語(yǔ)的特點(diǎn),提出一種基于規(guī)則的名詞復(fù)合短語(yǔ)分析方法,以減小此類短語(yǔ)對(duì)句法分析的影響。

      圖2 句法分析實(shí)例

      2.1.2 基于規(guī)則的分析法

      為了實(shí)現(xiàn)對(duì)復(fù)合短語(yǔ)與其他復(fù)雜句式中領(lǐng)域概念關(guān)系的識(shí)別,本文引入基于規(guī)則的分析法,規(guī)則匹配用于發(fā)現(xiàn)一些文檔中沒(méi)有明確說(shuō)明的關(guān)系。隨著領(lǐng)域的不斷拓展,出現(xiàn)了很多復(fù)合詞,而且這些復(fù)合詞往往單獨(dú)在一些語(yǔ)句出現(xiàn),并未能表示它與領(lǐng)域詞的關(guān)系,它往往是多個(gè)名詞的組合形成。通過(guò)統(tǒng)計(jì)一些名詞出現(xiàn)在領(lǐng)域概念的開(kāi)始或結(jié)尾的頻率,高頻詞成為領(lǐng)域詞特定的前綴或后綴。根據(jù)語(yǔ)義,這些前綴或后綴詞與復(fù)合詞具有上下位關(guān)系。比如在手機(jī)電信領(lǐng)域中,短信業(yè)務(wù)、彩鈴業(yè)務(wù)等都含有相同的后綴詞業(yè)務(wù),這些后綴詞業(yè)務(wù)表達(dá)了領(lǐng)域概念“短信業(yè)務(wù)”、“彩鈴業(yè)務(wù)”的特性與所屬類別。本文根據(jù)領(lǐng)域詞的關(guān)系特點(diǎn)制定規(guī)則,如表1 所示。

      表1 規(guī)則示例

      領(lǐng)域概念包含4 種關(guān)系:ISA,Part-Of,Attribute-Of 和Instance-Of。ISA 關(guān)系表示類別之間有共同的屬性,用來(lái)表示概念的逐步細(xì)化,類似于面向?qū)ο笾械睦^承概念;Part-Of 關(guān)系表示類別之間是整體和部分的關(guān)系;Attribute-Of 表示關(guān)系表示某對(duì)象是一概念的屬性;Instance-Of 關(guān)系表示某對(duì)象是一概念的實(shí)例。表2 為上述4 種關(guān)系類型的關(guān)系舉例。

      表2 領(lǐng)域詞4 種關(guān)系類型舉例

      2.2 基于改進(jìn)的BRT 領(lǐng)域概念層次構(gòu)建

      本文基于關(guān)系抽取獲取的領(lǐng)域詞對(duì)集-構(gòu)建領(lǐng)域?qū)哟?。在初始化時(shí)每個(gè)數(shù)據(jù)點(diǎn)都是一棵樹(shù),如Ti={xi},xi表示第i個(gè)數(shù)據(jù)節(jié)點(diǎn)的特征向量,每一步選取2 個(gè)層次結(jié)構(gòu)Ti,Tj融合成一個(gè)新分類結(jié)構(gòu)Tm,如圖3 所示。

      圖3 節(jié)點(diǎn)初始化分類體系

      本文通過(guò)算法比較,確定2 個(gè)層次結(jié)構(gòu)的融合方式,有3 種融合方式:連接,吸收,歸并。

      (1) 連接(Join)

      其中,leaves表示每個(gè)層次結(jié)構(gòu)的所有的葉節(jié)點(diǎn)。這個(gè)方法是從根節(jié)點(diǎn)合并2 個(gè)層次結(jié)構(gòu),Tm有2 個(gè)子節(jié)點(diǎn),如圖4 所示。

      圖4 C 節(jié)點(diǎn)和D 節(jié)點(diǎn)的連接操作

      (2) 吸收(Absorb)

      如圖5 所示,此方法可以理解Tj變?yōu)門i的子節(jié)點(diǎn),對(duì)于2 棵層次結(jié)構(gòu),也有可能Ti變?yōu)門j的子節(jié)點(diǎn),此方法逆向的表示為:

      圖5 A 節(jié)點(diǎn)與B 節(jié)點(diǎn)的吸收操作

      (3) 歸并(Collapse)

      2 棵層次結(jié)構(gòu)的子節(jié)點(diǎn)歸并成一個(gè)層次結(jié)構(gòu)下,如圖6 所示。

      圖6 歸并操作

      算法每一步挑選2 個(gè)層次結(jié)構(gòu)進(jìn)行3 種可能性合并操作,得到每種合并方法的概率,其計(jì)算公式如下:

      其中,D表示層次結(jié)構(gòu)T的所有數(shù)據(jù)節(jié)點(diǎn);f(D)代表邊緣概率;πT是表示所有在T的數(shù)據(jù)不被分成子層次結(jié)構(gòu)的先驗(yàn)概率,其定義如下:

      其中,γ是介于0 和1 之間的控制模型超級(jí)參數(shù);n表示T中子節(jié)點(diǎn)的數(shù)目。不同的γ對(duì)實(shí)驗(yàn)結(jié)果有很大影響。

      對(duì)于邊緣概率f(D)的表示采用了基于多項(xiàng)式的Dirichlet 共軛分布(DCM)[14],因此,它更能代表一個(gè)或多個(gè)主題,在分層聚類中,逐步合并簇。

      其中,V表示詞量是相對(duì)于的頻率;m=表示第i個(gè)節(jié)點(diǎn)和j個(gè)節(jié)點(diǎn)的關(guān)系概率。

      對(duì)3 種融合方式,采用比率評(píng)分Score(D|T)形式?jīng)Q定選擇哪種融合方式,其公式如下:

      領(lǐng)域?qū)哟谓Y(jié)構(gòu)自動(dòng)構(gòu)建算法如下:

      輸入領(lǐng)域詞集

      輸出領(lǐng)域概念層次結(jié)構(gòu)

      在原來(lái)的BRT 算法復(fù)雜度為O(n2Cv+n2logn),空間復(fù)雜度為O(n2),其中,Cv為所有初始化向量xi中所有非零元素的最大數(shù),當(dāng)領(lǐng)域詞的個(gè)數(shù)比較多時(shí)Cv是一個(gè)不容忽視的數(shù)。本文將領(lǐng)域詞對(duì)間關(guān)系也考慮在內(nèi),計(jì)算了2 個(gè)領(lǐng)域詞關(guān)系的概率,降低了了邊緣概率的復(fù)雜度,此算法將復(fù)雜度降低到O(n2logn)。其中,領(lǐng)域詞對(duì)關(guān)系為:

      如果2 個(gè)節(jié)點(diǎn)有關(guān)系,更能準(zhǔn)確計(jì)算2 個(gè)節(jié)點(diǎn)的融合方式,將R(xi,xj)代入節(jié)點(diǎn)融合運(yùn)算,不僅降低了算法復(fù)雜度,而且有利于保證層次結(jié)構(gòu)構(gòu)建的正確性。

      3 實(shí)驗(yàn)與結(jié)果分析

      3.1 測(cè)試數(shù)據(jù)集和實(shí)驗(yàn)方案

      本文實(shí)驗(yàn)分別對(duì)通信、金融和計(jì)算機(jī)3 個(gè)領(lǐng)域?qū)崿F(xiàn)概念層次自動(dòng)構(gòu)建。實(shí)驗(yàn)評(píng)估標(biāo)準(zhǔn)參考文獻(xiàn)[15]提出的本體評(píng)價(jià)標(biāo)準(zhǔn),其公式如下:

      其中,Ref表示參考的層次結(jié)構(gòu);Comp表示要比較層次結(jié)構(gòu)。通過(guò)上式可以計(jì)算領(lǐng)域概念層次結(jié)構(gòu)的查準(zhǔn)率P、查全率R和綜合指標(biāo)F值。Ref以手動(dòng)構(gòu)建的概念層次結(jié)構(gòu)作為參考標(biāo)準(zhǔn)。

      關(guān)系抽取部分采用PCFG 的句法結(jié)構(gòu)訓(xùn)練得到的句法分析器進(jìn)行句法分析,然后采用規(guī)則匹配的方法,并將兩者結(jié)合,統(tǒng)計(jì)ISA 和Part-of 兩種關(guān)系的種類,實(shí)驗(yàn)表明該2 種關(guān)系占總數(shù)的80%,表3 展示了30 對(duì)領(lǐng)域概念關(guān)系抽取結(jié)果。該表是對(duì)3 個(gè)領(lǐng)域的詞對(duì)關(guān)系舉例說(shuō)明,部分領(lǐng)域詞對(duì)間關(guān)系如表2 所示。實(shí)驗(yàn)的機(jī)器配置如下:處理器為Intel ?Pentium? CPU G630 @2.7 GHz,內(nèi)存4 GB,操作系統(tǒng)為Win7 64 位。

      表3 領(lǐng)域詞對(duì)關(guān)系

      3.2 結(jié)果分析

      本文實(shí)驗(yàn)主要包括2 個(gè)步驟:領(lǐng)域詞關(guān)系抽取和自動(dòng)構(gòu)建層次結(jié)構(gòu),關(guān)系抽取對(duì)第2 步的層次構(gòu)建有很大影響,因此,本文對(duì)兩部分進(jìn)行了實(shí)驗(yàn)分析。

      3.2.1 領(lǐng)域詞對(duì)關(guān)系抽取的效果評(píng)估

      該部分主要是獲取領(lǐng)域關(guān)系,表4 顯示的是分別采用句法樹(shù)、基于規(guī)則的方法,句法樹(shù)與基于規(guī)則結(jié)合的方法和人工4 種方法獲取通信領(lǐng)域概念詞對(duì)關(guān)系的對(duì)比結(jié)果。

      表4 關(guān)系抽取效果比較

      中文表達(dá)比較模棱兩可,再加上句法結(jié)構(gòu)復(fù)雜,其中還有一小部分沒(méi)有識(shí)別出來(lái),對(duì)其進(jìn)行分析,其原因如下:

      (1) 若2 個(gè)領(lǐng)域概念多次共現(xiàn)在同一句子,共現(xiàn)頻率比較高則可能存在一定的關(guān)系,本文缺少對(duì)此方面的考慮;

      (2) 網(wǎng)絡(luò)抓取的部分句子結(jié)構(gòu)比較長(zhǎng),句法比較復(fù)雜,中間干擾詞比較多,而結(jié)果錯(cuò)誤的判給其他領(lǐng)域詞。

      3.2.2 層次結(jié)構(gòu)自動(dòng)構(gòu)建的效果評(píng)估

      基于上一步獲取領(lǐng)域詞以及關(guān)系,在使用改進(jìn)的BRT 算法時(shí),通過(guò)不斷實(shí)驗(yàn)發(fā)現(xiàn)當(dāng)γ=0.3 時(shí),效果最優(yōu)。對(duì)通信領(lǐng)域數(shù)據(jù)進(jìn)行5 次實(shí)驗(yàn),結(jié)果如表5所示,其中,n表示領(lǐng)域詞的個(gè)數(shù)。

      表5 通信領(lǐng)域?qū)嶒?yàn)結(jié)果 %

      筆者發(fā)現(xiàn)領(lǐng)域概念數(shù)量越多其查準(zhǔn)率越高,因?yàn)殡S著領(lǐng)域詞豐富,一方面能更多的發(fā)現(xiàn)領(lǐng)域詞關(guān)系,對(duì)關(guān)系識(shí)別越有利;另一方面在層次自動(dòng)構(gòu)建上,隨著領(lǐng)域概念數(shù)量的增多,能更準(zhǔn)確地定位到節(jié)點(diǎn),更有利于提高節(jié)點(diǎn)融合的準(zhǔn)確率。

      采用BRT 算法和改進(jìn)的BRT 算法在通信領(lǐng)域的領(lǐng)域概念數(shù)n=500 時(shí),做了對(duì)比實(shí)驗(yàn),其結(jié)果如表6 所示??梢钥闯?DCTA 算法構(gòu)建的層次結(jié)構(gòu)查準(zhǔn)率最高達(dá)88%,比使用BRT 算法提高了5.4%,查全率提高了5% 。實(shí)驗(yàn)表明本文算法的可行性。

      表6 2 種構(gòu)建算法的結(jié)果比較 %

      另外,將此算法對(duì)金融和計(jì)算機(jī)領(lǐng)域構(gòu)建層次結(jié)構(gòu),其結(jié)果如表7 所示。可以看出,本文方法具有很強(qiáng)的移植性,可以適用金融領(lǐng)域和計(jì)算機(jī)領(lǐng)域。證明該算法充分考慮了領(lǐng)域概念的特點(diǎn),選擇算法可用性強(qiáng),適用于構(gòu)建復(fù)雜領(lǐng)域?qū)哟谓Y(jié)構(gòu)。

      表7 金融領(lǐng)域和計(jì)算機(jī)領(lǐng)域?qū)嶒?yàn)結(jié)果 %

      4 結(jié)束語(yǔ)

      本文提出基于中文面向領(lǐng)域的概念層次自動(dòng)構(gòu)建算法(DCTA),該算法主要包括領(lǐng)域詞對(duì)關(guān)系抽取和自動(dòng)層次構(gòu)建,即采用句法樹(shù)和基于規(guī)則的混合方法獲取領(lǐng)域詞關(guān)系,然后使用改進(jìn)的BRT算法構(gòu)建層次結(jié)構(gòu)。本文研究實(shí)現(xiàn)了對(duì)3 個(gè)領(lǐng)域的概念層次自動(dòng)構(gòu)建,并在通信領(lǐng)域與傳統(tǒng)的BRT算法進(jìn)行了對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,本文算法具有較高的查準(zhǔn)率,而且可移植性強(qiáng)。下一步將改進(jìn)算法以提高分類體系的準(zhǔn)確度,并針對(duì)更多的領(lǐng)域進(jìn)行實(shí)驗(yàn),推導(dǎo)出適用多個(gè)相關(guān)領(lǐng)域的分類體系算法。

      [1]Sadikov E,Madhavan J,Wang Lu,et al.Clustering Query Refinements by User Intent[C]//Proceedings of the 19th International Conference on World Wide Web.New York,USA:ACM Press,2010:841-850.

      [2]Perry P,Wise W,O’ Neill D,et al.Leveraging a Technical Domain Taxonomy to Enhance Collaboration,Knowledge Sharing and Operational Support [C]//Proceedings of SPE Digital Energy Conference and Exhibition.The Woodlands,USA:Society of Petroleum Engineers,2011:19-21.

      [3]Agirre E,de Lacalle O.Publicly Available Topic Signatures for All WordNet Nominal Senses [C]//Proceedings of LREC’04.Lisbon,Portugal:European Language Resources Association,2004:1123-1126.

      [4]Deshpande O,Lamba D S,Tourn M,et al.Building,Maintaining,and Using Knowledge Bases:A Report from the Trenches [C]//Proceedings of 2013 International Conference on Management of Data.New York,USA:ACM Press,2013:1209-1220.

      [5]Liu Xueqing,Song Yangqiu,Liu Shixia,et al.Automatic Taxonomy Construction from Keywords [ C]//Proceedings of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.New York,USA:ACM Press,2012:1433-1441.

      [6]Blundell C,Teh Y W,Heller K A.Bayesian Rose Trees[C]// Proceedings of UAI’10.Catalina Island,USA:[s.n.],2010:68-76.

      [7]Monachesi P,Markus T,Mossel E.Ontology Enrichment with Social Tags for eLearning[C]//Proceedings of the 4th European Conference on Technology Enhanced Learning.Nice,France:[s.n.],2010:385-390.

      [8]Lupea M,Tatar D,Marian Z.Learning Taxonomy for Text Segmentation by Formal Concept Analysis[C]//Proceedings of CoRR’ 10.[S.l.]:Springer,2010:84-92.

      [9]Tsui E,Wang W M,Cheung C F,et al.A Conceptrelationship Acquisition and Inference Approach for Hierarchical Taxonomy Construction from Tags [ J].Information Processing &Management,2010,46 (1):44-57.

      [10]Bai Xiaopeng,Xue Nianwen.Building a Chinese Lexical Taxonomy[C]//Proceedings of the 2nd CIPS-SIGHAN Joint Conference on Chinese Language Processing.Tianjin,China:[s.n.],2012.

      [11]何婷婷,張小鵬.特定領(lǐng)域本體自動(dòng)構(gòu)造方法[J].計(jì)算機(jī)工程,2007,33(22):235-237.

      [12]Wang Zuxing,Zhu Xiaoting,Lu Zhao.A Context-aware Automatic Chinese Transliterated Person Names Recognition Approach[C]//Proceedings of the 8th International Conference on Semantics,Knowledge and Grids.Beijing,China:[s.n.],2012:143-149.

      [13]Johnson M.PCFG Models of Linguistic Tree Representations[J].Computational Linguistics,1998,24(4):613-632.

      [14]Madsen R E,Kauchak D,Elkan C.Modeling Word Burstiness Using the Dirichlet Distribution[C]//Proceedings of the 22nd International Conference on Machine Learning.New York,USA:ACM Press,2005:545-552.

      [15]Dellschaft K,Staab S.Strategies for the Evaluation of Ontology Learning[C]//Proceedings of 2008 Conference on Ontology Learning and Population:Bridging the Gap Between Text and Knowledge.Amsterdam,Holland:IOS Press,2008:253-272.

      猜你喜歡
      層次結(jié)構(gòu)自動(dòng)概念
      Birdie Cup Coffee豐盛里概念店
      基于級(jí)聯(lián)網(wǎng)絡(luò)和語(yǔ)義層次結(jié)構(gòu)的圖像自動(dòng)標(biāo)注方法
      自動(dòng)捕盜機(jī)
      幾樣概念店
      學(xué)習(xí)集合概念『四步走』
      基于STM32的自動(dòng)喂養(yǎng)機(jī)控制系統(tǒng)
      聚焦集合的概念及應(yīng)用
      論立法修辭功能的層次結(jié)構(gòu)
      法律方法(2017年2期)2017-04-18 09:00:37
      關(guān)于自動(dòng)駕駛
      汽車博覽(2016年9期)2016-10-18 13:05:41
      建構(gòu)利益相關(guān)者管理的三層次結(jié)構(gòu)分析
      东辽县| 延庆县| 高陵县| 栾城县| 东安县| 阳高县| 勃利县| 安泽县| 全椒县| 黄浦区| 辽源市| 夏津县| 三河市| 长葛市| 郴州市| 宜昌市| 钦州市| 那曲县| 太和县| 德钦县| 紫云| 波密县| 元氏县| 易门县| 花莲市| 青浦区| 阿克陶县| 大田县| 馆陶县| 望江县| 富源县| 贵定县| 三台县| 彭州市| 贵定县| 乌审旗| 和平区| 盱眙县| 新宁县| 阳新县| 封开县|