• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      工程機(jī)械維修保養(yǎng)知識(shí)圖譜建模研究

      2020-08-15 13:30:21董登奎曾擁華
      現(xiàn)代信息科技 2020年7期
      關(guān)鍵詞:自然語(yǔ)言處理知識(shí)體系知識(shí)圖譜

      董登奎 曾擁華

      摘? 要:針對(duì)工程機(jī)械維修保養(yǎng)知識(shí)圖譜建模人工建模成本高、難度大且覆蓋度難以保證等問(wèn)題,提出基于自頂向下和自底向上相結(jié)合的知識(shí)圖譜建模方法。首先,人工定義構(gòu)建工程機(jī)械維修保養(yǎng)知識(shí)圖譜的頂層數(shù)據(jù)模式;然后,利用知識(shí)抽取技術(shù)從文本數(shù)據(jù)中抽取實(shí)體、屬性、關(guān)系知識(shí);最后對(duì)自頂向下方法的結(jié)果與自底向上方法的結(jié)果進(jìn)行合并融合。實(shí)驗(yàn)驗(yàn)證表明,該文所提出的知識(shí)建模方法可以大大降低人工建模的難度,同時(shí)具備較好的覆蓋度和準(zhǔn)確性,可以滿足工程機(jī)械維修保養(yǎng)知識(shí)圖譜構(gòu)建與應(yīng)用的需求。

      關(guān)鍵詞:知識(shí)體系;動(dòng)態(tài)本體;工程機(jī)械維修保養(yǎng);知識(shí)圖譜;自然語(yǔ)言處理

      中圖分類號(hào):TP391? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2020)07-0011-04

      Research on the Knowledge Map Modeling of Construction Machinery Maintenance

      DONG Dengkui,ZENG Yonghua

      (Army Engineering University,Nanjing? 210007,China)

      Abstract:Aiming at the problems of high cost,difficulty and difficulty in guaranteeing the construction of knowledge graph modeling for construction machinery maintenance knowledge,a knowledge graph modeling method based on the combination of top-down and bottom-up is proposed. First,manually define the top-level data model for constructing the knowledge map of maintenance and repair of construction machinery;then,use knowledge extraction techniques to extract entity,attribute,and relationship knowledge from the text data;finally,the results of top-down method and bottom-up method are merged. Experimental verification shows that the knowledge modeling method proposed in this article can greatly reduce the difficulty of manual modeling,and has good coverage and accuracy,which can meet the needs of construction machinery maintenance knowledge graph construction and application.

      Keywords:knowledge system;dynamic ontology;maintenance of construction machinery;knowledge graph;natural language processing

      0? 引? 言

      在工程機(jī)械維修保養(yǎng)領(lǐng)域,由于機(jī)械使用強(qiáng)度大、工程機(jī)械種類繁多、功能多樣、結(jié)構(gòu)復(fù)雜和損傷率較高等問(wèn)題,對(duì)工程機(jī)械維修保養(yǎng)的時(shí)效性、維修保養(yǎng)率、零部件備換提出更高的要求。同時(shí),對(duì)維修保養(yǎng)人員對(duì)系統(tǒng)原理和機(jī)械使用的熟練度、故障檢測(cè)和維護(hù)保養(yǎng)方法知識(shí)也提出更高的掌握要求。海量的機(jī)械維修保養(yǎng)數(shù)據(jù)蘊(yùn)含著上述問(wèn)題的實(shí)踐知識(shí),具有極高的使用價(jià)值和參考意義。然而,目前這些知識(shí)仍然以數(shù)據(jù)孤島的形式存在于各類存儲(chǔ)介質(zhì)中,維修保養(yǎng)人員難以從中提取出數(shù)據(jù)關(guān)聯(lián)進(jìn)行更精準(zhǔn)的維修保養(yǎng)判斷。這些數(shù)據(jù)缺乏統(tǒng)一的知識(shí)體系描述、有效的組織結(jié)構(gòu)和直觀形象的使用方式,難以進(jìn)行深層次的數(shù)據(jù)關(guān)聯(lián)挖掘和應(yīng)用。

      1? 工程機(jī)械維修保養(yǎng)知識(shí)圖譜建模

      知識(shí)圖譜(Knowledge Graph)由谷歌在2012年率先提出[1],并將其應(yīng)用于提高搜索引擎的性能,提高搜索質(zhì)量。旨在借助信息處理技術(shù),結(jié)合語(yǔ)義網(wǎng)、本體論、自然語(yǔ)言處理從海量文本中抽取實(shí)體、屬性以及關(guān)系等知識(shí)。知識(shí)圖譜包括面向通用領(lǐng)域和面向垂直領(lǐng)域的知識(shí)圖譜,分別被稱為通用知識(shí)圖譜和行業(yè)知識(shí)圖譜。

      知識(shí)圖譜構(gòu)建的第一步是為知識(shí)圖譜進(jìn)行建模,知識(shí)圖譜建模的主要工作是為其構(gòu)建本體。本體構(gòu)建通常有三種構(gòu)建方式:人工構(gòu)建方式、自動(dòng)構(gòu)建方式和半自動(dòng)構(gòu)建方式。工程機(jī)械維修保養(yǎng)領(lǐng)域是專業(yè)程度非常高的領(lǐng)域[2],領(lǐng)域?qū)<乙餐ǔH精通其中的部分子領(lǐng)域,因此,建立完整的領(lǐng)域知識(shí)圖譜數(shù)據(jù)模式需要各子領(lǐng)域的專家一起協(xié)作才能完成;協(xié)作建模需要能夠支撐同步在線協(xié)作的工具平臺(tái)。另一方面,人工定義的數(shù)據(jù)模式很難實(shí)時(shí)進(jìn)行更新。筆者針對(duì)工程機(jī)械維修保養(yǎng)領(lǐng)域知識(shí)圖譜建模存在的如上問(wèn)題,提出自頂向下與向底向上相結(jié)合的知識(shí)建模方法。首先,通過(guò)工程機(jī)械維修保養(yǎng)領(lǐng)域本身特性以及專家經(jīng)驗(yàn)進(jìn)行頂層知識(shí)數(shù)據(jù)模式構(gòu)建,提供了一款能夠多人在線協(xié)作的平臺(tái)工具;然后,在實(shí)體識(shí)別、屬性抽取等技術(shù)進(jìn)行領(lǐng)域知識(shí)抽取的基礎(chǔ)上,通過(guò)概念規(guī)約、屬性規(guī)約得到領(lǐng)域的概念、屬性和關(guān)系,接著通過(guò)上下位學(xué)習(xí)對(duì)概念進(jìn)行組織;最終通過(guò)把自底向上方法的結(jié)果和自頂向下定義的知識(shí)體系相結(jié)合,形成完整的工程機(jī)械維修保養(yǎng)知識(shí)圖譜數(shù)據(jù)模式。

      2? 工程機(jī)械維修保養(yǎng)知識(shí)圖譜建模方法

      本節(jié)主要對(duì)基于動(dòng)態(tài)的雙向知識(shí)建模方法展開描述。首先,介紹工程機(jī)械維修保養(yǎng)知識(shí)圖譜建模的整體流程,然后分別介紹自頂向下知識(shí)建模方法和自底向上知識(shí)建模方法,最后對(duì)兩種方法的結(jié)果進(jìn)行融合形成完整的工程機(jī)械維修保養(yǎng)知識(shí)圖譜數(shù)據(jù)模式。

      2.1? 知識(shí)圖譜建模整體架構(gòu)

      筆者結(jié)合維修保養(yǎng)工程機(jī)械數(shù)據(jù)特性以及應(yīng)用場(chǎng)景,提出一種基于自頂向下方法與自底向上結(jié)合的知識(shí)建模的方法對(duì)工程機(jī)械維修保養(yǎng)知識(shí)體系進(jìn)行構(gòu)建,構(gòu)建流程如圖1所示。首先通過(guò)工程機(jī)械維修保養(yǎng)數(shù)據(jù)總結(jié)部分概念特性,然后結(jié)合專家經(jīng)驗(yàn)對(duì)部分概念進(jìn)行進(jìn)一步加工整合,形成以概念定義、屬性定義和上下位定義構(gòu)成的概念分類體系,形成頂層知識(shí)體系。然后,獲取海量的工程機(jī)械維修保養(yǎng)文本,采用術(shù)語(yǔ)抽取、同義抽取、概念學(xué)習(xí)和概念規(guī)約、屬性規(guī)約等方法形成自底向上的概念及其屬性集合,然后進(jìn)一步通過(guò)上下位學(xué)習(xí),得到自底向上的概念分類體系。自底向上方法是對(duì)自頂向下方法的補(bǔ)充和完善。

      2.2? 自頂向下知識(shí)建模方法與工具

      自頂向下的方法是指根據(jù)專家經(jīng)驗(yàn)自頂向下進(jìn)行數(shù)據(jù)模式的定義,包含概念定義、概念上下位關(guān)系定義、概念數(shù)值屬性定義、概念對(duì)象屬性(關(guān)系)定義。

      本文設(shè)計(jì)實(shí)現(xiàn)的知識(shí)圖譜協(xié)作編輯與學(xué)習(xí)平臺(tái)命名為KGELP(Knowledge Graph Edit and Learning Platform),其基本的功能如圖2~圖5所示;與現(xiàn)有的本體編輯工具相比,它具備如下優(yōu)勢(shì):

      (1)提供在線編輯功能,能夠支持大規(guī)模的用戶并發(fā)編輯,提供對(duì)并發(fā)編輯情形下的數(shù)據(jù)一致性和數(shù)據(jù)完整性保證。

      (2)能夠與后臺(tái)的自動(dòng)知識(shí)學(xué)習(xí)引擎結(jié)合,通過(guò)為知識(shí)圖譜學(xué)習(xí)算法定義配置文件以啟動(dòng)知識(shí)自動(dòng)學(xué)習(xí)過(guò)程,然后在自動(dòng)學(xué)習(xí)的基礎(chǔ)上進(jìn)行知識(shí)圖譜的編輯,避免了從頭開始構(gòu)建知識(shí)圖譜,極大程度地減少了人工工作量。

      (3)提供可視化編輯功能,用戶可以通過(guò)所見即所得的方式進(jìn)行編輯。

      2.3? 自底向上知識(shí)建模方法

      自底向上知識(shí)建模方法主要是基于數(shù)據(jù)的特性從數(shù)據(jù)層出發(fā)向上規(guī)約合并,首先從大量的中規(guī)約得到概念,然后進(jìn)行概念之前的上下位關(guān)系學(xué)習(xí),最后從實(shí)體的屬性信息中規(guī)約得到概念的屬性。

      2.3.1? 概念規(guī)約

      作為概念的術(shù)語(yǔ)一般需要具備三個(gè)要素:內(nèi)涵性、外延性和詞匯共現(xiàn)性。概念可以通過(guò)兩種方式規(guī)約得到:首先,概念可以通過(guò)對(duì)所有的術(shù)語(yǔ)進(jìn)行統(tǒng)計(jì)歸類,抽取出共性的術(shù)語(yǔ)部分,結(jié)合語(yǔ)法的相關(guān)性,得到概念集合;第二種方法為從實(shí)體中進(jìn)行規(guī)約,其主要過(guò)程為對(duì)實(shí)體依據(jù)其屬性進(jìn)行聚類統(tǒng)計(jì)分析,此方法會(huì)把實(shí)體按照那些具備區(qū)分性的屬性進(jìn)行聚集,這些聚集在一起的實(shí)體通常即形成一個(gè)新的概念;例如,假設(shè)一開始定義了概念“故障”,所有的具體故障案例都是此概念的實(shí)體,這些實(shí)體有一個(gè)屬性“故障類型”,屬性的值為可枚舉的且通常每種值有一定數(shù)量的實(shí)體,這時(shí)算法通常會(huì)按“故障的類型”規(guī)約得到概念“故障”的子概念。

      2.3.2? 上下位關(guān)系抽取

      本文通過(guò)一種基于機(jī)器學(xué)習(xí)的方法來(lái)學(xué)習(xí)概念之間的上下位關(guān)系。以機(jī)器學(xué)習(xí)的方法使用遠(yuǎn)距離監(jiān)督學(xué)習(xí)的思想為基礎(chǔ),基于現(xiàn)有的上下位關(guān)系生成訓(xùn)練所需要的語(yǔ)料然后進(jìn)行迭代式機(jī)器學(xué)習(xí)。其基本步驟如下:

      (1)候選實(shí)體的選?。涸谥R(shí)圖譜中已經(jīng)確定的實(shí)體中,除去那些已經(jīng)被確定為同義關(guān)系中所包含的實(shí)體,其他的實(shí)體均作為候選實(shí)體。同時(shí),也選取“基本名詞短語(yǔ)”作為候選實(shí)體。

      (2)建模過(guò)程:在上下位關(guān)系抽取中,處理的目標(biāo)為中文句子,其中可觀測(cè)的序列X是中文詞語(yǔ)或詞性的序列,隱含狀態(tài)序列Y則是本文所定義的用于標(biāo)記實(shí)體、同義關(guān)系和其他詞或詞性的符號(hào)。本文假設(shè)Y是滿足一階馬爾可夫假設(shè)的,因此,可以把此問(wèn)題建模成一個(gè)序列標(biāo)注問(wèn)題;本文所使用的模型為BiLSTM+CRF。

      (3)自監(jiān)督方式訓(xùn)練模型:訓(xùn)練語(yǔ)料中正例和負(fù)例的選取也是使用已經(jīng)抽取的上下位關(guān)系和一些模式無(wú)關(guān)的通用規(guī)則。正例的選取規(guī)則非常簡(jiǎn)單,即候選句子中滿足距離要求的實(shí)體之間具備上下位關(guān)系。所使用的確定負(fù)例的啟發(fā)式規(guī)則樣例下兩個(gè)實(shí)體是同義關(guān)系、兩個(gè)實(shí)體不屬于同樣的類別。

      2.3.3? 屬性規(guī)約

      屬性規(guī)約的目標(biāo)為從已經(jīng)獲得的實(shí)體的屬性中找到那些頻繁出現(xiàn)的屬性把它從實(shí)體屬性升級(jí)成為概念屬性,從而豐富知識(shí)圖譜的模式。在規(guī)約過(guò)程中,主要需要考慮的是概念的可靠性,因?yàn)橐坏┮?guī)約成概念屬性將影響后續(xù)所有屬于該概念的實(shí)體,仍然需要考慮不可靠的情形。規(guī)約的基本依據(jù)為,當(dāng)概念的實(shí)體擁有的某一屬性達(dá)到一定的比例(如40%)時(shí),此屬性會(huì)作為概念屬性的候選;接下來(lái)對(duì)屬性值進(jìn)行分析,如果其類型也基本一致,則把此屬性規(guī)約成概念屬性。

      3? 實(shí)驗(yàn)

      通過(guò)平臺(tái)對(duì)收集到的工程機(jī)械維修保養(yǎng)相關(guān)資料進(jìn)行知識(shí)抽取,自動(dòng)識(shí)別和抽取文本中的概念、實(shí)例和關(guān)系,然后與自頂向下建模結(jié)果相結(jié)合,得到工程機(jī)械維修保養(yǎng)知識(shí)圖譜數(shù)據(jù)模式結(jié)果示例如圖6所示。最終得到的結(jié)果統(tǒng)計(jì)如表1所示。

      4? 結(jié)? 論

      本文提出一種數(shù)據(jù)驅(qū)動(dòng)的工程機(jī)械維修保養(yǎng)知識(shí)圖譜建模方法,解決本領(lǐng)域?qū)I(yè)性強(qiáng)、覆蓋面廣導(dǎo)致難以完全通過(guò)專家自頂向下進(jìn)行知識(shí)圖譜建模的問(wèn)題。為方便多專家同步協(xié)作建模的問(wèn)題,提出了一款名為KGELP的工程機(jī)械維修保養(yǎng)知識(shí)圖譜協(xié)作建模平臺(tái),通過(guò)滿足多專家在線同步建模。同時(shí)提出了從數(shù)據(jù)中通過(guò)概念規(guī)約、上下位關(guān)系學(xué)習(xí)、屬性規(guī)約的方法自動(dòng)學(xué)習(xí)得到概念、概念之間的上下位關(guān)系以及概念的屬性。提出的工具和方法能夠大幅提升工程機(jī)械維修保養(yǎng)領(lǐng)域知識(shí)圖譜建模的效率。

      下一步工作將對(duì)自底向上知識(shí)建模中涉及到自然語(yǔ)言處理的知識(shí)抽取與概念抽取進(jìn)行進(jìn)一步研究,并擴(kuò)展到自動(dòng)化的知識(shí)抽取過(guò)程中,從而完成工程機(jī)械維修保養(yǎng)行業(yè)知識(shí)圖譜的完整構(gòu)建流程。

      參考文獻(xiàn):

      [1] AMIT S. Introducing the knowledge graph [R].America:Official Blog of Google,2012.

      [2] 車金立,唐力偉,鄧士杰,等.裝備維修保障知識(shí)圖譜構(gòu)建方法研究 [J].兵工自動(dòng)化,2019,38(1):15-19.

      作者簡(jiǎn)介:董登奎(1987.06—),男,漢族,安徽滁州人,碩士在讀,研究方向:工程機(jī)械維修保養(yǎng)。

      猜你喜歡
      自然語(yǔ)言處理知識(shí)體系知識(shí)圖譜
      基于組合分類算法的源代碼注釋質(zhì)量評(píng)估方法
      CS2013指導(dǎo)下的程序設(shè)計(jì)課程實(shí)踐教學(xué)實(shí)施方案設(shè)計(jì)與翻轉(zhuǎn)實(shí)驗(yàn)教學(xué)實(shí)踐
      構(gòu)建知識(shí)體系的專題課程教學(xué)改革實(shí)踐和探索
      智能信息處理實(shí)驗(yàn)課程建設(shè)
      地理教學(xué)中的知識(shí)體系整合
      近十五年我國(guó)小學(xué)英語(yǔ)教學(xué)研究的熱點(diǎn)、問(wèn)題及對(duì)策
      基于知識(shí)圖譜的產(chǎn)業(yè)集群創(chuàng)新績(jī)效可視化分析
      基于知識(shí)圖譜的智慧教育研究熱點(diǎn)與趨勢(shì)分析
      從《ET&S》與《電化教育研究》對(duì)比分析中管窺教育技術(shù)發(fā)展
      面向機(jī)器人導(dǎo)航的漢語(yǔ)路徑自然語(yǔ)言組塊分析方法研究
      新巴尔虎左旗| 邹城市| 南涧| 昌图县| 宣恩县| 龙口市| 南木林县| 瓮安县| 平潭县| 清水河县| 榆中县| 彰武县| 临江市| 桓台县| 汾阳市| 常山县| 旺苍县| 青田县| 满洲里市| 成武县| 双流县| 德兴市| 高州市| 乐至县| 德保县| 峨山| 永胜县| 循化| 托克托县| 英超| 碌曲县| 江永县| 遂川县| 普兰店市| 乐陵市| 文安县| 富平县| 江口县| 岢岚县| 宜丰县| 黄冈市|