摘 要:隨著制造業(yè)趨向于數(shù)字化、網(wǎng)絡(luò)化、智能化發(fā)展,企業(yè)中大量的產(chǎn)品設(shè)計(jì)、生產(chǎn)制造、維修服務(wù)數(shù)據(jù)在不斷地堆疊積累,對(duì)此引入知識(shí)圖譜技術(shù)對(duì)這些數(shù)據(jù)進(jìn)行管理和挖掘,可以為實(shí)現(xiàn)新一代智能制造提供有力支撐。文章首先針對(duì)制造領(lǐng)域知識(shí)圖譜的構(gòu)建及關(guān)鍵技術(shù)進(jìn)行敘述,包括知識(shí)抽取、知識(shí)融合、知識(shí)推理等;然后將知識(shí)圖譜在制造領(lǐng)域中的應(yīng)用分為語(yǔ)義關(guān)聯(lián)和決策輔助兩大類(lèi),并探究其具體的應(yīng)用場(chǎng)景,希望能為相關(guān)企業(yè)構(gòu)建及應(yīng)用知識(shí)圖譜提供參考。
關(guān)鍵詞:智能制造;知識(shí)圖譜;知識(shí)抽取;知識(shí)融合;知識(shí)推理
中圖分類(lèi)號(hào):TP391.1 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2024)08-0186-09
DOI:10.19850/j.cnki.2096-4706.2024.08.040
0 引 言
面臨新時(shí)代嚴(yán)峻的資源和環(huán)境挑戰(zhàn),需要不斷推進(jìn)大數(shù)據(jù)、工業(yè)物聯(lián)網(wǎng)、人工智能等新一代信息技術(shù)與制造業(yè)的結(jié)合發(fā)展,對(duì)產(chǎn)品設(shè)計(jì)、生產(chǎn)裝配、管理服務(wù)等制造全生命周期及相應(yīng)系統(tǒng)進(jìn)行集成優(yōu)化,推動(dòng)未來(lái)全球制造業(yè)向數(shù)字化、網(wǎng)絡(luò)化、智能化創(chuàng)新發(fā)展[1]。據(jù)工業(yè)和信息化部公布的數(shù)據(jù)顯示,我國(guó)制造業(yè)規(guī)模已經(jīng)連續(xù)13年居世界首位,是當(dāng)之無(wú)愧的世界制造大國(guó)。但目前我國(guó)仍然不是制造強(qiáng)國(guó),在國(guó)際競(jìng)爭(zhēng)市場(chǎng)中四郊多壘,為此,深入發(fā)展智能制造成為實(shí)現(xiàn)我國(guó)建設(shè)制造強(qiáng)國(guó)的重要舉措,這將關(guān)乎我國(guó)制造業(yè)未來(lái)的全球地位。
智能制造的核心問(wèn)題是信息集成,包括企業(yè)內(nèi)部不同層級(jí)信息系統(tǒng)和涉及產(chǎn)品制造全生命周期的生產(chǎn)設(shè)備間的縱向集成;不同企業(yè)之間研發(fā)、采購(gòu)、制造和服務(wù)的橫向集成;圍繞特定產(chǎn)品制造全生命周期相互關(guān)聯(lián)合作的企業(yè)之間端到端集成[2]。其中,獲取數(shù)據(jù)作為信息集成的首要任務(wù),是實(shí)現(xiàn)智能制造的基礎(chǔ)保障。在實(shí)際生產(chǎn)制造中,產(chǎn)品每天在制造流程的各個(gè)階段都會(huì)產(chǎn)生海量的數(shù)據(jù),這些數(shù)據(jù)的語(yǔ)義在制造信息的提取和應(yīng)用中起著重要作用。國(guó)內(nèi)外眾多學(xué)者針對(duì)這些生產(chǎn)數(shù)據(jù),已經(jīng)開(kāi)展大量的學(xué)術(shù)研究及應(yīng)用探索,希望通過(guò)新技術(shù)來(lái)完成信息融合,逐步開(kāi)發(fā)具有自感知、自學(xué)習(xí)、自適應(yīng)等功能的新式生產(chǎn)模式。目前已經(jīng)能夠基于大數(shù)據(jù)實(shí)現(xiàn)在制造過(guò)程系統(tǒng)、工藝設(shè)計(jì)、維修服務(wù)等多個(gè)層面進(jìn)行在線識(shí)別定位、監(jiān)控、輔助決策等任務(wù)[3]。對(duì)此如何從語(yǔ)義層面實(shí)現(xiàn)數(shù)據(jù)的認(rèn)知、關(guān)聯(lián)、理解與推理成為解決問(wèn)題的關(guān)鍵,然而,在輔助決策過(guò)程中,面對(duì)加工工藝自適應(yīng)調(diào)整、生產(chǎn)調(diào)度實(shí)時(shí)優(yōu)化、生產(chǎn)異常處理等復(fù)雜問(wèn)題時(shí)智能化程度較低,仍需要借助于專(zhuān)家的實(shí)踐經(jīng)驗(yàn)和專(zhuān)業(yè)知識(shí)。有實(shí)現(xiàn)制造系統(tǒng)對(duì)人類(lèi)經(jīng)驗(yàn)知識(shí)的理解、管理和自學(xué)習(xí),才能更好的提供決策支持。知識(shí)圖譜作為人工智能的分支技術(shù),能實(shí)現(xiàn)海量知識(shí)的獲取、組織與利用,為重用人類(lèi)知識(shí)和經(jīng)驗(yàn)解決決策支持問(wèn)題提供基礎(chǔ)。近年來(lái),關(guān)于知識(shí)圖譜的研究與應(yīng)用不斷涌現(xiàn),已經(jīng)逐漸成為熱點(diǎn)問(wèn)題。尤其是在金融、醫(yī)療、教育等行業(yè)得到了廣泛應(yīng)用,且發(fā)揮著重要作用,比如醫(yī)療領(lǐng)域的阿里巴巴“醫(yī)知鹿”;教育領(lǐng)域的清華大學(xué)出版社“文泉制造”等。然而,制造領(lǐng)域的知識(shí)圖譜相較匱乏,因?yàn)橹圃祛I(lǐng)域的知識(shí)具有封閉復(fù)雜、獲取困難、不同制造差異顯著等特點(diǎn),其知識(shí)圖譜的構(gòu)建十分困難。同時(shí),知識(shí)圖譜在制造領(lǐng)域中的應(yīng)用需求較為模糊,應(yīng)用優(yōu)勢(shì)不突出,也極大地限制了落地應(yīng)用。針對(duì)上述問(wèn)題,本文將探討構(gòu)建制造領(lǐng)域知識(shí)圖譜所需的關(guān)鍵技術(shù)及應(yīng)用實(shí)例,為知識(shí)圖譜在制造領(lǐng)域進(jìn)一步發(fā)展提供理論參考和啟迪。
1 制造領(lǐng)域知識(shí)圖譜概述
知識(shí)圖譜的概念,最早是在2012年由谷歌公司提出,當(dāng)時(shí)主要用于優(yōu)化搜索引擎,實(shí)現(xiàn)在多來(lái)源數(shù)據(jù)中高效智能搜索。之后,其概念演化又經(jīng)歷了長(zhǎng)達(dá)數(shù)十年的時(shí)間,可以將其歸納總結(jié)為三個(gè)發(fā)展階段,如圖1(b)所示。早期,傳統(tǒng)專(zhuān)家系統(tǒng)需要依靠專(zhuān)家手工輸入經(jīng)驗(yàn)知識(shí)和建立推理規(guī)則,人工和時(shí)間成本較高;隨著本體論和語(yǔ)義網(wǎng)的引入,知識(shí)庫(kù)可以構(gòu)建成規(guī)范化和形式化的知識(shí)語(yǔ)義模型,同時(shí)支持基于語(yǔ)義邏輯的自動(dòng)推理;如今,知識(shí)圖譜已經(jīng)發(fā)展為計(jì)算機(jī)自動(dòng)獲取、理解知識(shí)并進(jìn)行推理演繹。相較于傳統(tǒng)知識(shí)庫(kù),知識(shí)圖譜的優(yōu)勢(shì)體現(xiàn)在:1)存儲(chǔ)能力更強(qiáng)。知識(shí)圖譜采用有向圖結(jié)構(gòu),以節(jié)點(diǎn)和邊的表現(xiàn)形式,更有效的存儲(chǔ)實(shí)體之間的關(guān)聯(lián)關(guān)系;2)處理效率更快。知識(shí)圖譜基于本體論和自然語(yǔ)言處理(NLP)技術(shù),能夠?qū)崿F(xiàn)對(duì)數(shù)據(jù)和知識(shí)的語(yǔ)義解析,大大提升知識(shí)庫(kù)構(gòu)建的效率;3)搜索質(zhì)量更高。知識(shí)圖譜通過(guò)圖匹配算法、圖嵌入技術(shù)等,實(shí)現(xiàn)數(shù)據(jù)的匹配和推理。
與此同時(shí),制造業(yè)也追隨著信息技術(shù)的進(jìn)步而逐漸發(fā)展,周濟(jì)院士[4]根據(jù)信息技術(shù)在智能制造中的應(yīng)用特征,將其發(fā)展總結(jié)為三個(gè)階段,如圖1所示。第一個(gè)階段是從傳統(tǒng)制造走向數(shù)字化,主要指企業(yè)從產(chǎn)品、技術(shù)層面實(shí)現(xiàn)數(shù)字化,通過(guò)數(shù)據(jù)分析完成對(duì)生產(chǎn)過(guò)程的集成優(yōu)化;第二個(gè)階段是邁向“互聯(lián)網(wǎng)+制造”也稱(chēng)為數(shù)字化網(wǎng)絡(luò)化制造,主要指利用網(wǎng)絡(luò)將企業(yè)制造過(guò)程中涉及的人、物、服務(wù)連接起來(lái),推動(dòng)基于互聯(lián)網(wǎng)的協(xié)同制造;第三階段是發(fā)展成為新一代智能制造也稱(chēng)為數(shù)字化網(wǎng)絡(luò)化智能化制造,通過(guò)人工智能技術(shù)不斷推進(jìn)人機(jī)一體化的智能系統(tǒng),顛覆傳統(tǒng)生產(chǎn)模式逐漸實(shí)現(xiàn)無(wú)人制造。
制造領(lǐng)域的知識(shí)圖譜不同于通用知識(shí)圖譜,更注重于知識(shí)的專(zhuān)業(yè)性、準(zhǔn)確性,獲取的數(shù)據(jù)結(jié)構(gòu)更為多樣復(fù)雜,應(yīng)用在不同場(chǎng)景下進(jìn)行復(fù)雜分析及智能決策,其構(gòu)建過(guò)程對(duì)關(guān)鍵技術(shù)的要求也非常嚴(yán)格[5]。本文所研究的制造領(lǐng)域知識(shí)圖譜是將知識(shí)圖譜與制造系統(tǒng)相結(jié)合的應(yīng)用,主要通過(guò)獲取以往生產(chǎn)的案例和經(jīng)驗(yàn),進(jìn)行推理發(fā)現(xiàn)新的知識(shí),輔助決策者掌握生產(chǎn)要素,甚至提供決策方案以供參考。
1.1 制造領(lǐng)域知識(shí)圖譜數(shù)據(jù)來(lái)源
當(dāng)前,制造系統(tǒng)與信息技術(shù)相結(jié)合不斷快速發(fā)展,使得在制造過(guò)程中產(chǎn)品在全生命周期各個(gè)環(huán)節(jié)都會(huì)有大量的數(shù)據(jù)產(chǎn)生,這些數(shù)據(jù)的來(lái)源廣泛并不統(tǒng)一,比如企業(yè)內(nèi)部生產(chǎn)數(shù)據(jù)、運(yùn)維數(shù)據(jù)、外部互聯(lián)網(wǎng)數(shù)據(jù)等。根據(jù)數(shù)據(jù)形式的不同,可以分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù)三類(lèi)。結(jié)構(gòu)化數(shù)據(jù)可以使用關(guān)系型數(shù)據(jù)庫(kù)進(jìn)行存儲(chǔ),包括生產(chǎn)監(jiān)測(cè)的數(shù)據(jù)、產(chǎn)品質(zhì)量檢測(cè)的數(shù)據(jù)以及能源消耗的數(shù)據(jù)等;半結(jié)構(gòu)化數(shù)據(jù)包括員工個(gè)人信息、設(shè)備操作說(shuō)明書(shū)、接口數(shù)據(jù)等;非結(jié)構(gòu)化數(shù)據(jù)包括各種格式的辦公文檔、生產(chǎn)監(jiān)控的圖片和視頻等數(shù)據(jù)。在不同類(lèi)型的生產(chǎn)制造過(guò)程中,除人工采集數(shù)據(jù)外,要想獲取制造業(yè)生產(chǎn)過(guò)程中的多源異構(gòu)數(shù)據(jù),還需要借助多種采集方法和工具[6]。根據(jù)在生產(chǎn)過(guò)程的應(yīng)用場(chǎng)景及數(shù)據(jù)類(lèi)型,舉例五種典型數(shù)據(jù)采集方式,如RFID技術(shù)、條碼技術(shù)、傳感器技術(shù)、Flume、流媒體服務(wù)器。
數(shù)據(jù)模型也稱(chēng)為知識(shí)表達(dá)模型,是構(gòu)建知識(shí)圖譜的底層架構(gòu)。因?yàn)橹R(shí)圖譜是一種有向圖結(jié)構(gòu)的知識(shí)庫(kù),本質(zhì)是表示實(shí)體聯(lián)系的語(yǔ)義網(wǎng)絡(luò),由實(shí)體、關(guān)系和語(yǔ)義描述組成,所以其基本組成單位是“頭實(shí)體-關(guān)系-尾實(shí)體”的三元組,圖2展現(xiàn)了以生產(chǎn)推土機(jī)為例的制造領(lǐng)域數(shù)據(jù)模型的特征。
在制造領(lǐng)域的數(shù)據(jù)采集方面,知識(shí)圖譜對(duì)知識(shí)的精度與深度具有很高的要求,因?yàn)槠髽I(yè)的利益和生產(chǎn)的安全依賴(lài)于數(shù)據(jù)的準(zhǔn)確性,然而非結(jié)構(gòu)化數(shù)據(jù)并不能直接被計(jì)算機(jī)所理解,無(wú)法直接實(shí)現(xiàn)形式化表達(dá),需要通過(guò)知識(shí)抽取技術(shù)去轉(zhuǎn)化為結(jié)構(gòu)數(shù)據(jù),這將會(huì)增加時(shí)間和經(jīng)濟(jì)成本。
1.2 制造領(lǐng)域知識(shí)圖譜構(gòu)建框架
目前,知識(shí)圖譜的構(gòu)建方法有自底向上法和自頂向下法兩種[7]。自底向上的構(gòu)建方式是先將獲取的海量數(shù)據(jù)進(jìn)行知識(shí)抽取,組成知識(shí)三元組,再經(jīng)過(guò)知識(shí)融合篩選后作為數(shù)據(jù)層,最后進(jìn)行概念抽象形成模式層;自頂向下的構(gòu)建方式是先定義頂層概念本體,再?gòu)臄?shù)據(jù)源中抽取實(shí)體及關(guān)系進(jìn)行匹配。通常應(yīng)用既定本體庫(kù)構(gòu)建圖譜的方式較為廣泛,但在構(gòu)建對(duì)專(zhuān)業(yè)知識(shí)要求嚴(yán)苛,且本體框架要求準(zhǔn)確完整的知識(shí)圖譜時(shí),也可以采用將兩種構(gòu)建方式相結(jié)合的混合構(gòu)建法,在建立模式層后,不斷挖掘新知識(shí)迭代更新模式層,如圖3所示。
根據(jù)上述構(gòu)建知識(shí)圖譜的方法,結(jié)合制造行業(yè)生產(chǎn)流程具有完整性的特點(diǎn),基于全生命周期建立知識(shí)圖譜的構(gòu)建框架,如圖4所示。
2 制造領(lǐng)域知識(shí)圖譜構(gòu)建的關(guān)鍵技術(shù)
2.1 知識(shí)抽取
知識(shí)抽取是將人類(lèi)使用自然語(yǔ)言表述的異構(gòu)數(shù)據(jù)轉(zhuǎn)化為由實(shí)體、關(guān)系和屬性等知識(shí)要素組成的結(jié)構(gòu)化數(shù)據(jù),并儲(chǔ)存在知識(shí)圖譜中。其中資源描述框架(Resource Description Framework, RDF)是對(duì)語(yǔ)義知識(shí)進(jìn)行規(guī)范化描述和存儲(chǔ)的典型應(yīng)用,它為結(jié)構(gòu)化數(shù)據(jù)的發(fā)布提供一個(gè)標(biāo)準(zhǔn)的數(shù)據(jù)描述框架。如圖5所示,以RDF形式對(duì)汽車(chē)仰望U8的知識(shí)進(jìn)行表示。根據(jù)知識(shí)抽取目標(biāo)對(duì)象的不同,知識(shí)抽取的主要工作包括實(shí)體抽取、關(guān)系抽取以及屬性抽取。
2.1.1 實(shí)體抽取
實(shí)體抽取也可以稱(chēng)為命名實(shí)體識(shí)別,旨在文本中識(shí)別實(shí)體并將具有相似屬性的實(shí)體進(jìn)行分類(lèi)加以標(biāo)注區(qū)分。以售后維修場(chǎng)景中“客戶反饋發(fā)動(dòng)機(jī)聲音異常,經(jīng)過(guò)返廠檢測(cè)后發(fā)現(xiàn),系連桿變形損壞導(dǎo)致敲缸,更換連桿后問(wèn)題解決?!边@句文本為例,實(shí)體抽取示例如表1所示。
在制造領(lǐng)域中,實(shí)體抽取的精確度將影響知識(shí)圖譜的準(zhǔn)確性,但實(shí)體抽取工作面臨著很多難點(diǎn),例如存在諸多由中文、英文、阿拉伯?dāng)?shù)字以及特殊符號(hào)組合來(lái)命名的實(shí)體,比如“VMC650加工中心”“CT-6數(shù)控車(chē)床”的設(shè)備型號(hào)、操作行程等,無(wú)法采用簡(jiǎn)單的中文實(shí)體抽取方法識(shí)別實(shí)體跨度;存在嵌套型實(shí)體,比如零件“彈簧墊圈”是由兩個(gè)命名實(shí)體嵌套組合而成,“彈簧”和“墊圈”都可以是獨(dú)立的實(shí)體,此時(shí)無(wú)法用傳統(tǒng)的序列標(biāo)記法識(shí)別例句中的嵌套實(shí)體。實(shí)體抽取的實(shí)現(xiàn)方法最早是基于規(guī)則和字典的方法,后來(lái)隨著機(jī)器學(xué)習(xí)算法的引入,形成基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法和基于深度學(xué)習(xí)的方法。
1)基于規(guī)則和字典的實(shí)體抽取。根據(jù)專(zhuān)家提前制定的文本規(guī)則和詞典,抽取相似度高的實(shí)體和屬性。該方法主要用于文本數(shù)據(jù)的抽取,高度依賴(lài)抽取規(guī)則的準(zhǔn)確性,時(shí)間成本較高,適用于小規(guī)模數(shù)據(jù)集。
2)基于傳統(tǒng)機(jī)器學(xué)習(xí)的實(shí)體抽取。傳統(tǒng)機(jī)器學(xué)習(xí)的實(shí)體抽取采用具有領(lǐng)域數(shù)據(jù)特征且已標(biāo)注的語(yǔ)料數(shù)據(jù)作為訓(xùn)練集,然后訓(xùn)練分類(lèi)器去學(xué)習(xí)訓(xùn)練集的數(shù)據(jù)特征,以實(shí)現(xiàn)對(duì)數(shù)據(jù)集進(jìn)行自動(dòng)標(biāo)注。該方法往往被認(rèn)為是序列標(biāo)注問(wèn)題,常見(jiàn)的模型有隱馬爾可夫(Hidden Markov Model, HMM)模型[8]、條件隨機(jī)場(chǎng)(Conditional Random Field, CRF)模型[9]、支持向量機(jī)(Support Vector Machines, SVM)模型[10]等,其中CRF模型最受歡迎,可以在給出觀測(cè)序列標(biāo)簽情況下,計(jì)算訓(xùn)練標(biāo)簽數(shù)據(jù)的條件概率分布,取得較好的應(yīng)用效果。
3)基于深度學(xué)習(xí)的實(shí)體抽取。深度學(xué)習(xí)的實(shí)體抽取延伸自傳統(tǒng)機(jī)器學(xué)習(xí),但不同于傳統(tǒng)機(jī)器學(xué)習(xí)依賴(lài)人工標(biāo)注的特征,它通過(guò)自身的隱含層對(duì)輸入信息進(jìn)行特征提取,是目前最為流行的實(shí)體抽取方法。常見(jiàn)的模型有循環(huán)神經(jīng)網(wǎng)絡(luò)(Rerrent Neural Network, RNN)模型、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)模型、雙向長(zhǎng)短期記憶網(wǎng)絡(luò)(Bi-directional Long Short-Term Memory, BiLSTM)模型等,這些神經(jīng)網(wǎng)絡(luò)模型具有較強(qiáng)的適用性與數(shù)據(jù)擬合性,能有效提升工作的效率與精度。其中具有代表性的是LSTM+CRF模型[11],該組合模型能夠結(jié)合以往的輸入特征,并使用句子級(jí)別的標(biāo)注信息,提高了實(shí)體抽取準(zhǔn)確率。之后,大多學(xué)者在該模型基礎(chǔ)上進(jìn)行改進(jìn)應(yīng)用,例如結(jié)合預(yù)訓(xùn)練模型(Bidirectional Encoder Representation from Transformers, BERT)等。周雷[12]在構(gòu)建電機(jī)故障知識(shí)圖譜時(shí),提出BERT+BiLSTM+MHA+CRF組合模型來(lái)解決雙向長(zhǎng)短記憶網(wǎng)絡(luò)(BiLSTM)無(wú)法捕捉到長(zhǎng)距離依賴(lài)的問(wèn)題,實(shí)驗(yàn)證明該模型對(duì)完成命名實(shí)體識(shí)別具有優(yōu)越性。胡杰[13]等人在構(gòu)建汽車(chē)故障知識(shí)圖譜時(shí),提出BERT+BiLSTM+MUL+CRF模型來(lái)解決文本中的嵌套實(shí)體問(wèn)題和非連續(xù)實(shí)體問(wèn)題。
2.1.2 關(guān)系抽取
通過(guò)實(shí)體抽取所得到的實(shí)體,往往是還沒(méi)有被分割,也沒(méi)有進(jìn)行關(guān)聯(lián)的,并不能直接組成三元組,需要通過(guò)關(guān)系抽取進(jìn)一步挖掘?qū)嶓w之間的關(guān)系。制造領(lǐng)域中,數(shù)據(jù)往往具有強(qiáng)關(guān)聯(lián)性,研發(fā)設(shè)計(jì)、生產(chǎn)、服務(wù)等不同環(huán)節(jié)的數(shù)據(jù)之間相互關(guān)聯(lián),關(guān)系復(fù)雜度較高,例如“PUMA562型機(jī)器人可以完成復(fù)雜結(jié)構(gòu)空間曲面的弧焊作業(yè)”中“PUMA562型機(jī)器人”與“弧焊作業(yè)”兩個(gè)實(shí)體之間存在復(fù)雜嵌套的關(guān)系,這增加了關(guān)系抽取準(zhǔn)確的難度。實(shí)現(xiàn)關(guān)系抽取常見(jiàn)的方法包括基于有監(jiān)督學(xué)習(xí)法、基于半監(jiān)督學(xué)習(xí)法以及無(wú)監(jiān)督學(xué)習(xí)法。
有監(jiān)督學(xué)習(xí)的關(guān)系抽取,需要將大量人工標(biāo)注的語(yǔ)料數(shù)據(jù)投入模型中進(jìn)行訓(xùn)練。無(wú)監(jiān)督學(xué)習(xí)的實(shí)體抽取方法需要先將大量語(yǔ)料信息做聚類(lèi)分析,再根據(jù)聚類(lèi)的結(jié)果給定關(guān)系。其效果相對(duì)較差,因?yàn)榫垲?lèi)本身就存在難以描述的關(guān)系和召回率低的問(wèn)題,與有監(jiān)督抽取方法相比召回率和準(zhǔn)確率普遍低10%左右。半監(jiān)督學(xué)習(xí)又叫做弱監(jiān)督學(xué)習(xí),只需要少量的人工標(biāo)注數(shù)據(jù),但需要先了解實(shí)體關(guān)系的類(lèi)型,然而實(shí)際操作中實(shí)體關(guān)系的類(lèi)型往往并不能完全被知道。但人工構(gòu)造數(shù)據(jù)特征提取往往時(shí)間、經(jīng)濟(jì)成本較高,還存在邊緣界定不清等問(wèn)題。為避免特征構(gòu)造帶來(lái)的誤差,大量研究學(xué)者開(kāi)始探究基于端到端的深度學(xué)習(xí)方法。其中,遞歸神經(jīng)網(wǎng)絡(luò)(RNN)在序列化方面表現(xiàn)較好;卷積神經(jīng)網(wǎng)絡(luò)(CNN)雖然無(wú)法對(duì)長(zhǎng)句分析建模,但在實(shí)體關(guān)系抽取上效果顯著。長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)可以通過(guò)與聚類(lèi)技術(shù)結(jié)合來(lái)降低訓(xùn)練和測(cè)試時(shí)間[14]。張彤[15]等人在研究工業(yè)制造領(lǐng)域質(zhì)量文本實(shí)體關(guān)系抽取中,以加入中文分詞預(yù)處理的方式改進(jìn)的分段卷積神經(jīng)網(wǎng)絡(luò)(PCNN),提出C-PCNN模型,該模型具有更好的抽取效果。段文昱[16]等人在研究武器裝配領(lǐng)域?qū)嶓w關(guān)系抽取中,利用BERT+BiGRU+CNN模型抽取實(shí)體間的關(guān)系,再對(duì)抽取結(jié)果進(jìn)行過(guò)濾和調(diào)整,最后設(shè)計(jì)強(qiáng)領(lǐng)域性的關(guān)系抽取規(guī)則進(jìn)行補(bǔ)充關(guān)系抽取,使關(guān)系抽取的準(zhǔn)確性得到提升。
遠(yuǎn)程監(jiān)督屬于半監(jiān)督學(xué)習(xí)的一種,它不依賴(lài)于人工標(biāo)注語(yǔ)料,相對(duì)而言是較為可行的方法,所以目前有關(guān)遠(yuǎn)程監(jiān)督的研究最為流行。遠(yuǎn)程監(jiān)督是在2009年由Mintz [17]等人提出的方法,它假設(shè)在外部知識(shí)庫(kù)中,對(duì)于已有的一個(gè)知識(shí)圖譜的三元組,任何包含該三元組實(shí)體的句子,都在一定程度上反映該三元組中的關(guān)系。但該方法也有很大的不足,因?yàn)檫@個(gè)假設(shè)關(guān)系在實(shí)際中并不絕對(duì),不一定適用于所有實(shí)體。所以解決遠(yuǎn)程監(jiān)督學(xué)習(xí)對(duì)實(shí)體間關(guān)系的忽略問(wèn)題、關(guān)系抽取的精確問(wèn)題,也是當(dāng)前研究遠(yuǎn)程監(jiān)督學(xué)習(xí)的熱點(diǎn)問(wèn)題。賴(lài)冠宇[18]等人提出一種遠(yuǎn)程監(jiān)督中文關(guān)系提取方法,該方法將基于中文訓(xùn)練數(shù)據(jù)改進(jìn)的BERT模型作為嵌入層,并利用BiLSTM神經(jīng)網(wǎng)絡(luò)增強(qiáng)特征提取能力,結(jié)果表明提升了關(guān)系抽取性能。袁泉[19]等人在面臨詞向量語(yǔ)義信息不全以及實(shí)體一詞多義的問(wèn)題,提出基于BERT的詞向量的兩次注意力加權(quán)算法,首先使用自注意力動(dòng)態(tài)編碼算法,為詞向量識(shí)別文本前后語(yǔ)義信息,然后在模型輸出句子級(jí)特征向量后,構(gòu)建注意力矩陣,最后運(yùn)用注意力算法為每個(gè)句子級(jí)特征向量添加不同的注意力分?jǐn)?shù),以提高句子級(jí)特征的抗噪能力。
2.1.3 屬性抽取
在制造領(lǐng)域中,屬性抽取是為實(shí)體服務(wù)的,從文本中抽取出與實(shí)體相關(guān)的屬性和屬性值,如產(chǎn)品材料的屬性包括物理性能、化學(xué)性質(zhì)、工藝等,通過(guò)屬性描述可以讓實(shí)體更加準(zhǔn)確、豐富。因?yàn)閷?shí)體與屬性的關(guān)系常被界定為指代性關(guān)系,關(guān)系抽取的思路也適用于屬性抽取。但屬性抽取相較于關(guān)系抽取也有區(qū)別,因?yàn)閷?shí)體屬性值的結(jié)構(gòu)是不確定的。目前較為常用的方法是基于深度學(xué)習(xí)的序列標(biāo)注,序列標(biāo)注將實(shí)體屬性值比作較長(zhǎng)的實(shí)體,然后對(duì)數(shù)據(jù)進(jìn)行標(biāo)注,再使用序列標(biāo)注模型進(jìn)行訓(xùn)練和抽取。袁芳怡[20]在研究制造領(lǐng)域知識(shí)圖譜的屬性提取時(shí),提出將個(gè)性化Page Rank嵌入BiLSTM+CRF模型,再與無(wú)監(jiān)督學(xué)習(xí)的方法相結(jié)合的抽取方式,可以無(wú)須提前指定屬性類(lèi)別,還可以減少人力標(biāo)注的成本。
2.2 知識(shí)融合
通過(guò)知識(shí)表示與抽取,獲取到大量三元組數(shù)據(jù),但這些數(shù)據(jù)可能存在有知識(shí)重復(fù)或者歧義,還需要進(jìn)行知識(shí)融合,使相同的知識(shí)具有統(tǒng)一的描述。例如由于地域差別或是術(shù)語(yǔ)表述、手寫(xiě)記錄不規(guī)范,導(dǎo)致同一實(shí)體存在不同的稱(chēng)呼,“發(fā)動(dòng)機(jī)”又稱(chēng)“引擎”或“Engine”“夾具”又名“卡具”“功率不足”有時(shí)也會(huì)表述為“動(dòng)力不足”等,當(dāng)出現(xiàn)這種情況時(shí),需要進(jìn)行實(shí)體對(duì)齊來(lái)消去歧義。
2.2.1 實(shí)體對(duì)齊
實(shí)體對(duì)齊的目的主要是判斷不同語(yǔ)義表述的實(shí)體是否表征真實(shí)世界的同一對(duì)象。實(shí)現(xiàn)實(shí)體對(duì)齊的方法可以分為傳統(tǒng)實(shí)體對(duì)齊法和基于知識(shí)表示學(xué)習(xí)的實(shí)體對(duì)齊法。
傳統(tǒng)的實(shí)體對(duì)齊通過(guò)字符串的各種特征來(lái)進(jìn)行工作,包括基于屬性相似性計(jì)算和基于關(guān)系推理的實(shí)體對(duì)齊法。屬性相似性計(jì)算的方法只考慮實(shí)體對(duì)之間的屬性相似度,并沒(méi)有將實(shí)體之間的關(guān)系納入考慮;基于關(guān)系推理的方法需要提前獲取實(shí)體類(lèi)別、屬性等信息,需要做大量的數(shù)據(jù)標(biāo)注工作。許駒熊[21]等人在構(gòu)建發(fā)動(dòng)機(jī)故障知識(shí)圖譜時(shí),采用編輯距離和Jaccard相關(guān)系數(shù)法進(jìn)行實(shí)體相似度計(jì)算,并將保留相似度得分高于設(shè)定閾值的一個(gè)實(shí)體,并更新圖譜中的三元組中。王雅林[22]等人為補(bǔ)充工業(yè)制造領(lǐng)域知識(shí)圖譜,構(gòu)建注塑知識(shí)圖譜,以缺陷-表觀-原因-方案的形式設(shè)計(jì)本體,再結(jié)合屬性相似度進(jìn)行兩級(jí)實(shí)體對(duì)齊,提高了發(fā)現(xiàn)冗余知識(shí)的概率。
基于知識(shí)表示的實(shí)體對(duì)齊法是目前解決實(shí)體對(duì)齊的重要方法,利用機(jī)器學(xué)習(xí)技術(shù)將實(shí)體和關(guān)系映射到低維的向量空間,實(shí)現(xiàn)用向量表示實(shí)體之間的關(guān)系。常見(jiàn)的模型有翻譯模型或圖神經(jīng)網(wǎng)絡(luò)(Graph Neural Networks, GNN)模型,它們具備較強(qiáng)的魯棒性和泛化能力。劉璐[23]等人先采用預(yù)訓(xùn)練模型完成多視圖知識(shí)表示,再結(jié)合卷積神經(jīng)網(wǎng)絡(luò)(CNN)進(jìn)行相似度計(jì)算,提高了計(jì)算精確率,高效完成實(shí)體對(duì)齊的任務(wù)。
2.2.2 語(yǔ)義融合
在生產(chǎn)制造過(guò)程中,通過(guò)多環(huán)節(jié)或多角度獲取到的文本、圖片、視頻等多模態(tài)數(shù)據(jù),具有內(nèi)部關(guān)聯(lián)性。語(yǔ)義融合算法抽象多模態(tài)數(shù)據(jù)的語(yǔ)義內(nèi)涵,理解不同模態(tài)數(shù)據(jù)之間的特征關(guān)系,以模仿大腦思考的方式完成多模態(tài)數(shù)據(jù)的知識(shí)融合。胡小溪[24]等人在處理設(shè)備故障文本數(shù)據(jù)時(shí),提出一種基于詞項(xiàng)和語(yǔ)義融合的文本自動(dòng)預(yù)處理方法,分別對(duì)故障記錄進(jìn)行詞項(xiàng)和語(yǔ)義融合,再基于規(guī)則模板應(yīng)用K-近鄰算法對(duì)其統(tǒng)一描述,解決故障記錄模糊問(wèn)題。高知新[25]等人提出基于隱馬爾科夫模型(HMM)與語(yǔ)義融合的文本分類(lèi)方法,將特征詞語(yǔ)義整合到HMM模型中,得到更好的分類(lèi)效果。李立[26]等人對(duì)大型車(chē)聯(lián)網(wǎng)數(shù)據(jù)庫(kù)提出高效查詢(xún)技術(shù),利用關(guān)聯(lián)語(yǔ)義融合方法提取檢索的特征量,再結(jié)合模糊C-均值聚類(lèi)算法對(duì)提取的語(yǔ)義本體特征進(jìn)行分類(lèi)檢索。
2.3 知識(shí)推理
知識(shí)推理的目的是在已建立的知識(shí)庫(kù)基礎(chǔ)上,繼續(xù)挖掘推理隱含的新知識(shí)或者未知關(guān)系,用以補(bǔ)充和豐富知識(shí)庫(kù),讓構(gòu)建的知識(shí)圖譜更加完整。制造領(lǐng)域的數(shù)據(jù)具有特殊性,數(shù)據(jù)量龐大、實(shí)體間關(guān)系復(fù)雜,很難總結(jié)成統(tǒng)一的推理規(guī)律,需要專(zhuān)家經(jīng)驗(yàn)輔助推理復(fù)雜規(guī)律。目前常見(jiàn)的知識(shí)推理方法主要有基于邏輯規(guī)則推理和基于圖結(jié)構(gòu)推理。
基于邏輯規(guī)則的推理是通過(guò)專(zhuān)家制定規(guī)則和統(tǒng)計(jì)的特征來(lái)進(jìn)行推理,適用于抽象概念,主要方法有一階謂詞邏輯規(guī)則推理和描述邏輯推理法[27]。一階謂詞邏輯規(guī)則推理通過(guò)設(shè)定約束條件實(shí)現(xiàn)知識(shí)推理,其中個(gè)體表示具體的事物或抽象的概念,可以定義為實(shí)體或泛實(shí)體,謂詞表示個(gè)體性質(zhì)或個(gè)體間的關(guān)系。描述邏輯推理可以理解為一階謂詞邏輯推理的一個(gè)可判定子集,可以模擬大腦的推理能力,利用先驗(yàn)知識(shí)來(lái)輔助推理,極大地提高了知識(shí)推理的準(zhǔn)確性。方喜峰[28]等人在構(gòu)建的CAM數(shù)控編程知識(shí)圖譜中,基于本體和語(yǔ)義Web規(guī)則語(yǔ)言的知識(shí)推理方法可以有效獲取知識(shí)圖譜中隱含知識(shí)。
基于圖結(jié)構(gòu)的知識(shí)推理,是根據(jù)知識(shí)圖譜的圖結(jié)構(gòu)特點(diǎn),讓“邊”成為其特有的特征,推理出隱藏的“邊”也就是推理出兩個(gè)實(shí)體間的關(guān)系。其中路徑排序算法[29]作為經(jīng)典的推理算法,將關(guān)系路徑作為特征進(jìn)行推理,通過(guò)發(fā)現(xiàn)兩個(gè)實(shí)體間的路徑來(lái)推測(cè)實(shí)體間可能存在的某種聯(lián)系,這種方法可解釋性強(qiáng),并且可以自動(dòng)發(fā)現(xiàn)推理規(guī)則。尹昱東[30]等人在構(gòu)建裝配知識(shí)圖譜時(shí),通過(guò)探索某一節(jié)點(diǎn)以及其周?chē)年P(guān)系標(biāo)簽來(lái)推理其周?chē)囊霉?jié)點(diǎn)之間的關(guān)系,實(shí)現(xiàn)潛在關(guān)系的挖掘。邢曉宇[31]等人在對(duì)航天器性能和故障關(guān)系補(bǔ)全時(shí),提出一種基于實(shí)體的語(yǔ)義和位置信息的推理模型,并利用主成分分析對(duì)高維語(yǔ)義信息進(jìn)行降維,提高了推理的準(zhǔn)確性。王佳皓[32]等人在構(gòu)建自動(dòng)色環(huán)機(jī)設(shè)計(jì)知識(shí)圖譜時(shí),基于強(qiáng)化算法和蟻群算法建立框架模型,將蟻群算法中的信息素作為策略網(wǎng)絡(luò)進(jìn)行實(shí)體間的路徑選擇,挖掘潛在路徑。
3 制造領(lǐng)域知識(shí)圖譜的應(yīng)用
基于上述理論知識(shí),知識(shí)圖譜作為一種可以從海量數(shù)據(jù)中抽取結(jié)構(gòu)化知識(shí)的手段,為制造系統(tǒng)中動(dòng)態(tài)、海量、異構(gòu)的數(shù)據(jù)處理提供了一種有效的方式,它可以清晰有效地表達(dá)出實(shí)體內(nèi)部的聯(lián)系。換言之,利用知識(shí)圖譜建立起包含各種相關(guān)知識(shí)的知識(shí)網(wǎng)絡(luò),讓人們能夠做到基于知識(shí)間的聯(lián)系來(lái)分析問(wèn)題,讓系統(tǒng)實(shí)現(xiàn)智能化。調(diào)研現(xiàn)有文獻(xiàn),發(fā)現(xiàn)知識(shí)圖譜技術(shù)在制造領(lǐng)域的應(yīng)用場(chǎng)景主要有智能制造問(wèn)答系統(tǒng)、制造決策支持系統(tǒng)、車(chē)間生產(chǎn)調(diào)度優(yōu)化、產(chǎn)品設(shè)計(jì)與開(kāi)發(fā)、設(shè)備故障診斷系統(tǒng)及其他應(yīng)用制造場(chǎng)景等。根據(jù)應(yīng)用場(chǎng)景的共性可以分為兩大類(lèi),分別為語(yǔ)義關(guān)聯(lián)、決策輔助。
3.1 語(yǔ)義關(guān)聯(lián)
制造系統(tǒng)中的多源異構(gòu)數(shù)據(jù)可以通過(guò)知識(shí)圖譜來(lái)實(shí)現(xiàn)語(yǔ)義關(guān)聯(lián)和共享利用。新一代智能制造強(qiáng)調(diào)企業(yè)信息集成,致力于智慧工廠一體化發(fā)展,工廠信息化系統(tǒng)主要包括企業(yè)資源計(jì)劃系統(tǒng)(ERP)、制造執(zhí)行系統(tǒng)(MES)、產(chǎn)品生命周期管理系統(tǒng)(PLM)和倉(cāng)庫(kù)管理系統(tǒng)(WES)等,但在實(shí)際生產(chǎn)中,這些信息系統(tǒng)收集和積累的過(guò)程數(shù)據(jù)和資料,往往相互孤立,需要構(gòu)建知識(shí)圖譜,來(lái)助力企業(yè)數(shù)據(jù)整合。通過(guò)知識(shí)圖譜提取相關(guān)數(shù)據(jù),在語(yǔ)義層面建立統(tǒng)一表示并相互關(guān)聯(lián),從而將這些信息系統(tǒng)連接起來(lái)。宋鄧強(qiáng)[33]提出基于知識(shí)圖譜的船舶加工資源與流程動(dòng)態(tài)建模與融合分析方法,實(shí)現(xiàn)工位動(dòng)態(tài)時(shí)序數(shù)據(jù)與知識(shí)圖譜的語(yǔ)義關(guān)聯(lián)。楊?lèi)鹆豙34]提出基于知識(shí)圖譜的復(fù)雜制造數(shù)據(jù)關(guān)聯(lián)關(guān)系構(gòu)建方法,實(shí)現(xiàn)面向用戶的自定義復(fù)雜關(guān)系模型動(dòng)態(tài)構(gòu)建,可以高效的為系統(tǒng)的制造數(shù)據(jù)搭建復(fù)雜的關(guān)聯(lián)關(guān)系。曾左英[35]提出了一種基于知識(shí)圖譜的“數(shù)據(jù)-知識(shí)”雙向特征驅(qū)動(dòng)的非智能物聯(lián)設(shè)備自發(fā)現(xiàn)模型,將設(shè)備運(yùn)行數(shù)據(jù)與機(jī)理知識(shí)融合驅(qū)動(dòng),實(shí)現(xiàn)了對(duì)非智能物聯(lián)設(shè)備的互聯(lián)互通。路松峰[36]等人提出基于知識(shí)圖譜的數(shù)控裝備信息模型的建模方法,實(shí)現(xiàn)對(duì)信息系統(tǒng)多源異構(gòu)數(shù)據(jù)的實(shí)時(shí)采集。
3.2 決策輔助
根據(jù)在制造過(guò)程中的決策需求,知識(shí)圖譜可以為決策支持提供知識(shí)發(fā)現(xiàn)與關(guān)系推理。知識(shí)圖譜具備優(yōu)秀的相似匹配和查詢(xún)功能,將歷史積累的經(jīng)驗(yàn)和以往的案例通過(guò)知識(shí)圖譜進(jìn)行表示和存儲(chǔ),可以及時(shí)、準(zhǔn)確、全面地提供解決制造問(wèn)題所需要的知識(shí),輔助生成決策方案。應(yīng)用較為廣泛的場(chǎng)景有輔助產(chǎn)品設(shè)計(jì)、生產(chǎn)計(jì)劃與調(diào)度、質(zhì)量管理與控制、設(shè)備故障診斷等。針對(duì)不同的制造問(wèn)題,提取不同階段的制造數(shù)據(jù),構(gòu)建“定制化”知識(shí)圖譜,在通過(guò)開(kāi)發(fā)知識(shí)問(wèn)答、語(yǔ)義檢索以及知識(shí)推理等服務(wù),搭建交互式應(yīng)用平臺(tái),實(shí)現(xiàn)答案反饋,輔助生成決策方案。
3.2.1 輔助產(chǎn)品設(shè)計(jì)
基于知識(shí)圖譜輔助產(chǎn)品設(shè)計(jì),可以將企業(yè)內(nèi)積累的設(shè)計(jì)案例以及經(jīng)驗(yàn)知識(shí)進(jìn)行重用,為工作人員提供設(shè)計(jì)知識(shí)和參考案例,降低設(shè)計(jì)成本,提高工作效率和質(zhì)量?,F(xiàn)有文獻(xiàn)通常將設(shè)計(jì)功能、形態(tài)、加工工藝等產(chǎn)品設(shè)計(jì)要素建立統(tǒng)一語(yǔ)義表示,進(jìn)而構(gòu)建出知識(shí)圖譜。李寶清[37]等人提出了一種模具設(shè)計(jì)知識(shí)表示方法,構(gòu)建了以凸模結(jié)構(gòu)形式知識(shí)為例的知識(shí)圖譜,提高了模具設(shè)計(jì)的效率和質(zhì)量,實(shí)現(xiàn)了知識(shí)的共享和重用。崔碩[38]等人融合設(shè)計(jì)歷史模型庫(kù)和文本資源庫(kù),構(gòu)建了機(jī)械設(shè)計(jì)領(lǐng)域知識(shí)圖譜并建立問(wèn)答系統(tǒng)方便查詢(xún),極大地提升了產(chǎn)品設(shè)計(jì)效率。徐進(jìn)[39]等人面向裝配設(shè)計(jì),從三維圖面檔案中進(jìn)行零件實(shí)體抽取和知識(shí)融合,構(gòu)建了發(fā)動(dòng)機(jī)裝配知識(shí)圖譜。張思超[40]等人為輔助生成柴油機(jī)零部件的生產(chǎn)工藝設(shè)計(jì)方案,基于知識(shí)圖譜提出對(duì)加工過(guò)程中的工藝知識(shí)進(jìn)行重構(gòu)。
3.2.2 生產(chǎn)計(jì)劃與調(diào)度
基于知識(shí)圖譜輔助優(yōu)化生產(chǎn)計(jì)劃與調(diào)度方案的制訂,可以及時(shí)地為現(xiàn)場(chǎng)工作人員做出科學(xué)決策提供所需信息?,F(xiàn)有文獻(xiàn)將企業(yè)資源配置、生產(chǎn)計(jì)劃要素、工藝流程規(guī)劃等方面的信息進(jìn)行語(yǔ)義集成,進(jìn)而構(gòu)建出知識(shí)圖譜。鐘紅燕[41]構(gòu)建離線車(chē)間知識(shí)圖譜,對(duì)以往人工排產(chǎn)經(jīng)驗(yàn)和車(chē)間歷史生產(chǎn)數(shù)據(jù)進(jìn)行重用,實(shí)現(xiàn)對(duì)加工工藝和可選設(shè)備等離線信息的查詢(xún),解決多目標(biāo)多約束柔性作業(yè)車(chē)間調(diào)度問(wèn)題。郭興勇[42]等人通過(guò)提取飛機(jī)制造工藝流程規(guī)劃知識(shí),建立知識(shí)圖譜并研究工藝路線推薦方法,提高飛機(jī)制造工藝流程規(guī)劃效率及質(zhì)量,縮短飛機(jī)研制周期。武群惠[43]等人構(gòu)建了面向航天制造企業(yè)的供應(yīng)鏈知識(shí)圖譜,涵蓋采購(gòu)、物流、合同、質(zhì)量、倉(cāng)儲(chǔ)等信息,輔助企業(yè)對(duì)斷供影響進(jìn)行分析,保障供應(yīng)鏈安全。李昊[44]針對(duì)緊急訂單的插單排產(chǎn)情況,建立了混流裝配線訂單知識(shí)圖譜,能夠?qū)⒂唵?、企業(yè)資源以及企業(yè)效益間的關(guān)聯(lián)程度表示出來(lái),并作為制定訂單優(yōu)先級(jí)順序的依據(jù)。
3.2.3 質(zhì)量管理與控制
基于知識(shí)圖譜的質(zhì)量管理與控制,可以輔助生產(chǎn)過(guò)程中質(zhì)量的智能管控;同時(shí),在出現(xiàn)質(zhì)量異常情況時(shí),可以根據(jù)生產(chǎn)過(guò)程中產(chǎn)生的歷史數(shù)據(jù)和以往經(jīng)驗(yàn)知識(shí),分析質(zhì)量問(wèn)題的成因,從而提出解決方案以供參考。現(xiàn)有文獻(xiàn)將質(zhì)量控制的體系、設(shè)備參數(shù)、工藝參數(shù)、資源變量等影響質(zhì)量的因素進(jìn)行語(yǔ)義關(guān)聯(lián),輔助工作人員完善質(zhì)量控制的體系,在生產(chǎn)過(guò)程中及時(shí)控制和調(diào)整參數(shù),以保證產(chǎn)品質(zhì)量滿足生產(chǎn)目標(biāo)。謝生同[45]構(gòu)建了機(jī)械加工知識(shí)圖譜,并運(yùn)用圖算法和圖神經(jīng)網(wǎng)絡(luò)等方法研究工藝參數(shù)推薦方法,從而輔助參數(shù)優(yōu)化決策。孟令達(dá)[46]通過(guò)構(gòu)建生產(chǎn)環(huán)節(jié)的質(zhì)量風(fēng)險(xiǎn)知識(shí)圖譜,推理生產(chǎn)環(huán)節(jié)中風(fēng)險(xiǎn)源之間的關(guān)聯(lián)關(guān)系,當(dāng)出現(xiàn)某一質(zhì)量風(fēng)險(xiǎn)時(shí),及時(shí)預(yù)測(cè)可能發(fā)生的伴隨風(fēng)險(xiǎn)及影響,以便迅速響應(yīng)并采取應(yīng)急措施。蔣軍威[47]構(gòu)建了零件制造質(zhì)量形成知識(shí)圖譜提出一種用于關(guān)鍵工序評(píng)價(jià)的方法,實(shí)現(xiàn)了對(duì)制造質(zhì)量形成過(guò)程的智能化管控,為新一代質(zhì)量管理模式提供了新的思路。王贊贊[48]以變速箱裝配過(guò)程為研究對(duì)象,分析裝配過(guò)程中常見(jiàn)的質(zhì)量問(wèn)題,建立過(guò)程質(zhì)量控制的體系框架,并提出基于知識(shí)圖譜的變速箱裝配質(zhì)量控制方法,實(shí)現(xiàn)對(duì)裝配過(guò)程的質(zhì)量預(yù)測(cè)與控制。
3.2.4 設(shè)備故障診斷
在制造領(lǐng)域,基于知識(shí)圖譜的設(shè)備故障診斷,是當(dāng)前知識(shí)圖譜技術(shù)應(yīng)用研究的熱點(diǎn)問(wèn)題。設(shè)備故障診斷需要了解設(shè)備狀態(tài)、故障發(fā)生機(jī)理、故障表現(xiàn)及影響和接觸故障方案等諸多信息,所以在無(wú)專(zhuān)業(yè)維修人員指導(dǎo)下很難查找故障原因,也無(wú)法及時(shí)維修。知識(shí)圖譜可以整合各類(lèi)故障診斷報(bào)表以及以往故障案例,以“故障現(xiàn)象—原因—解決方案”的形式構(gòu)建故障知識(shí)圖譜,輔助故障原因的定位和診斷,并為故障的排除提供參考方案。劉勁松[49]通過(guò)整理企業(yè)內(nèi)零散的設(shè)備故障維護(hù)知識(shí),構(gòu)建機(jī)床故障知識(shí)圖譜。利用該圖譜可以對(duì)機(jī)床的故障發(fā)生原因進(jìn)行檢索推理,得出相應(yīng)的維修參考方案,提高了故障處理效率。胡晨陽(yáng)[50]以西門(mén)子、發(fā)那科等數(shù)控制造廠商的維修技術(shù)手冊(cè)以及企業(yè)數(shù)控機(jī)床故障維修案例為研究對(duì)象,構(gòu)建數(shù)控機(jī)床故障診斷知識(shí)圖譜,根據(jù)故障描述相似度為用戶匹配故障維修案例。周佳樂(lè)[51]重點(diǎn)研究了工業(yè)機(jī)器人故障診斷知識(shí)圖譜的構(gòu)建方法,通過(guò)推理故障間的復(fù)雜關(guān)聯(lián)關(guān)系,為維修人員提供輔助推理診斷,提高了故障排查的準(zhǔn)確率。
4 結(jié) 論
通過(guò)調(diào)研現(xiàn)有的制造領(lǐng)域知識(shí)圖譜相關(guān)文獻(xiàn),發(fā)現(xiàn)構(gòu)建知識(shí)圖譜相關(guān)的理論和技術(shù)框架正在不斷完善,應(yīng)用場(chǎng)景也正在不斷豐富,應(yīng)用層次和應(yīng)用效果也在不斷提升,同時(shí)發(fā)現(xiàn)在落地應(yīng)用實(shí)施方面,還有很大的不足,當(dāng)前大都停留在學(xué)術(shù)研究層面,距離實(shí)際廣泛應(yīng)用還需要繼續(xù)努力。本文首先總結(jié)了構(gòu)建制造領(lǐng)域知識(shí)圖譜的關(guān)鍵技術(shù)及研究進(jìn)展,再將目前知識(shí)圖譜在制造領(lǐng)域最為廣泛的應(yīng)用案例分為兩類(lèi),分別探究了其具體的應(yīng)用場(chǎng)景,希望能為相關(guān)企業(yè)構(gòu)建及應(yīng)用知識(shí)圖譜提供參考。
參考文獻(xiàn):
[1] 周濟(jì).以智能制造為主攻方向 堅(jiān)定不移建設(shè)制造強(qiáng)國(guó) [J].中國(guó)工業(yè)和信息化,2022(9):34-40.
[2] 朱鐸先,趙敏.機(jī)智:從數(shù)字化車(chē)間走向智能制造 [M].北京:機(jī)械工業(yè)出版社,2018.
[3] 張應(yīng)剛,夏威屹,尹伊,等.對(duì)新一代智能制造的幾點(diǎn)思索 [J].制造業(yè)自動(dòng)化,2022,44(10):124-126+220.
[4] 周濟(jì),李培根,周艷紅,等.走向新一代智能制造 [J].Engineering,2018(1):28-47.
[5] 劉悅悅,李燕.醫(yī)學(xué)知識(shí)圖譜研究綜述 [J].軟件導(dǎo)刊,2023,22(5):241-247.
[6] 陳世超,崔春雨,張華,等.制造業(yè)生產(chǎn)過(guò)程中多源異構(gòu)數(shù)據(jù)處理方法綜述 [J].大數(shù)據(jù),2020,6(5):55-81.
[7] 趙彤宇.醫(yī)學(xué)知識(shí)圖譜構(gòu)建方法研究及在疾病診斷中的應(yīng)用 [D].濟(jì)南:齊魯工業(yè)大學(xué),2020.
[8] 張航.泥石流災(zāi)害領(lǐng)域知識(shí)圖譜的構(gòu)建與應(yīng)用 [D].昆明:云南師范大學(xué),2021.
[9] SONG S,ZHANG N,HUANG H. Named entity recognition based on conditional random fields [J].Cluster Computing,2017(1):1-12.
[10] 賈美云.基于知識(shí)圖譜的汽車(chē)交易智能推薦系統(tǒng)研究 [D].太原:中北大學(xué),2020.
[11] WINTAKA D C,BIJAKSANA M A,ASROR I. Named-Entity Recognition on Indonesian Tweets using Bidirectional LSTM-CRF [J].Procedia Computer Science,2019,157:221-228.
[12] 周雷.基于知識(shí)圖譜的電機(jī)故障診斷方法 [D].重慶:重慶郵電大學(xué),2022.
[13] 胡杰,李源潔,耿號(hào),等.基于深度學(xué)習(xí)的汽車(chē)故障知識(shí)圖譜構(gòu)建 [J].汽車(chē)工程,2023,45(1):52-60+85.
[14] SUNDERMEYER M,RALF SCHLüTER,NEY H. LSTM Neural Networks for Language Modeling [C]//Interspeech.ISCA:2012:194-197.
[15] 張彤,宋明艷,王俊,等.基于PCNN的工業(yè)制造領(lǐng)域質(zhì)量文本實(shí)體關(guān)系抽取方法 [J].信息技術(shù)與網(wǎng)絡(luò)安全,2021,40(3):8-13.
[16] 段文昱,朱繼召,趙浩楠,等.面向武器裝備領(lǐng)域的實(shí)體及關(guān)系抽取方法研究 [J].中國(guó)電子科學(xué)研究院學(xué)報(bào),2022,17(12):1165-1172.
[17] MINTZ M,BILLS S,SNOW R,et al. Distant supervision for relation extraction without labeled data [C]//Proc of International Joint Conference on Natural Language Processing.Stroudsburg:Association for Computational Linguistics,2009:1003-1011.
[18] 賴(lài)冠宇,張旭,童浩卓.基于BERT-wwm-ext和BiLSTM模型的遠(yuǎn)程監(jiān)督關(guān)系提取 [J].電腦編程技巧與維護(hù),2022(9):42-44.
[19] 袁泉,陳昌平,陳澤,等.基于BERT的兩次注意力機(jī)制遠(yuǎn)程監(jiān)督關(guān)系抽取 [J/OL].計(jì)算機(jī)應(yīng)用:1-8[2023-07-26].http://kns.cnki.net/kcms/detail/51.1307.TP.20230712.1331.002.html.
[20] 袁芳怡.面向制造業(yè)的知識(shí)圖譜表示模型與構(gòu)建技術(shù)研究 [D].哈爾濱:哈爾濱工業(yè)大學(xué),2019.
[21] 許駒雄,李敏波,劉孟珂,等.發(fā)動(dòng)機(jī)故障領(lǐng)域知識(shí)圖譜構(gòu)建與應(yīng)用 [J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2022,31(7):66-76.
[22] 王雅琳,鄒江楓,王凱,等.基于本體引導(dǎo)的注塑知識(shí)圖譜構(gòu)建及缺陷溯因應(yīng)用 [J].電子與信息學(xué)報(bào),2022,44(5):1521-1529.
[23] 劉璐,飛龍,高光來(lái).基于多視圖知識(shí)表示和神經(jīng)網(wǎng)絡(luò)的旅游領(lǐng)域?qū)嶓w對(duì)齊方法 [J].計(jì)算機(jī)應(yīng)用研究,2023,40(4):1044-1051.
[24] 胡小溪,牛儒,唐濤.基于詞項(xiàng)和語(yǔ)義融合的地鐵信號(hào)設(shè)備故障文本預(yù)處理 [J].鐵道學(xué)報(bào),2021,43(2):78-85.
[25] 高知新,徐林會(huì).基于隱馬爾科夫模型與語(yǔ)義融合的文本分類(lèi) [J].計(jì)算機(jī)應(yīng)用與軟件,2017,34(7):303-307.
[26] 李立,張修軍.大型車(chē)聯(lián)網(wǎng)數(shù)據(jù)庫(kù)的高效查詢(xún)技術(shù) [J].現(xiàn)代電子技術(shù),2017,40(22):60-62+65.
[27] 于慧琳,陳煒,王琪,等.使用子圖推理實(shí)現(xiàn)知識(shí)圖譜關(guān)系預(yù)測(cè) [J].計(jì)算機(jī)科學(xué)與探索,2022,16(8):1800-1808.
[28] 方喜峰,柳大坤,龔嬋媛,等.面向CAM數(shù)控編程領(lǐng)域的知識(shí)圖譜構(gòu)建方法 [J].中國(guó)機(jī)械工程,2023,34(12):1486-1494.
[29] LAO N,MITCHELL T,COHEN W W.Random walk inference and learning in a large scale knowledge base [C]//Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing.Stroudsburg.PA:Association for Computational Linguistics,2011:529-539.
[30] 尹昱東,王保建.半結(jié)構(gòu)裝配數(shù)據(jù)的知識(shí)抽取及機(jī)床裝配知識(shí)圖譜構(gòu)建方法研究 [J].制造技術(shù)與機(jī)床,2022(11):97-101.
[31] 邢曉宇,王淑一,劉文靜.考慮語(yǔ)義和位置信息的航天器知識(shí)圖譜關(guān)系預(yù)測(cè)方法 [J].空間控制技術(shù)與應(yīng)用,2022,48(6):32-39.
[32] 王佳皓,張?zhí)A.基于數(shù)字孿生自動(dòng)色環(huán)機(jī)的設(shè)計(jì)知識(shí)圖譜研究 [J].組合機(jī)床與自動(dòng)化加工技術(shù),2022(4):15-19.
[33] 宋鄧強(qiáng),周彬,申興旺,等.面向船舶分段制造過(guò)程的動(dòng)態(tài)知識(shí)圖譜建模方法 [J].上海交通大學(xué)學(xué)報(bào),2021,55(5):544-556.
[34] 楊?lèi)鹆?制造數(shù)據(jù)與工藝知識(shí)庫(kù)構(gòu)建及應(yīng)用技術(shù)研究 [D].西安:西安電子科技大學(xué),2022.
[35] 曾左英.基于數(shù)據(jù)與知識(shí)雙向驅(qū)動(dòng)的非智能物聯(lián)設(shè)備發(fā)現(xiàn)方法研究 [D].昆明:云南大學(xué),2022.
[36] 路松峰,李祎明,屠向陽(yáng),等.基于知識(shí)圖譜的數(shù)控裝備信息模型建模方法 [J].華中科技大學(xué)學(xué)報(bào):自然科學(xué)版,2022,50(6):39-47.
[37] 李寶清,王運(yùn)平,曹立林,等.模具設(shè)計(jì)知識(shí)表示方法 [J].鍛壓技術(shù),2023,48(6):176-184.
[38] 崔碩,張春燕,賈家樂(lè),等.基于深度學(xué)習(xí)的機(jī)械領(lǐng)域知識(shí)圖譜構(gòu)建及應(yīng)用 [J].制造技術(shù)與機(jī)床,2023(2):83-89.
[39] 徐進(jìn).面向工業(yè)裝配的知識(shí)圖譜構(gòu)建與應(yīng)用研究 [J].計(jì)算機(jī)科學(xué),2021,48(S1):285-288.
[40] 張思超,孔紹然,孔憲光,等.基于知識(shí)圖譜的典型零件加工工藝知識(shí)構(gòu)建方法 [J].自動(dòng)化應(yīng)用,2023,64(1):53-57.
[41] 鐘紅燕.基于知識(shí)圖譜的多目標(biāo)多約束柔性作業(yè)車(chē)間調(diào)度問(wèn)題的研究[D].西安:西安理工大學(xué),2022.
[42] 郭興勇,盛國(guó)紅,舒鑾理,等.基于知識(shí)圖譜的飛機(jī)制造工藝路線推薦方法研究 [J].設(shè)備管理與維修,2022(7):41-44.
[43] 武群惠,田廣.面向航天制造企業(yè)的供應(yīng)鏈知識(shí)圖譜研究與智能輔助分析示范建設(shè) [J].軍民兩用技術(shù)與產(chǎn)品,2021(9):50-55.
[44] 李昊.多品種小批量混流裝配線自適應(yīng)排產(chǎn)方法研究 [D].太原:中北大學(xué),2021.
[45] 謝生同.基于知識(shí)圖譜的機(jī)加工藝參數(shù)推薦方法研究 [D].西安:西安電子科技大學(xué),2022.
[46] 孟令達(dá).A公司光纖傳感產(chǎn)品生產(chǎn)環(huán)節(jié)的風(fēng)險(xiǎn)知識(shí)圖譜構(gòu)建研究 [D].北京:北京交通大學(xué),2021.
[47] 蔣軍威.基于知識(shí)圖譜的核電裝備零件制造質(zhì)量形成及關(guān)鍵工序評(píng)價(jià) [D].重慶:重慶大學(xué),2022.
[48] 王贊贊.基于深度學(xué)習(xí)與知識(shí)圖譜的變速箱裝配過(guò)程質(zhì)量控制方法與應(yīng)用研究 [D].合肥:合肥工業(yè)大學(xué),2022.
[49] 劉勁松.高檔數(shù)控機(jī)床數(shù)字孿生關(guān)鍵技術(shù)研究與應(yīng)用 [D].中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院沈陽(yáng)計(jì)算技術(shù)研究所),2023.
[50] 胡晨陽(yáng).面向數(shù)控機(jī)床故障診斷領(lǐng)域的知識(shí)圖譜構(gòu)建與應(yīng)用 [D].武漢:華中科技大學(xué),2022.
[51] 周佳樂(lè).工業(yè)機(jī)器人故障診斷知識(shí)圖譜構(gòu)建方法研究 [D].廣州:廣東工業(yè)大學(xué),2023.
作者簡(jiǎn)介:吳潔(1998—),女,漢族,河北邢臺(tái)人,碩士研究生在讀,主要研究方向:智能制造、數(shù)據(jù)分析。
收稿日期:2023-08-17
Construction and Application of Knowledge Graph in the Manufacturing Field
WU Jie
(School of Economics and Management, Hebei University of Science and Technology, Shijiazhuang 050018, China)
Abstract: With the development of the manufacturing industry towards digitalization, networking and intelligence, a large amount of product design, manufacturing and maintenance service data in enterprises is constantly stacked and accumulated. The introduction of Knowledge Graph technology to manage and mine the data can provide strong support for the realization of the new-generation intelligent manufacturing. Firstly, this paper reviews the construction and core technologies of knowledge graph in manufacturing field including knowledge extraction, knowledge fusion, knowledge reasoning, and so on. Then, the application of Knowledge Graph in the field of manufacturing is divided into two categories: semantic association and decision aid, and its specific application scenarios are explored. It is hoped that it can provide reference for the construction and application of Knowledge Graph for relevant enterprises.
Keywords: intelligent manufacturing; Knowledge Graph; knowledge extraction; knowledge fusion; knowledge reasoning