• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于圖卷積神經(jīng)網(wǎng)絡(luò)的專利語義模型構(gòu)建研究*

      2021-10-12 12:27:54余軍合鄧慧君施培妤胡國建
      機(jī)械制造 2021年9期
      關(guān)鍵詞:主題詞文檔檢索

      □ 沙 鶴 □ 余軍合 □ 鄧慧君 □ 施培妤 □ 胡國建

      寧波大學(xué) 機(jī)械工程與力學(xué)學(xué)院 浙江寧波 315211

      1 研究背景

      當(dāng)前,專利數(shù)據(jù)量龐大,簡單的關(guān)鍵詞檢索已經(jīng)無法滿足設(shè)計人員在短時間內(nèi)匹配關(guān)聯(lián)度較高的專利的需求。專利智能檢索能夠極大地縮短設(shè)計人員的查閱時間,提高工作效率。

      隨著大數(shù)據(jù)技術(shù)與信息科學(xué)處理技術(shù)的出現(xiàn)和發(fā)展,如何將數(shù)據(jù)處理技術(shù)與方法應(yīng)用于專利語義網(wǎng)絡(luò),引起了學(xué)者的廣泛關(guān)注,同時為專利智能檢索提供了技術(shù)支持。

      基于專利語義模型進(jìn)行專利檢索時,可以通過輸入一個詞、一句話或一段文字進(jìn)行查詢,而不必考慮文本中是否包含有關(guān)鍵詞。構(gòu)建高準(zhǔn)確性的語義模型,是提高專利檢索準(zhǔn)確度的重要方式。語義模型的發(fā)展由基于詞袋模型向基于向量模型跨越。楊宏章等[1]基于專利文本結(jié)構(gòu)構(gòu)建專利語義模型,提高了檢索效率。Zhang Longhui等[2]提出一種基于領(lǐng)域內(nèi)高平均值頻率術(shù)語的專利語義模型,用于目標(biāo)主題專利的查詢。姜春濤[3]提出基于關(guān)鍵詞和依存關(guān)系樹的圖模型,為專利智能分析提供語義支撐。王秀紅等[4]針對領(lǐng)域?qū)@R庫構(gòu)建,提出由專利文本向量表示專利語義信息的方法。曹洋[5]基于文本排序算法提取文本中語義信息,構(gòu)建拓?fù)鋱D,提升了文本主題的語義準(zhǔn)確性。劉斌等[6]采用神經(jīng)網(wǎng)絡(luò)提取專利和論文的特征,實現(xiàn)論文與專利之間的聯(lián)系,并提出基于深度學(xué)習(xí)的專利語義模型。Wu Hengqin等[7]針對技術(shù)專利中領(lǐng)域?qū)I(yè)技術(shù)難以識別的問題,提出應(yīng)用深度學(xué)習(xí)的方法來自動識別目標(biāo)專利。吳素雪[8]提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的專利語義模型,提高了檢索準(zhǔn)確度。隨著機(jī)器學(xué)習(xí)算法的發(fā)展,在向量模型下構(gòu)建專利語義已成為研究的熱點,不僅僅局限于關(guān)鍵詞的檢索是這一方法的重要應(yīng)用特點。

      深度學(xué)習(xí)在自然語言處理方面,Srivastava等[9]采用受限玻爾茲曼機(jī)對文檔進(jìn)行主題建模,Hill等[10]使用多層感知機(jī)卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)等對文檔進(jìn)行建模。前者只考慮詞語間的主題關(guān)系,不考慮文檔內(nèi)的語序問題,后者則主要以滑動窗口對文本建模。在文本分類中,郭利敏等[11]通過卷積神經(jīng)網(wǎng)絡(luò)對小批量文字生成批量文本,將古籍漢字的識別問題轉(zhuǎn)換為卷積神經(jīng)網(wǎng)絡(luò)的分類問題。最近,圖網(wǎng)絡(luò)模型的新發(fā)展引起了研究人員的廣泛關(guān)注,越來越多的圖網(wǎng)絡(luò)模型被人們所熟知[12]。Yao Liang等[13]采用圖卷積神經(jīng)網(wǎng)絡(luò)(GCN)進(jìn)行文本分類,提出基于文本的圖卷積神經(jīng)網(wǎng)絡(luò)模型。Liu Xi’en等[14]對圖卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行深一步研究,構(gòu)建張量圖卷積神經(jīng)網(wǎng)絡(luò),用于整合各種圖形的異構(gòu)信息。

      圖網(wǎng)絡(luò)可以依靠節(jié)點之間的信息傳遞來捕捉圖中的依賴關(guān)系,圖卷積神經(jīng)網(wǎng)絡(luò)依托于可以建立不規(guī)則數(shù)據(jù)結(jié)構(gòu)的圖網(wǎng)絡(luò),這給筆者基于圖卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建專利語義模型提供了理論基礎(chǔ)。

      2 專利語義模型構(gòu)建方法

      構(gòu)建基于圖卷積神經(jīng)網(wǎng)絡(luò)的專利語義模型,主要思路是通過確定網(wǎng)絡(luò)節(jié)點和節(jié)點間的連邊關(guān)系,構(gòu)建合適的網(wǎng)絡(luò)模型,能夠基于節(jié)點特性和整個網(wǎng)絡(luò)結(jié)構(gòu)性質(zhì),結(jié)合神經(jīng)網(wǎng)絡(luò)算法來提取專利語義信息。

      在基于圖卷積神經(jīng)網(wǎng)絡(luò)的專利分類模型部分,筆者通過構(gòu)建專利文本中專利與摘要、摘要中字與字的連邊關(guān)系進(jìn)行圖網(wǎng)絡(luò)的構(gòu)建。

      為了探究字與字構(gòu)建模型的語義和詞與詞構(gòu)建模型的語義的差異性,基于詞頻-逆向文檔頻率(IF-IDF)算法對摘要進(jìn)行主題詞提取,通過摘要主題詞與關(guān)鍵詞間的節(jié)點關(guān)系對摘要中字與字構(gòu)圖方式進(jìn)行了研究分析。

      在基于余弦相似度的圖卷積神經(jīng)網(wǎng)絡(luò)模型分析部分,筆者對兩種不同構(gòu)圖方式構(gòu)建的圖卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行分類,并基于分類效果圖分析模型的可靠性。結(jié)合相似專利與基準(zhǔn)專利,在基于兩種構(gòu)圖的圖卷積神經(jīng)網(wǎng)絡(luò)模型下進(jìn)行余弦相似度計算,通過相似度對比分析兩個模型的效果。

      筆者基于設(shè)計方法學(xué)中的三種設(shè)計人員常規(guī)檢索專利方式,以功能、功能-原理、功能-原理-結(jié)構(gòu)三種檢索式為研究對象,將針對三種檢索式的設(shè)計需求作為檢索語句嵌入圖網(wǎng)絡(luò),進(jìn)行相似專利的匹配?;诜祷赜脩魴z索的結(jié)果,采用專利檢索評估方法來評估不同檢索式的優(yōu)劣。

      基于圖卷積神經(jīng)網(wǎng)絡(luò)的專利語義模型構(gòu)建方法具體流程如圖1所示。

      3 圖卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建方法

      3.1 圖卷積神經(jīng)網(wǎng)絡(luò)

      (1)

      通過疊加多個圖卷積神經(jīng)網(wǎng)絡(luò)層來合并高階鄰域信息:

      (2)

      式中:H(k)為第k層輸入的特征矩陣;H(k+1)為第k+1層輸入的特征矩陣;Wk為經(jīng)過k層訓(xùn)練得出的權(quán)重參數(shù)。

      兩層圖卷積神經(jīng)網(wǎng)絡(luò)可以允許在兩個最大距離的節(jié)點間進(jìn)行消息傳遞,因此,盡管圖中沒有直接構(gòu)建的專利與摘要的邊,但是兩層圖卷積神經(jīng)網(wǎng)絡(luò)允許在文檔之間交換信息。筆者在初步試驗鄰接矩陣時發(fā)現(xiàn)兩層圖卷積神經(jīng)網(wǎng)絡(luò)的性能優(yōu)于一層圖卷積神經(jīng)網(wǎng)絡(luò),但更多的層數(shù)并不能提高性能。

      3.2 異構(gòu)網(wǎng)絡(luò)圖

      筆者在專利與摘要主題詞的連邊上應(yīng)用詞頻-逆向文檔頻率權(quán)重。在構(gòu)建摘要主題詞與摘要主題詞間的連邊時,為了應(yīng)用全局詞共現(xiàn)信息,在專利庫中所有摘要主題詞上使用一個固定大小的滑動窗口來收集共現(xiàn)信息。通過應(yīng)用點互信息算法來計算兩個摘要主題詞節(jié)點之間的權(quán)重。點互信息算法是一種常用的詞關(guān)聯(lián)度量方法,應(yīng)用點互信息算法相比應(yīng)用單詞共現(xiàn)計數(shù),可以獲得更好的結(jié)果。

      ▲圖1 基于圖卷積神經(jīng)網(wǎng)絡(luò)的專利語義模型構(gòu)建方法流程

      鄰接矩陣Acv為:

      (3)

      式中:S(e,j)為兩個主題詞間的點互信息值數(shù)據(jù)集;M(i,j)為專利與摘要主題詞的詞頻-逆向文檔頻率權(quán)重數(shù)據(jù)集。

      S(e,j)為:

      (4)

      p(e)=W(e)/W

      (5)

      p(j)=W(j)/W

      (6)

      p(e,j)=W(e,j)/W

      (7)

      式中:W為滑動窗口總數(shù);W(e)為在一個專利庫中包含鄰接矩陣中行摘要主題詞的滑動窗口數(shù);W(j)為在一個專利庫中包含鄰接矩陣中列摘要主題詞的滑動窗口數(shù);W(e,j)為在一個專利庫中同時包含行摘要主題詞和列摘要主題詞的滑動窗口數(shù);p(e)為行摘要主題詞在整個訓(xùn)練專利文本中出現(xiàn)的概率;p(j)為列摘要主題詞在整個訓(xùn)練專利文本中出現(xiàn)的概率;p(e,j)為行和列摘要主題詞在整個訓(xùn)練專利文本中同時出現(xiàn)的概率。

      點互信息值為正,表示主題詞與主題詞間的相關(guān)性較大。點互信息為負(fù),表示主題詞與主題詞間的相關(guān)性較小或不存在。所以,僅給點互信息值為正的兩個摘要主題詞節(jié)點連邊。

      逆向文檔頻率關(guān)系式為:

      Q(tl)=log(N/b+0.01)

      (8)

      式中:Q(tl)為摘要主題詞tl的逆向文檔頻率數(shù)據(jù)集;N為專利庫中專利的總數(shù);b為包含摘要主題詞tl的專利數(shù)。

      詞頻-逆向文檔頻率權(quán)重M為:

      M=PQ(tl)

      (9)

      式中:P為鄰接矩陣行中摘要主題詞tl在鄰接矩陣列所有專利中出現(xiàn)的次數(shù)。

      筆者基于字與詞的語義差異性,構(gòu)建基于專利-單字符和專利-主題詞兩種異構(gòu)圖的圖卷積神經(jīng)網(wǎng)絡(luò)模型,進(jìn)行語義模型的研究。構(gòu)圖中,需要分別對數(shù)據(jù)進(jìn)行字符級別的分詞與主題詞提取處理。單字符提取主要通過單字劃分實現(xiàn)。主題詞提取時,先對專利摘要進(jìn)行數(shù)據(jù)預(yù)處理,再應(yīng)用詞頻-逆向文檔頻率算法選出專利主題詞。兩種構(gòu)圖方式舉例見表1。

      表1 構(gòu)圖方式舉例

      兩種構(gòu)圖方式的圖卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。圖2中,數(shù)據(jù)集的全部文檔可以表示為D= {d1,d2,d3,…,dn},n為數(shù)據(jù)集中專利文檔總數(shù)。數(shù)據(jù)集中基于專利-主題詞構(gòu)建異構(gòu)文本圖時,全部主題詞可以表示為W={w1,w2,w3,…,wm},m為數(shù)據(jù)集中專利摘要文本主題詞的總數(shù)。數(shù)據(jù)集中基于專利-單字符構(gòu)建異構(gòu)文本圖時,全部單字符可以表示為C={c1,c2,c3,…,cx},x為數(shù)據(jù)集中專利摘要文本字符的總數(shù)。

      ▲圖2 兩種構(gòu)圖方式圖卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

      4 試驗數(shù)據(jù)集

      筆者基于incoPat專利數(shù)據(jù)庫檢索所需專利數(shù)據(jù),采用自行車基本設(shè)計結(jié)構(gòu)25個不同配件的關(guān)鍵詞,分別搭配自行車主題用于檢索專利數(shù)據(jù),共計檢索專利32 684條。由于外觀設(shè)計型專利技術(shù)特征基于設(shè)計圖來展示,與摘要關(guān)聯(lián)較小,因此筆者選取實用新型和發(fā)明專利作為分析數(shù)據(jù),篩選出專利共計27 406條。

      試驗數(shù)據(jù)中,自行車的國際專利分類號繁多,共計484種。將國際專利分類號作為訓(xùn)練標(biāo)簽類別分類特征不明顯,因此筆者的試驗基于模塊化設(shè)計思想,結(jié)合國際專利分類號查詢,將國際專利分類號映射至設(shè)計模塊。自行車按模塊設(shè)計可劃分為車架系統(tǒng)設(shè)計模塊、車輪系統(tǒng)設(shè)計模塊、車座系統(tǒng)設(shè)計模塊、導(dǎo)向系統(tǒng)設(shè)計模塊、傳動系統(tǒng)設(shè)計模塊、制動系統(tǒng)設(shè)計模塊。基于這六個模塊,結(jié)合國際專利分類表,進(jìn)行專利類別標(biāo)簽劃分。專利類別標(biāo)簽劃分見表2。

      表2 專利類別標(biāo)簽劃分

      5 試驗結(jié)果分析

      5.1 分類效果

      筆者基于Python編程軟件和張量框架構(gòu)建圖卷積神經(jīng)網(wǎng)絡(luò)模型,在圖卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,卷積層第一層和第二層的嵌入維度設(shè)置為200。隨機(jī)選擇訓(xùn)練集的20%作為驗證集,為防止過擬合,設(shè)置拋出隱藏節(jié)點率為 0.5,學(xué)習(xí)率為0.01。設(shè)置200個訓(xùn)練周期,若連續(xù)10個周期的驗證損失率沒有降低,則停止訓(xùn)練。模型采用準(zhǔn)確率、召回率、綜合評價分?jǐn)?shù),進(jìn)行性能評價。

      將處理后的數(shù)據(jù)輸入所構(gòu)建的圖卷積神經(jīng)網(wǎng)絡(luò)模型,為體現(xiàn)方法的適用性,選擇專利-單字符構(gòu)圖方式和專利-主題詞構(gòu)圖方式進(jìn)行對比試驗。采用專利-單字符構(gòu)圖方式,輸入節(jié)點數(shù)為30 258。采用專利-主題詞構(gòu)圖方式,輸入節(jié)點數(shù)為66 032。試驗結(jié)果表明,基于專利-單字符構(gòu)圖方式的圖卷積神經(jīng)網(wǎng)絡(luò)模型,分類整體的平均準(zhǔn)確率為0.810 3,基于專利-主題詞構(gòu)圖方式的圖卷積神經(jīng)網(wǎng)絡(luò)模型,分類整體的平均準(zhǔn)確率為0.793 7。兩種構(gòu)圖方式的分類效果對比見表3。

      表3 兩種構(gòu)圖方式分類效果對比

      5.2 專利分類可視化

      使用t分布隨機(jī)鄰居嵌入算法進(jìn)行高維向量降維可視化,對學(xué)習(xí)到的文檔嵌入可視化。兩種構(gòu)圖方式的專利分類可視化如圖3所示。圖3中,+表示傳動系統(tǒng)設(shè)計模塊相關(guān)專利,▲表示導(dǎo)向系統(tǒng)設(shè)計模塊相關(guān)專利,■表示車座系統(tǒng)設(shè)計模塊相關(guān)專利,▼表示車架系統(tǒng)設(shè)計模塊相關(guān)專利,●表示車輪系統(tǒng)設(shè)計模塊相關(guān)專利,★表示制動系統(tǒng)設(shè)計模塊相關(guān)專利。

      ▲圖3 兩種構(gòu)圖方式專利分類可視化

      由圖3可以看出,帶有相同標(biāo)簽的專利彼此接近,在向量空間中可以區(qū)分出六種類型。六種類型各自聚集在一起,這意味著大多數(shù)摘要主題詞與對應(yīng)的設(shè)計模塊密切相關(guān)。由圖3還可以看出,車架系統(tǒng)設(shè)計模塊專利分類效果差于其它類別,這是由于車架系統(tǒng)設(shè)計模塊相關(guān)專利中的摘要會涉及許多其它模塊相關(guān)專利的主題詞,車架系統(tǒng)設(shè)計模塊相關(guān)專利和其它模塊相關(guān)專利的耦合性較強(qiáng)。

      5.3 專利語義模型效果

      為了進(jìn)一步對不同構(gòu)圖方式的專利語義模型效果進(jìn)行分析,將六類基準(zhǔn)專利作為基準(zhǔn)向量,對各類相似專利與對應(yīng)的基準(zhǔn)向量進(jìn)行余弦相似度計算,得到專利語義模型的準(zhǔn)確性。筆者所選用的測試專利與基準(zhǔn)專利見表4。

      表4 測試專利與基準(zhǔn)專利

      兩種構(gòu)圖方式的專利語義模型余弦相似度如圖4所示。由圖4可知,六大類共18項專利中,16項專利在基于專利-單字符構(gòu)圖方式圖卷積神經(jīng)網(wǎng)絡(luò)的專利語義模型中與基準(zhǔn)專利的余弦相似度大于基于專利-主題詞構(gòu)圖方式圖卷積神經(jīng)網(wǎng)絡(luò)的專利語義模型。因此,在向量空間中,基于專利-單字符構(gòu)圖方式圖卷積神經(jīng)網(wǎng)絡(luò)的專利語義模型的基準(zhǔn)專利與測試專利之間的向量更為接近,模型呈現(xiàn)的語義關(guān)系更加準(zhǔn)確。這說明了基于專利-單字符構(gòu)圖方式圖卷積神經(jīng)網(wǎng)絡(luò)的專利語義模型的效果優(yōu)于基于專利-主題詞構(gòu)圖方式圖卷積神經(jīng)網(wǎng)絡(luò)的專利語義模型。

      6 檢索分析

      6.1 專利查詢評價標(biāo)準(zhǔn)

      專利查詢結(jié)果往往通過召回率與準(zhǔn)確率來衡量,召回率計算時并沒有考慮用戶因素和相關(guān)文檔的排名。目前也有一些算法,如綜合評價分?jǐn)?shù),對召回率進(jìn)行改進(jìn),但是對于專利集合未知的檢索需求還存在一定問題。鑒于此,Magdy等[15]提出一個結(jié)合結(jié)果中相關(guān)文檔排名情況的專利檢索評價標(biāo)準(zhǔn),計算式為:

      (10)

      (11)

      式中:H為專利檢索評價標(biāo)準(zhǔn)值;Zmax為返回給用戶的最大檢索專利數(shù);rq為第q個相關(guān)文檔的排名;a為相關(guān)文檔數(shù);R為Zmax中的相關(guān)文檔數(shù)。

      對于專利檢索,最基本的衡量在于召回率,這個結(jié)果關(guān)注檢索算法的查全率。

      平均準(zhǔn)確率對于單個主題而言,指每條相關(guān)專利被檢索后的平均準(zhǔn)確率。平均準(zhǔn)確率是反映系統(tǒng)相關(guān)專利排名的一個指標(biāo),檢索結(jié)果中相關(guān)專利排名越靠前,平均準(zhǔn)確率就越高。如對于一個檢索句,返回結(jié)果相關(guān)專利有五個,排名為1、4、7、9、13,則平均準(zhǔn)確率計算結(jié)果為:

      (1/1+2/4+3/7+4/9+5/13)/5=0.552

      專利檢索評價標(biāo)準(zhǔn)不僅考慮檢索結(jié)果中相關(guān)專利的排名情況,而且兼顧召回率。專利檢索評價標(biāo)準(zhǔn)值越大,說明檢索算法的召回率越高,相關(guān)專利的排名越靠前。

      6.2 不同檢索式對比

      在較好的專利-單字符構(gòu)圖方式圖卷積神經(jīng)網(wǎng)絡(luò)的專利語義模型的基礎(chǔ)上,基于設(shè)計方法學(xué)對設(shè)計人員常規(guī)使用的檢索方式進(jìn)行研究,對專利描述文本按功能-原理-結(jié)構(gòu)、功能-原理、功能三種不同檢索式進(jìn)行對比試驗。采用三種句式進(jìn)行語義檢索,分別為:① 為了達(dá)到防止剎車鎖死的目的,主要通過剎車器的彈性件與移動座之間的動作關(guān)系來實現(xiàn),剎車器的構(gòu)成部分有夾臂、滑槽、制動組件、軸部、彈性件;② 為了達(dá)到防止剎車鎖死的目的,主要通過剎車器的彈性件與移動座之間的動作關(guān)系來實現(xiàn);③ 為了達(dá)到防止剎車鎖死的目的。檢索出相似專利文本,按照相關(guān)程度從高到低排序,選取前幾項專利。三種檢索式余弦相似度分析見表5。

      ▲圖4 兩種構(gòu)圖方式專利語義模型余弦相似度

      表5 三種檢索式余弦相似度分析

      由表5可以看出,余弦相似度排名前幾位的專利雖然應(yīng)用功能不完全相同,但是專利的摘要內(nèi)容與檢索文本內(nèi)容有所關(guān)聯(lián),這符合檢索文本的目標(biāo)主題。由余弦相似度可知,檢索文本內(nèi)容越豐富,最為相關(guān)的專利的余弦相似度就越小。這是因為在空間語義模型中,句子越長的文本,所包含的語義越豐富,語義吻合度極高的文本相對就越少。

      6.3 檢索結(jié)果分析

      在基于專利-主題詞構(gòu)圖方式圖卷積神經(jīng)網(wǎng)絡(luò)的專利語義模型中,對于專利描述文本“為了達(dá)到防止剎車鎖死的目的,主要通過剎車器的彈性件與移動座之間的動作關(guān)系來實現(xiàn),剎車器的構(gòu)成部分有夾臂、滑槽、制動組件、軸部、彈性件”,文本主題詞為“剎車”“鎖死”“夾臂”“滑槽”。筆者為提高專利文本語義分析的準(zhǔn)確性,提取主題詞的相關(guān)擴(kuò)展詞進(jìn)行協(xié)同驗證,將訓(xùn)練后的基于專利-主題詞構(gòu)圖方式圖卷積神經(jīng)網(wǎng)絡(luò)的專利語義模型輸出的38 531個主題詞詞向量與目標(biāo)主題詞進(jìn)行余弦相似度計算,進(jìn)行相似詞擴(kuò)展。將余弦相似度閾值設(shè)定為0.7,選取語義近似的五個詞,語義關(guān)聯(lián)詞擴(kuò)展結(jié)果如圖5所示。

      專利檢索評價數(shù)據(jù)選用專利語義模型輸出的余弦相似度排名靠前的300條專利數(shù)據(jù),作為文檔庫專利。此外,將其中的前30條作為返回給用戶的檢索最大結(jié)果數(shù)。通過主題詞及其語義關(guān)聯(lián)詞的包含與否作為評價專利是否相關(guān)的依據(jù),統(tǒng)計結(jié)果見表6。

      表6 主題詞及語義關(guān)聯(lián)詞相關(guān)專利統(tǒng)計結(jié)果

      選用的評價標(biāo)準(zhǔn)主要有平均準(zhǔn)確率、召回率、專利檢索評價標(biāo)準(zhǔn),專利檢索評價結(jié)果如圖6所示。

      ▲圖5 語義關(guān)聯(lián)詞擴(kuò)展結(jié)果

      ▲圖6 專利檢索評價結(jié)果

      由圖6可知,功能-原理-結(jié)構(gòu)檢索式效果相比功能-原理、功能檢索式更好,因此,基于專利-單字符構(gòu)圖方式圖卷積神經(jīng)網(wǎng)絡(luò)的專利語義模型在功能-原理-結(jié)構(gòu)檢索式中檢索效果更佳。

      7 結(jié)束語

      專利由于專業(yè)性和專利詞匯的相似性,不能簡單將普通文本直接應(yīng)用于專利檢索。筆者通過構(gòu)建基于圖卷積神經(jīng)網(wǎng)絡(luò)的專利語義模型來對專利領(lǐng)域進(jìn)行檢索,通過不同構(gòu)圖方式和不同檢索式來對模型進(jìn)行評估,通過數(shù)據(jù)分析和對比可知,采用基于專利-單字符構(gòu)圖方式圖卷積神經(jīng)網(wǎng)絡(luò)的專利語義模型,結(jié)合功能-原理-結(jié)構(gòu)檢索式,在檢索效果方面更佳。筆者基于圖卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建的專利語義模型在一定程度上使檢索變得更加智能,可以為設(shè)計人員獲取設(shè)計創(chuàng)新知識提供更佳有效的專利檢索方式。

      猜你喜歡
      主題詞文檔檢索
      有人一聲不吭向你扔了個文檔
      2019年第4-6期便捷檢索目錄
      基于RI碼計算的Word復(fù)制文檔鑒別
      專利檢索中“語義”的表現(xiàn)
      專利代理(2016年1期)2016-05-17 06:14:36
      Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
      我校學(xué)報第32卷第5期(2014年10月)平均每篇有3.04個21世紀(jì)的Ei主題詞
      我校學(xué)報第32卷第6期(2014年12月)平均每篇有3.00個21世紀(jì)的Ei主題詞
      2014年第16卷第1~4期主題詞索引
      《疑難病雜志》2014年第13卷主題詞索引
      不讓他人隨意下載Google文檔
      電腦迷(2012年4期)2012-04-29 06:12:13
      武川县| 罗江县| 岳池县| 英吉沙县| 深泽县| 堆龙德庆县| 本溪市| 舞钢市| 静宁县| 汉寿县| 石渠县| 德化县| 沭阳县| 沁阳市| 乌鲁木齐市| 皮山县| 美姑县| 介休市| 全南县| 屯昌县| 丽江市| 当涂县| 石楼县| 新兴县| 枣阳市| 板桥市| 金坛市| 富平县| 平顺县| 景泰县| 大冶市| 禹州市| 合山市| 习水县| 游戏| 曲水县| 津南区| 安多县| 赤城县| 高青县| 青川县|