• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于領(lǐng)域本體的專利技術(shù)—功效文本挖掘方法

      2018-01-15 23:00:58陸佳偉慎金花張更平楊鋒
      價(jià)值工程 2018年2期
      關(guān)鍵詞:技術(shù)

      陸佳偉+慎金花+張更平+楊鋒

      摘要:專利技術(shù)-功效圖是專利地圖的一種。通過制作專利技術(shù)-功效圖,可以有效識(shí)別相關(guān)技術(shù)空白點(diǎn)和突破點(diǎn),有助于加強(qiáng)專利戰(zhàn)略部署。本文以MOCVD(金屬有機(jī)化合物化學(xué)氣相沉淀)技術(shù)為例,首先通過技術(shù)骨架的搭建確定技術(shù)-功效詞,構(gòu)建了一個(gè)技術(shù)-功效導(dǎo)向的基于敘詞表的領(lǐng)域本體。進(jìn)而借助文本挖掘技術(shù)通過專利摘要分析初步實(shí)現(xiàn)了對(duì)文本語義的理解,完成了技術(shù)-功效圖的半自動(dòng)制作。通過將研究結(jié)果與某公司人工制作的技術(shù)-功效圖進(jìn)行對(duì)比,驗(yàn)證了此方法的準(zhǔn)確性和有效性,并對(duì)二者的差異進(jìn)行了解釋。

      Abstract: Patent technology-function diagram is a kind of patent map. Through the production of patent technology-function diagram, we can effectively identify the relevant technical gaps and breakthrough points, help strengthen the patent strategy deployment. This paper takes MOCVD(Metal-organic Chemical Vapor Deposition) technology as an example, first to establish the technical words and efficacy words based technical backbone structures in order to build a technology and function-oriented domain ontology on the basis of thesaurus. And then by means of text mining patent abstract analysis, this method realizes text semantic understanding initially as well as figures out the technology-function diagram semi-automatically. By comparing with a company with its artificial production of technology-function diagram, the accuracy and effectiveness of this method is verified and the difference between the two is explained.

      關(guān)鍵詞:領(lǐng)域本體;專利摘要分析;技術(shù)-功效圖

      Key words: domain ontology;patent abstract analysis;technology-function diagram

      中圖分類號(hào):G350.7 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-4311(2018)02-0245-04

      0 引言

      專利文獻(xiàn)是世界上最大的技術(shù)信息源,包含了世界科技技術(shù)信息的90%-95%[1]。通過對(duì)專利文獻(xiàn)進(jìn)行挖掘,可以制作成專利地圖,從而獲取專利中蘊(yùn)含的行業(yè)動(dòng)態(tài)、技術(shù)發(fā)展趨勢(shì)等有價(jià)值的信息。專利技術(shù)-功效圖是專利地圖的一種,通過分解專利技術(shù)手段與達(dá)成功效,制成矩陣型的統(tǒng)計(jì)表或圖。從專利技術(shù)-功效圖的研究中可以一目了然地掌握“專利雷區(qū)”和“專利空白區(qū)”分布情況,可有效加強(qiáng)“專利部署”,在了解技術(shù)現(xiàn)狀、分析競爭對(duì)手和協(xié)助制定技術(shù)發(fā)展戰(zhàn)略等方面具有重要作用。

      傳統(tǒng)技術(shù)-功效圖的制作過程一般分三個(gè)階段,即技術(shù)-功效的確定、人工標(biāo)引及技術(shù)-功效圖的制作。這種方法制作的專利技術(shù)-功效圖,準(zhǔn)確性較高,但要求研究人員具備相當(dāng)扎實(shí)和豐富的專業(yè)知識(shí),且通常耗時(shí)較長,花費(fèi)不菲,方法通用性不強(qiáng)?;谏鲜鱿拗?,專利技術(shù)-功效圖的制作并未得到廣泛的應(yīng)用。本文采用技術(shù)骨架法構(gòu)建領(lǐng)域本體,通過本體尋找技術(shù)詞和功效詞,再利用文本挖掘工具TDA對(duì)專利摘要進(jìn)行分析,得出技術(shù)詞和功效詞共現(xiàn)矩陣,達(dá)到半自動(dòng)化制作專利技術(shù)-功效圖的目的。采用此種方法不僅可以減少對(duì)專家的依賴,還能大大縮短專利-技術(shù)功效圖的制作時(shí)間,得到的結(jié)果也更為客觀、準(zhǔn)確。

      1 文獻(xiàn)綜述

      隨著計(jì)算機(jī)技術(shù)和信息技術(shù)的不斷發(fā)展,一些新的方法逐漸被引入到專利技術(shù)-功效分析過程中?,F(xiàn)有研究主要從文本挖掘技術(shù)運(yùn)用的角度出發(fā),一部分提出了理論模型和方法。Yuen-Hsien Tseng(2005)[2]等以“碳納米管”技術(shù)為例,證明了對(duì)于大部分有明確分類的特征詞,機(jī)器抽取能達(dá)到和人工標(biāo)引相似的效果,為文本挖掘在專利地圖制作中的運(yùn)用提供了理論依據(jù)。陳穎,張曉林(2011,2012)[3,4]綜合考慮了專利結(jié)構(gòu)、語法和線索詞三種特征因素,提出了一種基于專利結(jié)構(gòu)-語法-線索詞特征的技術(shù)詞、功效詞識(shí)別方法,使技術(shù)詞和功效詞識(shí)別更具有效性和科學(xué)性。翟東升,蔡萬江等(2013)[5]通過引入MapReduce分布式計(jì)算的概念,采用集群系統(tǒng)解決了傳統(tǒng)方法處理海量數(shù)據(jù)低效的問題,提高了專利技術(shù)-功效圖的制作效率。張博培(2015)[6]將技術(shù)-功效構(gòu)建分為功效詞提取系統(tǒng)、技術(shù)詞提取系統(tǒng)和技術(shù)-功效矩陣的構(gòu)建等三個(gè)部分,運(yùn)用自然語言處理、機(jī)器學(xué)習(xí)以及文本挖掘等技術(shù)進(jìn)行中文專利數(shù)據(jù)技術(shù)-功效矩陣的半自動(dòng)構(gòu)建,為專利技術(shù)-功效圖的制作提供了技術(shù)支持。

      另一部分則產(chǎn)生了現(xiàn)實(shí)成果和實(shí)例。王麗,張冬榮(2013)[7]等設(shè)計(jì)并實(shí)現(xiàn)了一種標(biāo)引功效矩陣自動(dòng)化工具Patent-TEM,該工具通過詞庫構(gòu)建、主題標(biāo)引、功效矩陣、文本提取等步驟對(duì)專利文本進(jìn)行挖掘和分析,自動(dòng)生成專利功效矩陣圖,能夠大幅度提高傳統(tǒng)功效矩陣分析的工作效率,實(shí)現(xiàn)專利微觀分析工作的自動(dòng)化與工具化,但其并未涉及對(duì)技術(shù)詞和功效詞選取的研究?;舸滏玫龋?013)[8]利用日本FI/F-term分類體系進(jìn)行數(shù)據(jù)分類標(biāo)引預(yù)處理,并以實(shí)例驗(yàn)證了基于FI/F-term分類構(gòu)建專利技術(shù)/功效矩陣的應(yīng)用流程與方法,然而該方法一般針對(duì)公開信息較多的技術(shù),通用性有所不足。翟東升,蔡力偉等(2015)[9]以3D打印技術(shù)為例,通過清洗專利結(jié)構(gòu)化信息與抽取非結(jié)構(gòu)化信息特征詞,結(jié)合數(shù)據(jù)倉庫技術(shù),實(shí)現(xiàn)了技術(shù)-功效圖的構(gòu)建與多維分析。endprint

      已有的研究大多關(guān)注的是技術(shù)功效詞的選取以及共現(xiàn)矩陣的實(shí)現(xiàn),對(duì)于前者,若缺乏對(duì)所選取技術(shù)-功效詞的深入理解和分析,將導(dǎo)致制作的技術(shù)-功效圖難以得到實(shí)際應(yīng)用。對(duì)于后者,自然語言處理等技術(shù)尚不成熟,其對(duì)詞語的識(shí)別停留在語形層面,對(duì)語義的理解不夠深入,易遺漏關(guān)鍵技術(shù)-功效詞,從而造成技術(shù)-功效圖精度不足的結(jié)果。除此之外,現(xiàn)有的研究成果鮮有與人工制作的專利技術(shù)-功效圖進(jìn)行對(duì)比,其準(zhǔn)確性也無從考證。為了對(duì)技術(shù)-功效詞進(jìn)行科學(xué)的選取,本文引入本體的概念,即“概念模型的明確的規(guī)范說明”[10]。作為特定領(lǐng)域的知識(shí)集合,本體較全面地包含了本領(lǐng)域的相關(guān)技術(shù)、結(jié)構(gòu)、功能等重要信息,具有覆蓋面廣、代表性強(qiáng)、專家依賴性低等優(yōu)點(diǎn),可為技術(shù)-功效詞的確定提供依據(jù)。本文以MOCVD技術(shù)為研究對(duì)象,采用骨架法和敘詞表法結(jié)合的方法快速構(gòu)建了一個(gè)基于敘詞表的領(lǐng)域本體,對(duì)技術(shù)-功效詞進(jìn)行規(guī)范選取、異形合并、同義合并、下位詞擴(kuò)展,結(jié)合文本挖掘技術(shù)對(duì)專利信息進(jìn)行技術(shù)-功效挖掘,提高了半自動(dòng)化制作專利技術(shù)-功效圖的準(zhǔn)確性,彌補(bǔ)了現(xiàn)有研究的不足之處。為了檢驗(yàn)方法的有效性和科學(xué)性,本文將研究成果與某公司人工制作的MOCVD技術(shù)專利技術(shù)-功效圖進(jìn)行對(duì)比,分析了誤差產(chǎn)生的原因,并闡明了今后的改進(jìn)方向。

      2 MOCVD技術(shù)本體構(gòu)建

      MOCVD(Metal organic chemical vapor Deposition)即有機(jī)金屬化學(xué)汽相淀積,它是在 1968年由美國洛克威爾公司的Manasevit[11,12]等人提出來的制備化合物半導(dǎo)體薄片單晶的一項(xiàng)新技術(shù)。由MOCVD技術(shù)產(chǎn)生的白光LED半導(dǎo)體照明,更具有十分誘人的發(fā)展前景,是照明領(lǐng)域中一場(chǎng)革命,被列為各國的發(fā)展戰(zhàn)略之一[13]。由于種種原因,我國MOCVD技術(shù)發(fā)展嚴(yán)重滯后,設(shè)備制造主要集中在歐美及日本等極少數(shù)國家。快速有效地識(shí)別MOCVD技術(shù)的核心要點(diǎn)、研發(fā)熱點(diǎn)及技術(shù)突破點(diǎn),有利于盡早掌握技術(shù)優(yōu)勢(shì),通過專利布局構(gòu)建專利壁壘,建立市場(chǎng)競爭優(yōu)勢(shì),規(guī)避專利雷區(qū),從而加快我國LED產(chǎn)業(yè)的發(fā)展。

      由于MOCVD技術(shù)復(fù)雜,若直接對(duì)其技術(shù)-功效進(jìn)行分析,容易造成“一葉障目,不見泰山”的局面,影響結(jié)果的準(zhǔn)確性和全面性,構(gòu)建領(lǐng)域本體能夠打破這種局限。目前常用的本體構(gòu)建方法包括敘詞表法、骨架法等。技術(shù)骨架是技術(shù)的輪廓和基本框架,搭建它可以快速地獲取技術(shù)的核心方法等。敘詞表又稱為主題詞表,它是一種語義詞典,由術(shù)語及術(shù)語之間的各種關(guān)系組成,能反映某學(xué)科領(lǐng)域的語義有關(guān)概念[14],它擁有豐富的詞匯及詞間關(guān)系,所以重用敘詞表可以極大地提高本體構(gòu)建效率并降低成本[15]。因此,本文采取骨架法和敘詞表法結(jié)合的方法,加快MOCVD技術(shù)本體構(gòu)建的速度,更客觀地獲取信息。

      2.1 MOCVD技術(shù)骨架的確定

      MOCVD技術(shù)由反應(yīng)室(reactor)、加熱系統(tǒng)(heating system)、冷卻系統(tǒng)(cooling system)、氣體運(yùn)輸系統(tǒng)(gas delivery system)、控制系統(tǒng)(controlling system)等五個(gè)主要部分構(gòu)成。MOCVD的功效大致可分為實(shí)物裝置類和效果類兩種,實(shí)物裝置類通過技術(shù)能夠形成一定的裝置以輔助性能提升,效果類通過技術(shù)能夠使相應(yīng)部位裝置的性能得到改進(jìn),實(shí)現(xiàn)更好的效果。本文從這兩類出發(fā)分析功效詞的層次關(guān)系。

      2.2 技術(shù)詞、功效詞的確定

      技術(shù)詞、功效詞作為技術(shù)-功效圖制作的直接依據(jù),必須具備足夠的準(zhǔn)確性和代表性。

      以MOCVD技術(shù)骨架為基礎(chǔ),對(duì)各個(gè)技術(shù)和功效涉及的專業(yè)術(shù)語進(jìn)行查找與分析,得到結(jié)果如下:

      技術(shù)術(shù)語:

      ①反應(yīng)室部分:gas inlet(進(jìn)氣口)、substrate(基片)、susceptor(襯底托盤)、injector head(注射頭)、rotating disk(旋轉(zhuǎn)盤)、reaction gas(反應(yīng)氣)、precursor(前驅(qū)體)、regulator(校準(zhǔn)器)、protective layer(保護(hù)層)。

      ②加熱系統(tǒng)部分:Infrared radiation(紅外輻射)、induction heating(感應(yīng)加熱)、heat treatment(熱處理)。

      ③冷卻系統(tǒng)部分:cooler(冷卻器)。

      ④氣體運(yùn)輸系統(tǒng)部分:carrier gas(載氣)、partition board(分隔板)、run line(管道)、Purge gas(吹掃氣)、exhaust duct(排氣管)。

      ⑤控制系統(tǒng)部分:sensor(傳感器)、Valve(閥門)。

      功效術(shù)語:

      ①物質(zhì)設(shè)備:wafer(晶圓)、optics(光學(xué)器件)、circuit(電路)、laser(激光)、transistor(晶體管)、solar battery(太陽能電池)。

      ②性能:storage(存儲(chǔ))、flowability(流動(dòng)性)、flow control(流量控制)、temperature control(溫度控制)、gas separation(氣體分流)、pressure control(壓力控制)、heat resistance(抗熱性)、corrosion preventive(防腐蝕)、cleanliness(純化)。

      以上術(shù)語是MOCVD技術(shù)涉及的核心內(nèi)容,涵蓋了此項(xiàng)技術(shù)的重要材料、關(guān)鍵設(shè)備及主要功能,能充分體現(xiàn)其技術(shù)概貌,可以作為制作技術(shù)-功效圖的重要參考。然而,這些詞匯僅僅是針對(duì)技術(shù)本身的表達(dá),要得到高分析價(jià)值的技術(shù)詞和功效詞,還需要結(jié)合分析目的及技術(shù)特點(diǎn)對(duì)所得術(shù)語進(jìn)行進(jìn)一步處理:

      ①重要性篩選,排除非MOCVD技術(shù)研究的主要方向或研究價(jià)值不大的術(shù)語。如susceptor、valve等雖然都是MOCVD設(shè)備的組成部分,通過查閱《中國專利分析報(bào)告2016》,發(fā)現(xiàn)它們多數(shù)應(yīng)用于材料科學(xué)領(lǐng)域,而非MOCVD技術(shù)研究重點(diǎn),故將其移出技術(shù)詞列表。endprint

      ②下位類合并,合并過于關(guān)注細(xì)分領(lǐng)域而不便對(duì)技術(shù)進(jìn)行宏觀分析的術(shù)語。如,Infrared radiation、induction heating、heat treatment都是加熱方法,在技術(shù)領(lǐng)域均通過heater(加熱器)實(shí)現(xiàn),用heater作為技術(shù)詞更能體現(xiàn)加熱系統(tǒng)整體在MOCVD技術(shù)中的重要地位。

      ③模糊詞細(xì)化,具體化抽象寬泛或?qū)嶋H不存在的術(shù)語。如cooler是對(duì)冷卻設(shè)備的總稱,它包括的具體設(shè)備有air conditioner(空調(diào))和nozzle(噴頭)等,其中與MOCVD技術(shù)有關(guān)的是nozzle,抽象詞具體化有助于分析技術(shù)各個(gè)部分的研究現(xiàn)狀。

      經(jīng)過調(diào)整、驗(yàn)證,本文最終確定了13個(gè)技術(shù)詞和14個(gè)功效詞。

      2.3 MOCVD技術(shù)本體的構(gòu)建

      傳統(tǒng)的基于敘詞表的領(lǐng)域本體構(gòu)建過程主要分為根據(jù)敘詞表確定領(lǐng)域中核心概念集、添加概念屬性、確定概念之間關(guān)系、添加概念實(shí)例等四個(gè)步驟[16]。由于在技術(shù)-功效圖制作中,只須對(duì)技術(shù)詞(功效詞)及其下位詞進(jìn)行標(biāo)引,不需要明確概念之間的關(guān)系和對(duì)本體添加實(shí)例,因此,本文中以2.2節(jié)提出的技術(shù)-功效詞為MOCVD技術(shù)的核心概念集,通過添加概念屬性尋找各詞的下位詞,構(gòu)建基于技術(shù)-功效詞語義解釋的本體。

      數(shù)據(jù)來源:

      為了便于與第三方公司人工制作的MOCVD專利技術(shù)-功效圖進(jìn)行對(duì)比,驗(yàn)證本文提出的方法的有效性。本文采用的數(shù)據(jù)源為該公司所提供的原始專利數(shù)據(jù)共1598條,刪除摘要為空的專利,最終得到樣本數(shù)據(jù)1488條。

      2.4 專利摘要挖掘

      說明書摘要應(yīng)當(dāng)寫明發(fā)明或者實(shí)用新型專利申請(qǐng)所公開內(nèi)容的概要,即寫明發(fā)明或者實(shí)用新型的名稱和所屬技術(shù)領(lǐng)域,并清楚地反映所要解決的技術(shù)問題、解決該問題的技術(shù)方案的要點(diǎn)以及主要用途[17]。因此,對(duì)專利進(jìn)行技術(shù)-功效分析的最佳方法就是對(duì)專利摘要進(jìn)行文本挖掘,尋找摘要中隱含的重要信息。對(duì)于制作專利技術(shù)-功效圖而言,需要通過專利摘要挖掘獲取技術(shù)詞和功效詞的共現(xiàn)矩陣。

      本文采用Thomson Reuters公司開發(fā)的TDA,利用其在專利信息處理領(lǐng)域的強(qiáng)大功能及支持對(duì)大量數(shù)據(jù)進(jìn)行文本挖掘的特點(diǎn),達(dá)到獲取技術(shù)-功效共現(xiàn)矩陣的目的。

      對(duì)專利摘要進(jìn)行文本挖掘主要內(nèi)容是在TDA中建立技術(shù)-功效詞敘詞表,具體分為技術(shù)-功效詞集的建立以及技術(shù)-功效詞范式的設(shè)計(jì)兩個(gè)步驟。

      ①技術(shù)-功效詞集的建立。

      由于自然語言表達(dá)中同義詞和異形詞的存在,造成對(duì)技術(shù)詞、功效詞及其下位詞的識(shí)別困難,容易遺漏。為了減小誤差,必須將這些關(guān)鍵詞的形式和內(nèi)容規(guī)范起來,使其歸類為相應(yīng)的技術(shù)詞或功效詞,統(tǒng)一計(jì)數(shù)。因此,需要在TDA中以2.3節(jié)中構(gòu)建的本體為依據(jù)建立技術(shù)-功效詞敘詞表,為使用敘詞表清理專利摘要,從而生成技術(shù)-功效詞共現(xiàn)矩陣打下基礎(chǔ)。

      ②技術(shù)-功效詞范式的設(shè)計(jì)。

      對(duì)于各詞集來說,一般詞組數(shù)目較多。倘若將所有詞均逐個(gè)添加入敘詞表,不僅工作量大,而且還可能造成大量詞集未包含的同義詞、異形詞等的丟失。鑒于同一個(gè)技術(shù)-功效詞包含的詞形較相似,可設(shè)計(jì)一些技術(shù)-功效詞范式,對(duì)形似詞語進(jìn)行批量匹配,縮小敘詞表規(guī)模。如rotating disc、rotating disk、rotating discs和rotating disks僅有末位字母不同,在無其他無關(guān)詞語干擾的情況下,設(shè)計(jì)范式rotating dis對(duì)這些詞進(jìn)行匹配。

      為了縮小技術(shù)-功效矩陣的大小,基于技術(shù)詞敘詞表建立組technology,基于功效詞敘詞表建立組function,依次經(jīng)過模糊清理、NLP詞組清理及技術(shù)詞敘詞表和功效詞敘詞表清理后,以technology和function兩組分別作為橫縱坐標(biāo),生成技術(shù)-功效共現(xiàn)矩陣,進(jìn)一步生成MOCVD技術(shù)的專利技術(shù)-功效圖如圖1所示。

      2.5 對(duì)比驗(yàn)證,誤差分析

      為了驗(yàn)證半自動(dòng)化方法制作專利技術(shù)-功效圖的準(zhǔn)確性和可行性,本文對(duì)比分析了第三方某公司人工制作的MOCVD技術(shù)的專利技術(shù)-功效矩陣和技術(shù)-功效圖。

      為了定量地評(píng)價(jià)本研究結(jié)果的準(zhǔn)確性,此處引入矩陣相似度[18]的概念,即用本文制作的技術(shù)-功效矩陣與該公司人工制作的專利技術(shù)-功效矩陣進(jìn)行相似度計(jì)算,得到相似度r=0.8513,說明二者相似度較高。從技術(shù)運(yùn)用角度分析,基片和加熱器等被廣泛應(yīng)用于實(shí)現(xiàn)各種功效,而保護(hù)層和分隔板的應(yīng)用較少。從功效達(dá)成角度分析,研究熱點(diǎn)集中在晶圓制作、溫度控制以及流量控制等方面,對(duì)流動(dòng)性、防腐性的關(guān)注相對(duì)較少。從技術(shù)-功效結(jié)合角度分析,加熱器和基片不僅在晶圓制作領(lǐng)域發(fā)揮著重要的作用,還是防腐性的主要技術(shù)來源。這些與該公司報(bào)告中的技術(shù)-功效圖的結(jié)論一致,而該公司的MOCVD專利技術(shù)-功效圖是由各種領(lǐng)域?qū)<胰斯ら喿x花費(fèi)近3個(gè)月完成的,表明該技術(shù)-功效圖構(gòu)建方案很大程度地減輕了人力負(fù)擔(dān),能夠作為輔助決策的工具。

      3 總結(jié)與展望

      技術(shù)-功效圖是對(duì)專利技術(shù)內(nèi)容進(jìn)行深層次分析的有效方法,能夠有效輔助企業(yè)技術(shù)決策,有利于企業(yè)獲取技術(shù)競爭優(yōu)勢(shì)。本研究通過借鑒前人的研究成果,綜合利用本體構(gòu)建與文本挖掘技術(shù)實(shí)現(xiàn)了技術(shù)-功效圖的半自動(dòng)化制作,減少了對(duì)人力的需求,縮短了制作時(shí)間,降低了制作成本。本方法相對(duì)于以往的技術(shù)-功效圖制作方法具有如下優(yōu)點(diǎn):

      ①技術(shù)-功效詞的選取更全面準(zhǔn)確。

      通過技術(shù)骨架的搭建,明確了技術(shù)的總體輪廓,有利于提高技術(shù)-功效詞選取的全面性。對(duì)技術(shù)骨架各部位進(jìn)行技術(shù)-功效詞挖掘、篩選與歸納,使所選取的詞匯更具普遍性和代表性,提高了專利技術(shù)-功效分析的質(zhì)量。

      ②靈活構(gòu)建本體,加深了對(duì)專利的語義理解。

      領(lǐng)域本體的構(gòu)建,從語義的角度對(duì)技術(shù)-功效詞的內(nèi)涵進(jìn)行了解釋。通過技術(shù)-功效詞下位詞的提取,可以將每個(gè)技術(shù)-功效詞所包含的具體本質(zhì)特征、細(xì)分技術(shù)、特色工藝等表示出來,將下位詞作為對(duì)該詞的補(bǔ)充描述,提高文本挖掘的語義識(shí)別準(zhǔn)確率。endprint

      ③通過對(duì)比,驗(yàn)證了方法的可行性。

      根據(jù)歸納的基于領(lǐng)域本體的專利技術(shù)-功效圖挖掘方法,實(shí)現(xiàn)了基于MOCVD技術(shù)的技術(shù)-功效圖制作,通過對(duì)比,發(fā)現(xiàn)該方案實(shí)現(xiàn)的技術(shù)-功效圖與第三方某公司運(yùn)用人工方法制作的專利技術(shù)-功效圖相似,但本方案的制作效率更高,充分證明了該方案的可行性和有效性。

      MOCVD技術(shù)是一項(xiàng)錯(cuò)綜復(fù)雜且專業(yè)性極強(qiáng)的技術(shù),本研究實(shí)現(xiàn)了在較短時(shí)間內(nèi)實(shí)現(xiàn)了其專利技術(shù)-功效圖的制作,且準(zhǔn)確性較高,充分說明了基于領(lǐng)域本體的專利技術(shù)圖挖掘方法的可行性和有效性。鑒于MOCVD技術(shù)的代表性和本方法的通用性,可嘗試將其應(yīng)用于其他領(lǐng)域,在進(jìn)行其他研究時(shí)應(yīng)注意以下幾點(diǎn):

      1)數(shù)據(jù)源要準(zhǔn)確,檢索式要精確。對(duì)專利摘要進(jìn)行文本挖掘的第一步是獲取專利摘要,首先需要保證摘要的來源可靠且包含需要的重要信息,在檢索式的制定過程中要結(jié)合具體研究領(lǐng)域的特點(diǎn),保證數(shù)據(jù)的查準(zhǔn)率,減少需要處理的數(shù)據(jù)量,排除無關(guān)干擾,得到最準(zhǔn)確的專利數(shù)據(jù)。

      2)尋求專家建議。本文的目的是提出一種基于文本挖掘的快速制作專利技術(shù)-功效圖的方法,降低對(duì)專家的依賴,減少其工作量,而并非完全脫離專家的幫助。通常需要研究的技術(shù)都具備非常強(qiáng)的專業(yè)性,非專業(yè)人士難以短時(shí)間內(nèi)掌握全部技術(shù)信息,因此有必要在一些關(guān)鍵環(huán)節(jié),如本體構(gòu)建上,尋求專家建議,如此有助于快速抓住技術(shù)核心,縮短研究時(shí)間。但是在對(duì)專利的閱讀和分析上,采用文本挖掘技術(shù),將專家從繁重的閱讀任務(wù)中解放出來,既可以縮減研究成本,又能使專家的作用得到更高效的發(fā)揮。

      3)以技術(shù)-功效詞為核心概念集構(gòu)建領(lǐng)域本體。領(lǐng)域本體的構(gòu)成非常復(fù)雜,包含大量對(duì)技術(shù)-功效圖制作無用的信息,因此,本體的構(gòu)建要具備足夠的針對(duì)性。本方法中,以技術(shù)-功效詞為核心概念集,以技術(shù)-功效分析為導(dǎo)向進(jìn)行領(lǐng)域概念擴(kuò)充,尋找其下位詞,快速尋找技術(shù)-功效詞的語義解釋,而不必拘泥于本體實(shí)例的建立和概念間關(guān)系的確定,有效縮短了本體構(gòu)建時(shí)間,并排除了無關(guān)信息對(duì)技術(shù)-功效圖制作的干擾。

      4)技術(shù)-功效詞敘詞表的建立要全面。技術(shù)-功效圖制作的直接依據(jù)是技術(shù)-功效詞的共現(xiàn)頻數(shù),完整的技術(shù)-功效敘詞表應(yīng)盡可能多包括下位詞、同義詞、異形詞,以提高技術(shù)-功效詞的識(shí)別率,進(jìn)而提高技術(shù)-功效圖制作的準(zhǔn)確度。

      參考文獻(xiàn):

      [1]陳燕,黃迎燕,萬建國,等.專利信息采集與分析[M].北京:清華大學(xué)出版社,2006:19-24.

      [2] Yuen-Hsien Tseng, Chi-Jen Lin, Yu-I Lin. TEXT MINING FOR PATENT MAP ANALYSIS[C]. //IACIS Pacific 2005 Conference Proceedings. Taipei: Information Processing & Management,2005,43(5):1216-1247.

      [3]陳穎,張曉林.專利技術(shù)-功效矩陣構(gòu)建研究進(jìn)展[J].現(xiàn)代圖書情報(bào)技術(shù),2011(12):1-8.

      [4]陳穎,張曉林.專利技術(shù)-功效矩陣構(gòu)建詞匯模型研究[J].情報(bào)科學(xué),2012,30(11):1704-1708.

      [5]翟東升,蔡萬江,陳晨,等.基于MapReduce構(gòu)建專利技術(shù)-功效圖的研究[J].情報(bào)雜志,2013,32(6):28-46.

      [6]張博培.面向?qū)@男g(shù)語識(shí)別與技術(shù)-功效矩陣構(gòu)建技術(shù)[D].北京:北京工業(yè)大學(xué),2015.

      [7]王麗,張冬榮,張曉輝,等.利用主題自動(dòng)標(biāo)引生成技術(shù)-功效矩陣[J].現(xiàn)代圖書情報(bào)技術(shù),2013(5):80-86.

      [8]霍翠婷, 蔣勇青, 凌鋒, 等. 日本 FI/F-term 分類體系在專利技術(shù)/功效矩陣中的應(yīng)用研究[J].情報(bào)雜志,2013,32(11):140-144.

      [9]翟東升,蔡力偉,張杰,等.基于專利數(shù)據(jù)倉庫的技術(shù)-功效圖挖掘方法研究——以3D打印技術(shù)為例[J].現(xiàn)代圖書情報(bào)技術(shù),2015(7):131-138.

      [10]N Guarino,R Poli. Proceedings of the International Workshop on Formal Ontology in Conceptual Analysis and Knowledge Representation[J]. Analytic Phenomenology,1993: 907-928.

      [11]Manasevit H M. Single Crystal Galluim Aresenide on Insulating Substrates[J]. Appl phys Lett, 1968(12):156.

      [12]Manasevit H M. The Use of Metalorganils in the preparation of Semicondutor Materials [J]. J Cryst Growth, 1972, 13/14:306.

      [13]袁章其,伍波,龔杰洪.我國MOCVD技術(shù)發(fā)展戰(zhàn)略思考[C]//全國電子束、離子束、光子束學(xué)術(shù)年會(huì),2005.

      [14]李景.散詞表與本體的區(qū)別與聯(lián)系[J].中國圖書館學(xué)報(bào),2004,30(1):36-39.

      [15]段瑞龍,宋文.國內(nèi)外敘詞表轉(zhuǎn)換本體方法研究綜述[J].情報(bào)雜志,2012,31(7):66-71.

      [16]孫倩.基于敘詞表的領(lǐng)域本體建模方法研究[D].濟(jì)南:山東大學(xué),2007.

      [17]中華人民共和國國務(wù)院.中華人民共和國專利法實(shí)施細(xì)則[Z].2010-01-09.

      [18]翟東海,李同亮,段維夏,等.基于矩陣相似度的最佳樣本塊匹配算法及其在圖像修復(fù)中的應(yīng)用[J].計(jì)算機(jī)科學(xué),2014,41(1):307-310.endprint

      猜你喜歡
      技術(shù)
      探究電力信息和電力通信技術(shù)的融合
      紅松嫁接方法和技術(shù)要點(diǎn)探析
      淺析無機(jī)房電梯相關(guān)技術(shù)要點(diǎn)
      遼西干旱山區(qū)山杏育苗及造林技術(shù)分析
      大采高綜采工作面初采期間瓦斯綜合治理技術(shù)
      電力配電柜的應(yīng)用技術(shù)
      有關(guān)計(jì)算機(jī)網(wǎng)絡(luò)安全問題的分析與探討
      淺析建筑物鋼筋砼與砌體結(jié)構(gòu)抗震加固的技術(shù)方法
      淺談鋼筋混凝土結(jié)構(gòu)建筑應(yīng)用外包粘鋼加固技術(shù)
      探討電力系統(tǒng)中配網(wǎng)自動(dòng)化技術(shù)
      科技視界(2016年21期)2016-10-17 20:00:58
      泊头市| 新龙县| 赞皇县| 都江堰市| 龙江县| 海盐县| 垫江县| 基隆市| 时尚| 景宁| 正定县| 繁峙县| 泉州市| 宜章县| 九寨沟县| 沾化县| 汉中市| 疏勒县| 出国| 竹山县| 全州县| 永靖县| 甘谷县| 禄丰县| 尖扎县| 西吉县| 沙田区| 泾川县| 泸水县| 阜阳市| 观塘区| 安丘市| 依兰县| 富蕴县| 宁乡县| 吉安县| 景宁| 西乌珠穆沁旗| 离岛区| 乐亭县| 衡阳市|